Tato práce představuje návrh procesu pro analýzu časových řad získaných z datového archivu vodárenské společnosti. Za použití pokročilých statistických technik a metod neuronových sítí je navržen systém pro předpovídání budoucích hodnot zvolených měřených veličin, který je následně testován na reálných datech z vodovodní distribuční sítě. Zároveň práce představuje návrh metody pro detekci anomálií v časových řadách na základě jejich predikovaných hodnot.
Anotace v angličtině
This thesis presents a process for analysing time series obtained from the data archive of a waterworks company. Using advanced statistical techniques and neural network methods, a system is designed to predict future values of selected measured variables, which is then tested on real data from the water distribution network. Additionally, the document introduces a method for detecting anomalies in time series based on their predicted values.
Klíčová slova
analýza, predikce, časové řady, strojové učení, neuronové sítě
Klíčová slova v angličtině
analysis, prediction, time series, machine learning, neural networks
Rozsah průvodní práce
93 s. (110 151 znaků)
Jazyk
CZ
Anotace
Tato práce představuje návrh procesu pro analýzu časových řad získaných z datového archivu vodárenské společnosti. Za použití pokročilých statistických technik a metod neuronových sítí je navržen systém pro předpovídání budoucích hodnot zvolených měřených veličin, který je následně testován na reálných datech z vodovodní distribuční sítě. Zároveň práce představuje návrh metody pro detekci anomálií v časových řadách na základě jejich predikovaných hodnot.
Anotace v angličtině
This thesis presents a process for analysing time series obtained from the data archive of a waterworks company. Using advanced statistical techniques and neural network methods, a system is designed to predict future values of selected measured variables, which is then tested on real data from the water distribution network. Additionally, the document introduces a method for detecting anomalies in time series based on their predicted values.
Klíčová slova
analýza, predikce, časové řady, strojové učení, neuronové sítě
Klíčová slova v angličtině
analysis, prediction, time series, machine learning, neural networks
Zásady pro vypracování
Cílem diplomové práce je analyzovat možnosti a navrhnout způsob použití prediktivních modelů pro zpracování časových řad z datového archivu společnosti Vodárny a kanalizace Karlovy Vary, a.s., která je správcem vodovodní a kanalizační sítě nejen v Karlovarském kraji. Vybrané modely budou implementovány v aplikaci, která bude uživateli umožňovat provádět datovou analýzu a predikci nad libovolnou časovou řadou z archivu a následně bude automaticky provádět porovnání předpovědí proti reálným pozorováním pro potřeby detekce poruch potrubí či strojního vybavení vodovodní a kanalizační sítě. Vyhodnocována budou data, jako jsou průtoky pitné vody, objemy jejich zásob či výkonové ukazatele čerpacích soustav, z nichž mnohá jsou sbíraná od roku 2009, typicky v hodinových intervalech.
Osnova:
Úvod, předmět a cíl závěrečné práce
Přehled současného stavu problematiky
Teoretická část
popis a charakteristika technologických dat sbíraných ve vodárenství
popis a charakteristika použitých metod (vybrané statistické metody a modely strojového učení)
přehled použitých nástrojů
Praktická část
analýza a návrh architektury aplikace
implementace aplikace
testování aplikace nad daty poskytnutými organizací
případová studie (porovnání různých modelů pro vybraný problém)
Zhodnocení výsledků
Závěr
Zásady pro vypracování
Cílem diplomové práce je analyzovat možnosti a navrhnout způsob použití prediktivních modelů pro zpracování časových řad z datového archivu společnosti Vodárny a kanalizace Karlovy Vary, a.s., která je správcem vodovodní a kanalizační sítě nejen v Karlovarském kraji. Vybrané modely budou implementovány v aplikaci, která bude uživateli umožňovat provádět datovou analýzu a predikci nad libovolnou časovou řadou z archivu a následně bude automaticky provádět porovnání předpovědí proti reálným pozorováním pro potřeby detekce poruch potrubí či strojního vybavení vodovodní a kanalizační sítě. Vyhodnocována budou data, jako jsou průtoky pitné vody, objemy jejich zásob či výkonové ukazatele čerpacích soustav, z nichž mnohá jsou sbíraná od roku 2009, typicky v hodinových intervalech.
Osnova:
Úvod, předmět a cíl závěrečné práce
Přehled současného stavu problematiky
Teoretická část
popis a charakteristika technologických dat sbíraných ve vodárenství
popis a charakteristika použitých metod (vybrané statistické metody a modely strojového učení)
přehled použitých nástrojů
Praktická část
analýza a návrh architektury aplikace
implementace aplikace
testování aplikace nad daty poskytnutými organizací
případová studie (porovnání různých modelů pro vybraný problém)
Zhodnocení výsledků
Závěr
Seznam doporučené literatury
CHOLLET, François. Deep learning v jazyku Python: knihovny Keras, TensorFlow. Praha: Grada Publishing, 2019. ISBN 978-80-247-3100-1.
GOODFELLOW, Ian, Yoshua BENGIO a Aaron COURVILLE. Deep Learning [online]. Cambridge, MA: MIT Press, 2016 [cit. 2022-10-30]. Dostupné z: https://www.deeplearningbook.org
Keras API reference. Keras [online]. Google, 2022 [cit. 2022-10-30]. Dostupné z: https://keras.io/api/
NAU, Robert. Statistical forecasting: notes on regression and time series analysis [online]. Durham: Duke University, 2020 [cit. 2022-10-30]. Dostupné z: https://people.duke.edu/ rnau/411home.htm
PERKTOLD, Josef, Skipper SEABOLD a Jonathan TAYLOR. Statsmodels 0.13.4: API Reference [online]. c2009-2019, Nov 01, 2022 [cit. 2022-11-02]. Dostupné z: https://www.statsmodels.org/stable/api.html
CHOLLET, François. Deep learning v jazyku Python: knihovny Keras, TensorFlow. Praha: Grada Publishing, 2019. ISBN 978-80-247-3100-1.
GOODFELLOW, Ian, Yoshua BENGIO a Aaron COURVILLE. Deep Learning [online]. Cambridge, MA: MIT Press, 2016 [cit. 2022-10-30]. Dostupné z: https://www.deeplearningbook.org
Keras API reference. Keras [online]. Google, 2022 [cit. 2022-10-30]. Dostupné z: https://keras.io/api/
NAU, Robert. Statistical forecasting: notes on regression and time series analysis [online]. Durham: Duke University, 2020 [cit. 2022-10-30]. Dostupné z: https://people.duke.edu/ rnau/411home.htm
PERKTOLD, Josef, Skipper SEABOLD a Jonathan TAYLOR. Statsmodels 0.13.4: API Reference [online]. c2009-2019, Nov 01, 2022 [cit. 2022-11-02]. Dostupné z: https://www.statsmodels.org/stable/api.html