Vyučující
|
-
Fišer Jiří, Mgr. Ph.D.
-
Kubera Petr, RNDr. Ph.D.
-
Valenta Václav, Ing.
-
Beránek Pavel, Ing. Mgr.
-
Sýkorová Květuše, Mgr.
|
Obsah předmětu
|
1. Principy virtualizace a přehled nástrojů 2. Tvorba unifikovaných prostředí (izolace aplikací): Docker, CoreOS, rkt 3. Architektura clusteru: přehled Hadoop 4. Ukládání dat (storage) HDFS, HiveQL 5. MapReduce framework (principy) 6. Spark a jeho architektura 7. Moduly Spark: MLlib (strojové učení), GraphX, Spark Streaming (streamování dat) 8. - 9. NoSQL databáze a BigData (MongoDB, Neo4j, Caché)
|
Studijní aktivity a metody výuky
|
nespecifikováno
|
Výstupy z učení
|
Předmět je zaměřen na problematiku zpracování velkého a rychle rostoucího objemu dat prostřednictvím technologie Hadoop respektive některých typů tzv. NoSQL databází. Přednášky jsou zaměřeny na základní principy distribuovaných úložišť a distribuované zpracování dat, cvičení pak na implementaci ukázkových příkladů. Úvodní přednášky se věnují instalaci jednotlivých softwarových komponent a jejich spolupráci s využitím virtualizovaných kontejnerů.
|
Předpoklady
|
nespecifikováno
|
Hodnoticí metody a kritéria
|
nespecifikováno
Zápočet: vypracování programu zpracovávající data v distribuovaném systému Zkouška: ústní (diskuse nad seminárním programem a ověření obecných faktických znalostí)
|
Doporučená literatura
|
|