Předmět: Datová úložiště a nástroje pro Big Data

« Zpět
Název předmětu Datová úložiště a nástroje pro Big Data
Kód předmětu KI/BIG
Organizační forma výuky Přednáška + Cvičení
Úroveň předmětu Magisterský
Rok studia 2
Semestr Zimní
Počet ECTS kreditů 5
Vyučovací jazyk Čeština
Statut předmětu Povinný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Fišer Jiří, Mgr. Ph.D.
  • Kubera Petr, RNDr. Ph.D.
  • Valenta Václav, Ing.
  • Beránek Pavel, Ing. Mgr.
  • Sýkorová Květuše, Mgr.
Obsah předmětu
1. Principy virtualizace a přehled nástrojů 2. Tvorba unifikovaných prostředí (izolace aplikací): Docker, CoreOS, rkt 3. Architektura clusteru: přehled Hadoop 4. Ukládání dat (storage) HDFS, HiveQL 5. MapReduce framework (principy) 6. Spark a jeho architektura 7. Moduly Spark: MLlib (strojové učení), GraphX, Spark Streaming (streamování dat) 8. - 9. NoSQL databáze a BigData (MongoDB, Neo4j, Caché)

Studijní aktivity a metody výuky
nespecifikováno
Výstupy z učení
Předmět je zaměřen na problematiku zpracování velkého a rychle rostoucího objemu dat prostřednictvím technologie Hadoop respektive některých typů tzv. NoSQL databází. Přednášky jsou zaměřeny na základní principy distribuovaných úložišť a distribuované zpracování dat, cvičení pak na implementaci ukázkových příkladů. Úvodní přednášky se věnují instalaci jednotlivých softwarových komponent a jejich spolupráci s využitím virtualizovaných kontejnerů.

Předpoklady
nespecifikováno

Hodnoticí metody a kritéria
nespecifikováno
Zápočet: vypracování programu zpracovávající data v distribuovaném systému Zkouška: ústní (diskuse nad seminárním programem a ověření obecných faktických znalostí)
Doporučená literatura


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr