Předmět: Data mining v R a KNIME

« Zpět
Název předmětu Data mining v R a KNIME
Kód předmětu KI/0197
Organizační forma výuky Seminář
Úroveň předmětu Bakalářský
Rok studia nespecifikován
Semestr Zimní a letní
Počet ECTS kreditů 2
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Babichev Sergii, prof. DSc.
Obsah předmětu
1. Úvod do data miningu, představení dat v softwarech R a Python (balíčky "pandas" a "numpy"). Načtení dat ze souboru "txt" a uložení výsledků zpracování v odpovídajících souborech různých softwarů. 2. Metody vizualizace a normalizace dat a jejích použití v odpovídajících softwarech. 3. Metody regresní analýzy. Lineární a nelineární regresní modely. Jednoduchá a vícenásobná regrese. Hodnocení kvality regresního modelu. 4. Logistická regrese. Využití regresní analýzy pro zpracování chybějících hodnot. 5. Základy shlukové analýzy. Hierarchické metody shlukové analýzy. Vytvoření dendrogramu a formování shluků. Vytvoření modelů hierarchického shlukování v softwaru KNIME s využitím funkcí a pluginů softwarů R, Python a WEKA. 6. Iterační a hustotní algoritmy shlukové analýzy k-means, C-means a DBSCAN. Jejich použití v různých softwarech s vytvořením modelu v softwaru KNIME. 7. Základy klasifikace dat. Porovnání klasifikace a shlukové analýzy. Klasifikace dat na základě Bayesovské metody a rozhodovacích stromů (decision tree). Implementace metod a algoritmů klasifikace dat v různých softwarech s vytvořením modelu v KNIME. 8. Metody fuzzy logiky a jejich použití pro klasifikaci a prognózování dat. Vytvoření fuzzy modelů v různých softwarech. 9. Základní pojmy neuronových sítí a jejich implementace v modelech klasifikace a prognózování dat. 10. Praktické použití metod data miningu pro analýzu a zpracování různorodých dat. Příprava výsledků zpracování dat.

Studijní aktivity a metody výuky
nespecifikováno
Výstupy z učení
Cílem kurzu je získání znalostí a praktických zkušeností v oblasti zpracování informací včetně získání užitečných dovedností prostřednictvím komplexního využití softwarů R, Python, WEKA a KNIME. V průběhu kurzu budou studenti seznámeni s praktickou realizací metod předzpracování dat (filtrace, zpracování chybějících hodnot, normalizace apod.), metod regresní analýzy, metod a algoritmů shlukování a klasifikace zkoumaných objektů a fuzzy logikou. Modelování bude implementováno v softwaru KNIME s využitím funkcí a pluginů, vytvořených v softwarech R, Python a WEKA.

Předpoklady
nespecifikováno

Hodnoticí metody a kritéria
nespecifikováno
Praktický test (řešení zadané úlohy na počítači)
Doporučená literatura


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Přírodovědecká fakulta Studijní plán (Verze): Informační systémy (A14) Kategorie: Informatické obory - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Přírodovědecká fakulta Studijní plán (Verze): Informační systémy (A14) Kategorie: Informatické obory - Doporučený ročník:-, Doporučený semestr: -