Vyučující
|
-
Babichev Sergii, prof. DSc.
|
Obsah předmětu
|
1. analýza dat na základě jejich vizualizace v R (balíčky graphics a ggplot2) 2. analýza dat na základě jejich vizualizace v Pythonu (moduly matplotlib a plotly) 3. zpracování chybějících hodnot v R na základě různých typů regrese, výběr optimálního modelu 4. metody předzpracování dat v R a Pythonu (normalizace, standardizace), kritéria hodnocení kvality zpracování dat, porovnání modelů a výběr optimální metody 5. hybridní model filtrace signálu na základě společného použití waveletové analýzy a Huangovy metody modální dekompozice 6. praktická implementace hybridních modelů filtrace signálu v R a Pythonu 7. metody optimalizace modelu shlukování na základě společného využití vnitřních a vnějších kritérií hodnocení kvality shlukování 8. optimalizace parametrů algoritmů shlukování s použitím Harringtonovy metody a fuzzy logiky v R a Pythonu 9. optimalizace modelu třídění dat s použitím různých kritérií třídění dat 10. hybridní modely snížení dimenze dat na základě společného použití modelů shlukování a třídění 11. praktická implementace hybridních modelů snížení dimenze dat v R a Pythonu pro zpracování velkých dat (genová exprese) 12. vývoj modelu prognózování stavu pacienta na základě genové exprese za použití metod data miningu a strojového učení
|
Studijní aktivity a metody výuky
|
nespecifikováno
|
Výstupy z učení
|
Cílem kurzu je získání znalostí a dovedností v oblasti zpracování informací. V průběhu kurzu se studenti seznámí s praktickou realizací různých metod analýzy a předzpracování dat (vizualizace, zpracování chybějících hodnot na základě různých typů regresních modelů, normalizace a filtrace) a s hybridními modely vytvořenými pomocí metod data miningu a strojového učení, které jsou určeny pro zpracování různých typů dat. V rámci kurzu budou využívány funkce a moduly softwarů R a Python.
|
Předpoklady
|
nespecifikováno
|
Hodnoticí metody a kritéria
|
nespecifikováno
splnění zadaných úkolů
|
Doporučená literatura
|
|