Předmět: Data mining - základy

» Seznam fakult » PRF » KI
Název předmětu Data mining - základy
Kód předmětu KI/0183
Organizační forma výuky Seminář
Úroveň předmětu Bakalářský
Rok studia nespecifikován
Semestr Zimní
Počet ECTS kreditů 2
Vyučovací jazyk Čeština
Statut předmětu Povinně-volitelný
Způsob výuky Kontaktní
Studijní praxe Nejedná se o pracovní stáž
Doporučené volitelné součásti programu Není
Vyučující
  • Babichev Sergii, prof. DSc.
Obsah předmětu
1) Etapy předzpracování a prezentace dat. Struktura a typy dat. Uvedení a import dat do softwaru R. Použití 2D diagram pro vizualizace dat. 2) Metody vizualizace dat. Základní diagramy, histogramy a spinogramy. Metody formátování a prezentace grafů. 3) Grafická vizualizace dat s využitím balíků lattice a ggplot2 softwarového prostředí R. 4) Regresní analýza. Jednoduchá, mnohonásobná, lineární a nelineární regresní modely. Implementace regresní analýzy v softwaru R. 5) Metody předzpracování dat. Filtrace, standardizace a normalizace dat. Nahrazení chybějících hodnot na základě regresní analýzy. Praktická implementace metod v softwaru R. 5) Komponentní a faktorova analýzy a jejích implementace v softwaru R. 6) Shluková analýza, typy shlukování. Používání balíků cluster, dbscan a clValid v softwaru R. 7) Základní principy induktivní technologie objektivního shlukování. Kritérií hodnocení kvality shlukování. Rozpočet kritérií v softwaru R. 8) Modely objektivní shlukové analýzy na základě algoritmů aglomerativního hierarchického shlukování, SOTA a DBSCAN. 9) Algoritmy třídění dat a jejích implementace v softwarů R a VEKA. 10) Metody a modely prognózování dat. Fuzzy logika a neuronové sítí. Implementace fuzzy modelů prognózování v softwarů R a MATLAB.

Studijní aktivity a metody výuky
Přednášení
Výstupy z učení
Cílem kurzu je získání znalostí a praktických zkušeností v oblasti zpracování informací včetně získání užitečných dovedností prostřednictvím volně šiřitelného softwaru R a KNIME. V průběhu kurzu budou studenti seznámeni s praktickou realizací metod předzpracování dat (filtrace, snížení dimenze prostorů, apod.), metod shlukování a klasifikace zkoumaných objektů, fuzzy logikou a bayesovskými sítěmi.

Předpoklady
nespecifikováno

Hodnoticí metody a kritéria
Analýza výkonů studenta

Kurs je určen pro studenty 2 a 3 ročníků studia.
Doporučená literatura


Studijní plány, ve kterých se předmět nachází
Fakulta Studijní plán (Verze) Kategorie studijního oboru/specializace Doporučený ročník Doporučený semestr
Fakulta: Přírodovědecká fakulta Studijní plán (Verze): Informatika (dvouoborové) (A14) Kategorie: Informatické obory - Doporučený ročník:-, Doporučený semestr: -
Fakulta: Přírodovědecká fakulta Studijní plán (Verze): Informatika (dvouoborové) (A14) Kategorie: Informatické obory - Doporučený ročník:-, Doporučený semestr: -