BI-VZD – Vytěžování znalostí z dat

Cíl předmětu

Studenti se seznámí se základními postupy při vytěžování znalostí z dat. Konkrétně se naučí základní techniky předzpracování dat, vizualizace vícerozměrných dat, statistické techniky transformace dat, základní principy metod pro vytěžování znalostí. Studenti získají povědomí o vztahu mezi zaujetím a variancí modelů a o vyhodnocení kvality modelů. V předmětu se extenzivně využívá vytěžovací software. Studenti budou schopni kvalifikovaně použít základní nástroje data miningu na nejčastěji se vyskytujících problémech (klasifikace, regrese, shlukování).

Program přednášek

  1. Úvod do data miningu, příprava dat, vizualizace dat.
  2. Statistická analýza dat.
  3. Model dat, metoda nejbližšího souseda
  4. Učení, validace, testování, hodnocení kvality modelu
  5. Umělé neuronové sítě v data miningu.
  6. Neuronové sítě bez učitele - kompetiční učení
  7. Pravděpodobnost a Bayesovská klasifikace
  8. Rozhodovací stromy a pravidla.
  9. Neuronové sítě s učitelem.
  10. Shluková analýza.
  11. Kombinování neuronových sítí a modelů obecně.
  12. Data mining v prostředí Clementine.
  13. Text mining, Web mining, vybrané aplikace a nové trendy.

Program cvičení

  1. Data, vizualizace, statistiky.
  2. Statistická analýza dat.
  3. Předzpracování dat, redukce dimenzionality, významnost vstupů.
  4. Model, trénování, testování, validace modelu.
  5. Proces vytěžování dat, klasifikace, predikce, modelování.
  6. Shluková analýza a SOM.
  7. Zadání semestrální úlohy.
  8. [3] Konzultace a práce na úloze.
  9. [3] Prezentace výsledků, workshop
  10. Zápočet



Poslední změna: 23.4.2009, 1:42