Zavřít
  • Pokročilé kurzy

Data Mining (dvoudenní varianta)

2
Zelený Pruh 95/97, Praha 4
13900,- Kč bez DPH

Kurz Data Mining (dvoudenní varianta) je určen osobám, které chtějí odhalit informace a znalosti ukryté v datech. Cílem tohoto kurzu není ukázat jen vhodné postupy, ale také způsob, jak co nejlépe prezentovat výsledky. V průběhu kurzu budou prezentovány nejrůznější techniky: korelační analýza, regresní analýza, časové řady, klasifikační stromy, neuronové sítě a další. Na závěr budou ukázány konkrétní příklady z oblasti vytěžování dat. V průběhu celého kurzu budou účastníci pracovat s modulem Statistica Data Miner.

Cílová skupina

  • Analytik, statistik či datový specialista, který potřebuje zpracovávat rychle velké objemy dat.
  • Zájemce o problematiku Data Miningu (dolování informací z dat).
  • Typickými posluchači mohou být analytici z oblasti bankovnictví, pojišťovnictví a také pokročilí analytici z oblasti průmyslu.
  • Pracovníci, kteří se chtějí seznámit s modulem Data Miner v softwaru TIBCO Statistica.

Cíle kurzu

  • Seznámit se teoreticky i prakticky s množstvím metod spadajících do oblasti Data Miningu.
  • Mimo jiné se účastníci naučí sestavovat a interpretovat predikční modely. Vyhodnotit jejich kvalitu či vybrat, který z výsledných modelů je pro danou situaci nejvhodnější.
  • Naučit se pracovat v několika unikátních prostředích TIBCO Statistica určených přímo pro Data Mining.
  • Naučit se používat modul Data Miner.

Osnova

Úvod

  • Základní informace o softwaru Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Úvod do vytěžování dat, produkt

  • Princip, možnosti, využití

Práce s Recepty (wizardem)

  • Příprava dat (načtení, výběr proměnných, transformace, vzorkování dat, odstranění duplicitních vzorů, filtrace odlehlých hodnot, oprava chybějících údajů)
  • Detekce a případné odstranění podobných vstupních příznaků (prediktorů)
  • Výběr důležitých prediktorů pro požadovanou úlohu
  • Vytváření klasifikačních a regresních modelů
  • Vyhodnocení kvality vytvořeného modelů
  • Nasazení modelu v praxi

Klasifikační a regresní stromy

  • Princip, možnosti, využití
  • CART stromy
  • CHAID stromy
  • Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí)
  • Generované stromy (Boosted Trees)
  • Náhodné lesy (Random Forests)

Lineární modely

  • Princip regrese
  • (Obecné) lineární modely
  • Zobecněné lineární modely
  • Zobecněné aditivní modely
  • MARSplines

Metody shlukování

  • K-průměrů (k-means)
  • Hierarchické a EM shlukování

Automatizované neuronové sítě

  • Princip umělých neuronových sítí, základní typy (MLP, RBF, Kohonenova síť)
  • Automatizovaný a vlastní návrh sítě

Metody strojového učení

  • Bayesův klasifikátor
  • SVM
  • k-NN klasifikátor

Analýza nezávislých komponent (ICA)

Text Mining

  • Účel, princip a zdroje Text Miningu
  • Vytvoření a práce s indexovým souborem
  • Asociační pravidla a sekvence

Nasazení modelů na reálná data z praxe

Kvalita získaných modelů

  • Korelační analýza
  • ROC křivka
  • Grafy zisku a navýšení (Gains/Lift Cart)

Metody výběru vhodných příznaků

Sdružování rozsáhlých skupin hodnot příznaků (Binning)

Základy práce v pracovní ploše (Workspaces)

  • Práce s uzly
  • Využití přednastavených úloh (zejména pro klasifikaci a regresi)
  • Pro detailnější seznámení s tímto prostředím doporučujeme absolvovat třídenní verzi kurzu Data Mining, který je sloučením tohoto dvoudenního kurzu a kurzu Data Mining v praxi v prostředí Workspace

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows

Předchozí kurzy

Doporučujeme absolvovat kurz:

Navazující kurzy

Doporučujeme absolvovat kurzy:

Certifikace

  • Účastník získá certifikát o absolvování kurzu

Délka kurzu

  • 2 dny (2x 6h)

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

Přihláška do kurzu

po odeslání přihlášky vás budeme do 24 hodin kontaktovat

Licence a obchod - (+420) ‭739 569 987‬
Školení - (+420) 773 217 132

Volejte Po - Pá: 9.00 - 16.00 hod

info@statistica.pro
Odpovíme do 1 pracovního dne

Sídlo společnosti:
ArcIT Consulting, s.r.o.
Tylova 473/27
Plzeň 3
IČ: 05689651
DIČ: CZ05689651

Kanceláře:
ArcIT Consulting s.r.o.
Zelený Pruh 95/97
140 00 Praha 4

Kurzy a semináře se konají na adrese:
Kuta a.s.
Zelený Pruh 95/97
140 00 Praha 4




Zapsána u Krajského soudu v Plzni, oddíl C, složka 33739

Napište nám

Statistica.pro je projektem ArcIT Consulting s.r.o.

S používání webových stránek statistica.pro, souhlasíte s využíváním cookies ve vašem prohlížeči.

Pokračovat

Newsletter