Zavřít
  • Základní kurzy

Klasifikační a regresní stromy

Rozhodovací stromy jsou jednou z nejpoužívanějších technik Data Miningu. Kurz Klasifikační a regresní stromy je určen těm, kteří se zajímají o klasifikaci dat (například Credit Scoring, kdy se na základě příznaků snažíme rozhodnout o zařazení vzorů do skupin) nebo se věnují regresním úlohám včetně predikcí časového vývoje. Kurz seznámí účastníky nejen s klasickými metodami, ale i s pokročilejšími stromovými strukturami jako jsou Boosting Trees nebo Random Forests. Součástí kurzu je také interaktivní tvorba vlastních stromů a jejich modifikace.

Cílová skupina

  • Statistici, datoví specialisté či analytici, kteří potřebují řešit úlohu predikce kategorií či predikci nějaké spojité veličiny na základě dalších atributů.
  • Klasifikační stromy jsou typickou metodou používanou v bankovnictví a pojišťovnictví.
  • Nejtypičtější je využití v oblasti Credit Scoring.

Cíle kurzu

  • Porozumět metodologii stromovitých algoritmů.
  • Dokázat vytvořit a interpretovat model pro predikci.
  • Dokázat si vyhodnotit, který model vybrat jako finální pro nasazení do procesu predikce.
  • Naučit se analyzovat data těmito metodami v softwaru TIBCO Statistica.
  • Seznámit se s prostředím Statistica Data Miner.

Osnova

Úvod

  • Základní informace o softwaru TIBCO Statistica
  • Výukové zdroje pro software a možnosti nápovědy

Příprava dat STATISTICA

  • Načtení, transformace, vzorkování, filtrace odlehlých hodnot, oprava chybějících údajů, atd.

Výběr důležitých prediktorů pro požadovanou úlohu

Sdružování rozsáhlých skupin hodnot příznaků (Binning)

Klasifikační a regresní stromy

  • Vytváření, princip, možnosti, využití

Metody

  • Klasifikační a regresní stromy CART
  • CHAID
  • Generované stromy (Boosted Trees)
  • Náhodné lesy (Random Forests)
  • Vytváření klasifikačních a regresních stromů v interaktivním režimu (generování stromu, prořezávání stromu, výběr rozhodovacích proměnných, výběr mezí)

Vyhodnocení kvality vytvořeného modelu

  • Korelační analýza
  • ROC křivka
  • Grafy zisku a navýšení (Gains a Lift Chart)

Nasazení modelu v praxi

Hierarchické shlukování a jeho souvislost s klasifikačními a regresními stromy

Základy práce v prostředí modulu Statistica Data Miner

  • Práce s Recepty (wizardem)
  • Práce v rámci pracovní plochy (Workspaces)
  • Využití přednastavených úloh
  • Implementace vlastních uzlů

Předpoklady účastníka

  • Běžná obsluha počítače v prostředí Windows

Navazující kurzy

Je možné a vhodné rozšířit znalost prostředí Workspace (které je v tomto kurzu probráno jen částečně) prostřednictvím kurzu:

Pokud se chcete vzdělat také v dalších metodách, které mohou být alternativním řešením pro klasifikační a regresní stromy, pak doporučujeme kurzy:

Certifikace

  • Účastník získá certifikát o absolvování kurzu

Délka kurzu

  • 1 dny (1x 6h)

Pozn: Jednotlivé příklady v průběhu kurzu jsou procvičovány v anglické verzi softwaru Statistica.

1 denní
Lazarská 11/6, Praha 2
7900,- Kč bez DPH

Přihláška do kurzu

po odeslání přihlášky vás budeme do 24 hodin kontaktovat

Licence a obchod - (+420) ‭739 569 987‬
Školení - (+420) 773 217 132

Volejte Po - Pá: 9.00 - 16.00 hod

info@statistica.pro
Odpovíme do 1 pracovního dne

Sídlo společnosti:
DataFriends s.r.o.
Tylova 473/27
Plzeň 3
IČ: 05689651
DIČ: CZ05689651

Kanceláře:
DataFriends s.r.o.
Lazarská 11/6
120 00 Praha 2

Kurzy a semináře se konají na adrese:
DataFriends s.r.o.
Lazarská 11/6
120 00 Praha 2




Zapsána u Krajského soudu v Plzni, oddíl C, složka 33739

Napište nám

Statistica.pro je projektem DataFriends s.r.o.

S používání webových stránek statistica.pro, souhlasíte s využíváním cookies ve vašem prohlížeči.

Pokračovat

Newsletter