Zavřít
Pro organizace, které potřebují všechno.

Comprehensive

  • O Statistice
  • Comprehensive
  • Funkce
  • Ke stažení

TIBCO Statistica je analytický software obsahující prostředky pro správu dat, jejich analýzu, vizualizaci a vývoj uživatelských aplikací. Poskytne vám široký výběr základních i pokročilých technik speciálně vyvinutých pro oblasti Business Intelligence, Big Data, kontrolu kvality, výzkum a mnoha dalších. Analytická platforma Statistica umožnuje organizacím řídit celý analytický životní cyklus – od seskupení a přípravy dat, vizualizaci až po vytvoření modelu a jeho nasazení do produkce / provozu.

Produkty (balíčky) TIBCO Statistica

Produkty jsou balíčky funkcionalit a rozšíření základního nástroje. Většinu analytických metod najdete v balíčku Professional. Specifické rozšíření jsou potom spojena s balíčky určenými na konkrétní aplikaci. Čtěte dále pod záložkou produkty.

Každý balíček může být dodán v různých licenčních formách. Více na téma licence.

Pro univerzity jsou k dispozici speciální typy licencí v rámci programu Statistica pro školy.

Funkce Desktop Analyst Modeler Data Scientist Comprehensive
Základní statistiky a vizualizace
Pokročilá statistika
Průmyslová statistika
Reportovací tabulky
Vizualizační panely * * * * *
Vícerozměrné statistiky
Porovnávací metody * * * * *
Analýza přežití * * * * *
ETL
Modul tvorby pravidel
PI konektor
Variace
Testování hypotéz
Data Mining
Vývojové nástroje
Optimalizace procesů
Text Mining
In-Database Analytics ** **
Stability and shelf-life analytics
Product traceability analytics  


* Tyto moduly můžou být dodatečně licencovány „al carte“

** In-Database Analytics jsou doplňkem Statistica Serveru.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Comprehensive je Enterprise verzí programu Statistica. Nabízí celé spektrum statistických metod, ze všech předchozích verzí. A navíc je vybavena serverem, který umožňuje analytické operace vykonávat automatizovaně. Dále obsahuje nástroje pro sledování životního cyklu produktu nebo analytiky stability a vytrvalosti.

Pro univerzity jsou k dispozici speciální typy licencí v rámci programu Statistica pro školy.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Funkce Základní statistiky a vizualizace

Data, data, data - žádná společnost bez nich nemůže fungovat. Pro jejich využití v rozhodovacích procesech je zapotřebí vhodných nástrojů pro analýzu. To platí nejen pro projekty s "big daty", ale také pro jakékoli další data z databázových či transakčních systémů nebo dokonce z MS Excelu nebo z papíru. Pro splnění těchto požadavků nabízí Statistica komplexní softwarový balík základních statistických operací a vhodných grafických výstupů. To vše doplněno intuitivním ovládáním, všestranností a příjemným pracovním prostředím podobným právě nástroji MS Excel.

Nativní schopnosti nástroje STATISTICA

  • Velmi přesné výpočty
  • Různé zobrazovací formáty pro data podle interpretace obsahu
  • Automatické značení významných výsledků
  • Zpracování výstupů formou závěrečné zprávy
    • Jednoduché formátování výstupu
    • Možnost vložit grafy a tabulky do sestav
    • Podpora formátů HTML, Word, RTF a PDF
  • Nástroje pro přípravu dat
    • Detekce chybějících dat a dat mimo stanovený rozsah
    • Detekce odlehlých a extrémních hodnot
    • Překodování a tvorba nových proměnných
    • Úprava řádků a sloupců tabulky
    • Zpracování chybějících dat / duplicitních případů
    • Funkce (matematické, statistické, operátory a mnoho dalších) pro tvorbu nových proměnných a získání dalších informací z proměnných stávajících
    • Přeskupování a seskupování proměnných
    • Standandardizace a normalizace proměnných
    • Slučování tabulek
    • Filtrování
    • Transpozice, třídění dat
    • Kombinace různých zdrojových datových tabulek, práce s různými typy proměnných
    • Výběr dílčích oblastí, výběr případů
    • Generování náhodných čísel
    • Výkonná a rychlá transformace dat (načtení, modifikace, uložení)
  • Snadné použití výsledků tabulek jako vstup pro další analýzu
  • Analýzy a hodnocení platné pro celé tabulky nebo označené bloky

Popisná statistika, strukturovaná statistika, průzkumná analýza dat

  • Popisné statistiky
    • Střední, modální hodnota
    • Kvartil, uživatelsky definované percentily
    • Průměrná, směrodatná odchylka, rozptyl
    • Šikmost a špičatost (s příslušnými standardními odchylkami)
    • Intervaly spolehlivosti pro střední hodnotu
    • Intervaly spolehlivosti pro průměr
    • Harmonický průměr, geometrický průměr
    • Speciální popisné statistiky a diagnostické charakteristiky
    • Minimum, Maximum, Součty
    • Rozpětí, vzdálenost kvartilů
  • Čištění dat
    • Oříznutí dat (Trimmed agent)
    • Zprostředkování dat (Winsorized agent)
    • Grubbsův test pro odlehlé hodnoty
  • Ověření normality dat podle
    • Kolmogorov-Smirnova testu
    • Lillieforsovy zkoušky
    • Shapiro-Wilkova testu normality
  • Analýzy podle skupin
    • Seskupení dat podle kategorických proměnných
    • Kategorizace spojitých proměnných
    • Překódování proměnných
    • Hierarchická struktura a analýza jednotlivých podskupin
  • Průzkumná analýza dat v různých grafických výstupech
    • Box-plot diagramy
    • Histogramy, dvourozměrné histogramy (3D nebo v kategoriích)
    • 2D a 3D bodové grafy
    • Distribuční grafy (jednostranné, upravené dle trendu)
    • Q-Q grafy, P-P grafy
    • … další metody zobrazení dat

Korelace

  • Míry asociace
    • Pearsonův korelační koeficient
    • Spearmanův korelační koeficient
    • Kendallovo Tau (b, c)
    • Gama
    • Tetrachorický koeficient korelace
    • Cramerovo V
    • Koeficient podmíněnosti C
    • Sommerovo d
    • Koeficient nejistoty (uncertainty coefficient)
    • Parciální korelace
    • Autokorelace
  • Výpočet korelačních matic
    • Vyloučení chybějících hodnot (v párech nebo případ po případu)
  • Grafické znázornění výsledků
    • Bodový graf s intervaly spolehlivosti
    • Maticové bodové grafy
    • Plošné grafy
    • Dvourozměrné 3D histogramy
    • Pravděpodobnostní grafy
    • …další metody zobrazení dat
  • Diagnostika a čištění odlehlých hodnot

Interaktivní výpočet pravděpodobnosti

  • Rozsáhlý výběr distribucí
  • Beta
  • Binomický
  • Cauchy
  • Chi-kvadrant
  • Exponenciální
  • Extrémní hodnota
  • F
  • Gama
  • Hypergeometrické
  • Laplace
  • Lognormální
  • Logistické
  • Pareto
  • Poissono
  • Rayleightovo
  • T (Student)
  • Weibullovo
  • Z (Normální)
  • Výpočet parametrů pro korelaci Pearson-Produkt-Moment
  • Six Sigma výpočty
  • Výpočet DPMO

T-testy (testy rozdílu mezi skupinami)

  • Nezávislé vzorky podle skupin
  • Nezávislé vzorky podle proměnných
  • (Spárované) vzorky
  • Jediný vzorek
  • Hotelové hosté T²
  • Různé možnosti v dialogovém okně výsledků
  • Oddělený odhad odchylky
  • Interval spolehlivosti
  • Leveneův test pro homogenitu rozptylu
  • Test Brown & Forsythe
  • Typické grafické výstupy analýzy
  • Box ploty
  • Histogramy v kategoriích
  • Normální distribuční plochy (v kategoriích, jednostranné, upravené trendy)
  • Scatter-plot v kategoriích
  • … další metody zobrazení dat

Tabulky rozptylů, kontingenční tabulky, tabulky se shluky, analýza více odpovědí

  • Určete okrajové frekvence a poměry kategorických nebo dichotomických proměnných
  • Možnosti pro zpracování chybějících hodnot (chybějící údaje)
  • Párové zpracování proměnných
  • Kategorizace případů s vlastními podmínkami výběru
  • Možné je individuální formátování výsledkových tabulek
  • Styl rozpadu nebo hierarchické uspořádání faktorů
  • Řádky, sloupce nebo celkové procenta v kontingenčních tabulkách (křížové tabulky)
  • Zvýraznění určitých kategorií
  • Kumulativní, relativní, logit- a probit-transformované frekvence
  • Očekávaná hodnota při normálním rozdělení
  • Kolmogorov-Smirnov test
  • Lillieforsova zkouška
  • Shapiro-Wilkův testu
  • Reziduální rozptyl
  • Statistické testy pro kontingenční tabulky (křížové tabulky)
  • Pearson r
  • Maximální pravděpodobnost
  • Yatesův korigovaný Chi-kvadrant
  • McNemarův Chi-kvadrant
  • Fisherův přesný test (jednostranný a oboustranný)
  • Cramérsovo V a C
  • Tetrachorické r
  • Kendallův Tau (b, c)
  • Gama
  • Spearmanův R
  • Sommersovo D
  • Koeficient nejistoty
  • Typické grafické výstupy analýzy
  • Interaktivní plot diagramy pro různé frekvence
  • 3D histogramy, histogramy v kategoriích
  • Normální distribuční plochy (v kategoriích, jednostranné, upravené trendy)
  • Box-plot diagramy

Vícenásobné regrese

  • Modely lineární regrese
  • Jednoduché, vícenásobné (i pro seskupená data)
  • Postupně (vpřed, vzad, v blocích)
  • Modely s nebo bez konstant
  • Modely regrese „Ridge“
  • Vážené nejmenší čtverce
  • Vlastnosti regresních tabulek
  • Standardní chyba pro B, beta a konstantu
  • R², opravený R²
  • ANOVA tabulka
  • Matrice s (částečnými) korelačními koeficienty
  • Korelace a kovariance regresních koeficientů
  • Sweep matice (inverzní matice)
  • Durbin-Watsonova statistika
  • Mahalnobiho a Cookova vzdálenost
  • Rezidua pro odstranění pozorování
  • Intervaly spolehlivosti pro prognózované hodnoty
  • Dvoustupňová regrese nejmenších čtverců (makro)
  • Transformace Box-Tidwell (makro)
  • Typické grafické výstupy analýzy
  • Rozdělení zbytku, vykreslení odlehlé hodnoty
  • Standardní diagramy pravděpodobnosti
  • Pozorované hodnoty, prognózované hodnoty
  • Grafy částečné korelace
  • Iconplots

Neparametrické statistiky

  • Wolf Forestův test
  • Mann-Whitneyův U-test (s přesnými pravděpodobnostmi namísto Z-aproximace u malých vzorků)
  • Kolmogorov-Smirnovův test
  • Wilcoxonův test pro související vzorky
  • Kruskal-Wallisova hodnocení a analýza odchylek
  • Median test
  • Friedmanova hodnostní analýza rozptylu
  • Cochranův Q-test
  • McNemarův zkouška
  • Kendallův koordinační koeficient
  • Kendallův Tau (b, c)
  • Spearmanův R
  • Fisherův přesný test
  • Chi-kvadrát
  • V-square statistika
  • Gama
  • Sommersovo d
  • Nahodilost
  • Typické grafické výstupy analýzy
  • 3D histogramy, histogramy v kategoriích
  • Matrix-scatter-plots diagramy
  • Box-plot diagramy

Rozdělení pravděpodobnosti

  • Normální rozdělení
  • Rovnoměrné rozdělení
  • Exponenciální
  • Gama distribucedistribuce logaritmická normální
  • Chi-kvadrant čtverce
  • Weibullovo
  • Binomické
  • Poissonovo
  • Geometrické rozložení
  • Alternativní rozdělení
  • Chi-kvadrát test
  • Kolmogorov-Smirnovův test jednoho vzorku
  • Lillieforsovo zkouška
  • Shapiro-Wilkův testu
  • Funkce hustoty a distribuce
  • Simulační metody
  • Monte Carlo
  • Latinské vzorkování Hypercube (LHS)
  • Způsoby Iman-Conovera
  • LHS s Iman Conoverovou metodou
  • Typické grafické výstupy analýzy
  • Plot P-P, plot Q-Q
  • Box plot
  • Histogramy (s úpravou, kumulativní)
  • Empirická distribuční funkce

Funkce Pokročilá statistika

Obecné lineární modely (OLM)

  • Předdefinované standardní modely
  • Jednorozměrné, multivariační analýzy rozptylu (ANOVA / MANOVA)
  • ANOVA s hlavními a interaktivními efekty
  • Pevné a / nebo náhodné faktory (smíšený model ANOVA)
  • Hierarchická ANOVA
  • ANOVA s opakovaným měřením (korekce podle Greenhouse-Geisser, Huynh-Feldt)
  • Vícenásobné regrese s hlavními a interakčními účinky
  • Polynomická regrese
  • Účinnost regresní oblasti
  • Regrese oddělených modelů
  • Kovarianční analýza s hlavními účinky
  • Model oddělených regresí
  • Kovarianční analýza s hlavními a interakčními účinky
  • Uživatelské modely
  • ANOVA / MANOVA
  • Další regresní metody
  • Další kovariační analýzy
  • Integrovaný asistent pro vhodnou volbu modelu
  • Editor syntaxe analýzy (volitelně také syntaxe SAS)
  • Doplňkové zkoušky a modelové zkoušky
  • LACK-OF-FIT test
  • Post-hoc testy, analýza kontrastu, srovnání s kontrolní skupinou (Dunnettův test)
  • Multivariační testy (Wilks, Pillai's, Hotelling's, Roy's)
  • Testy na vlastní hypotézy / chybové termíny
  • Test homogenity rozptylu (Bartlettův Chi², Levenův test)
  • Podrobné zbytkové statistiky
  • Graf hlavních a interakčních efektů
  • Rozptylové grafy pro zbytky, předpovědi hodnot
  • Histogramy a normální rozdělení
  • Box-plot diagramy
  • Aplikace modelu
  • Integrovaný výpočet optimalizace s profilem nárazu
  • Výpočet odhadovaných hodnot pro nové případy
  • Výsledek předpovědi s exportem do textu

Obecné regresní modely (ORM)

  • Předdefinované standardní modely
  • Jednorozměrné, multivariační analýzy rozptylu (ANOVA / MANOVA)
  • ANOVA s hlavními a interaktivními efekty
  • Více regrese s hlavními a interakčními účinky
  • Polynomická regrese
  • Účinnost regrese oblasti
  • Regrese povrchu směsi
  • Kovariační analýza s hlavními účinky
  • Kovariační analýza s hlavními a interakčními účinky
  • Uživatelské modely
  • Různé ANOVA / MANOVA
  • Různé regresní metody
  • různé kovarianční analýzy
  • Automatická konstrukce modelu
  • Stepwise forward / backward výběr prediktorů
  • Nejlepší podskupiny Výběr prediktorů
  • Volitelné nahrávání s předpovědní funkcí
  • integrovaný asistent pro vhodnou volbu modelu
  • Editor syntaxe analýzy (volitelně také syntaxe SAS)
  • Doplňkové zkoušky a modelové zkoušky
  • LACK-OF-FIT Test
  • Post-hoc testy, analýza kontrastu, srovnání s kontrolní skupinou (Dunnettův test)
  • Multivariační testy (Wilks, Pillai's, Hotelling's, Roy's)
  • Testy na vlastní hypotézy / chybové termíny
  • Test homogenity rozptylu (Bartlettův Chi², Levenův test)
  • podrobné zbytkové statistiky
  • Graf hlavních a interakčních efektů
  • Rozptylové grafy pro zbytky, předpovědi hodnot
  • Histogramy a normální rozdělení
  • Box-plot diagramy
  • aplikace modelu
  • Integrovaný výpočet optimalizace s profilem nárazu
  • Výpočet odhadovaných hodnot pro nové případy
  • Výsledek bádaní možno exportovat jako text

Funkce Průmyslová statistika

Statistica kombinuje standardní statistické techniky a efektivní grafiku a snadnou obsluhu. Různé "grafy kontroly kvality" umožňují jasně ilustrovat vývoj důležitých vlastností procesu měření kvality. "Analýza procesů" nabízí rozsáhlé metody pro kontrolu statistických procesů a analýzu měřicích systémů. A modul "Experiment Planning" vás pomůže při tvorbě a analýze experimentálních návrhů. Navíc "Analýza výkonu" vám umožňuje zjistit, jaké velikosti vzorku potřebujete, abyste získali smysluplné výsledky před reálným provedením.

  • Grafy kontroly kvality (QC grafy)
    • Řídicí diagramy testu měření
    • X-transverse & R (mapa osy X pro průměry, mapa R pro disperzi procesu)
    • X-Quer & S (mapa osy X pro průměry, S-mapa pro rozptyl procesu)
    • X & MR (X-karta pro jednotlivé hodnoty, karta pohyblivého rozsahu pro rozptyl procesu)
    • MA X-Transverse & R-Map (klouzavý průměr: klouzavý průměr)
    • Karta MA X-Cross & S
    • EWMA X-Quer & R-Map (exponenciálně vážený klouzavý průměr)
    • Karta EWMA X-Quer & S
    • Jednotlivé hodnoty karty CUSUM (kumulativní souhrnná kontrolní karta)
  •  Kontrolní tabulky pro zkoušku hodnocení
    • C-karta (počet defektů, distribuce Poissonu)
    • U-karta (míra deficitu, distribuce Poissonu)
    • Karta Np (počet odmítnutí, binomická distribuce)
    • P-karta (míra odmítnutí, binomická distribuce)
  • Pareto
  • Multivariační grafy řízení kvality
    • Hotelling T² karta pro jednotlivé nebo průměrné hodnoty
    • Jednoduché nebo průměrné skóre MEWMA (multivariační exponenciálně vážený pohyblivý průměr)
    • Multivariační CUSUM karta
    • Karty Multiple Stream X / MR (víceúčelová jednosměrná karta s vícenásobným proudem a vícenásobná přenosová rychlost)
    • Karty Multi-Stream X-Quer & R (víceúrovňová mapa pro ukázkové prostředky a mapu rozmezí více proudů)
    • Karta Multi-Stream X-Quer & S (karta s více streamy pro vzorkovací prostředky a karta standardní odchylky pro více streamů)

Analýza procesů a měřících systémů (SPC, MSA)

  • Analýza způsobilosti procesu a výkonnosti procesu
  • Analýza způsobilosti procesu a toleranční intervaly, jednotlivé údaje nebo souhrnné údaje
  • Procesní způsobilost DIN ISO 21747 (modely distribučního času)
  • Schopnost procesu pro toleranci polohy (dvourozměrná procesní schopnost)
  • Analýza schopnosti testu počítání (binomická a Poissonova distribuce)
  • Analýza měřicího systému (MSA)
  • Schopnost měřicího zařízení s a bez vlivu obsluhy (MSA I / III)
  • Opakovatelnost a srovnávací přesnost měření (MSA II, opakovatelnost a reprodukovatelnost měřidla, R & R)
  • Linearita měřicích přístrojů (lineární linearita)
  • Analýza přiřazovacího měřicího systému (analytická metoda)
  • Přizpůsobivá analýza kontroly
  • MSA přiřazovací data s referencí a bez odkazu (účinnost měřicího systému)
  • Analýza prostojů
  • Odhadovaná životnost s distribucí Weibull
  • Cenzurované a necenzurované prostoje
  • Určení doby bez poruchy (parametr polohy)
  • Weibullovy sítě
  • Diagramy příčin a účinků (Ishikawa, Fishbone)

Reportovací tabulky

  • Reportovací tabulky

Vizualizační panely

Vytvořte smysluplné panely, které vám umožní vizualizovat a shromažďovat data. Funkce drill-down ve vizualizačních panelech umožňuje vyhledávat kontexty na různých úrovních agregace a interpolovat chybějící data.

Funkce Vícerozměrné statistiky

Porovnávací metody

Nejen v klinických studiích, ale i v jiných oblastech, jako je například průmyslová výroba, nebo služby vyžadující způsoby, jak ověřit nebo porovnat jednotlivé výsledky a následně vyhodnotit jak zafungovala například úsporná opatření. V praxi se často používají nevhodné statistické metody, jako jsou jednoduché korelační analýzy nebo průměrná srovnání.
Porovnávací metody v nástroji Statistica kombinuje současné výpočty a vizualizační standardy porovnání metod měření. Zahrnuty jsou:

  • Regrese na Passing-Bablog.
  • Deming regrese (jednoduchá, vážená, IRGDR).
  • Bland-Altmanovy diagramy.
  • Zvláštní hodnocení, jako jsou chybové mřížky a výpočty předsudků.
  • Z porovnání můžete stisknutím tlačítka vygenerovat sofistikovanou statistiku s grafickými a číselnými výstupy!

Funkce Analýza přežití

Společnosti ve farmaceutickém průmyslu používají při dlouhodobém vyhodnocení statistické metody pro výpočet doby trvanlivosti výrobku nebo či opakovaného zkoušení účinné složky podle přísných specifikací evropských regulačních orgánů. Pravidlo Q1E Mezinárodní konference o harmonizaci (ICH) obsahuje konkrétní nařízení pro statistické zpracování údajů o stabilitě, jejichž realizace vyžaduje hlubokou znalost regresní a kovarianční analýzy.

STATISTICA Add-on Analýza přežití umožňuje automatizovat výpočet trvanlivosti (skladovatelnost) a výkon účinné složky (přezkoušení období) po Q1E preferencí:

  • Stanovení pojmu pro jednotlivé nebo vícenásobné dávky.
  • Analýza Covariance pro sdružování údajů.
  • Automatické určování modelu statistickým testem na stejném vzorku a stejným zachycením funkce stability více dávek.
  • Přepínání mezi německým a anglickým jazykem pro vstupní masky a výstupní výsledek.
  • Automatické generování sestavy ve formátu PDF.
  • Pomocí modulu analýza přežití můžete vyhodnocovat studie stability a na stisknutí tlačítka vytvářet archivovatelné výstupní dokumenty!

Funkce ETL

Nástroj Statistica Extract, Transform a Load (ETL) extrahuje, transformuje a načítá data z různých zdrojů do tabulky statistik. Heterogenní zdroje dat jsou standardizovány, koordinovány a přímo přístupné další analýze.
Například data z jedné minuty z jedné databáze mohou být přiřazena k hodinovým datům jiné databáze takovým způsobem, že příslušné hodnoty měření nebo charakteristiky z obou zdrojů dat mohou být následně analyzovány dohromady. V tomto případě mohou být údaje v minutách statisticky shromažďovány různými způsoby - například sumarizací nebo zprůměrování. Další pokyny pro zpracování, jako je rozsah hodnot nebo časové filtry, které je třeba vzít v úvahu, lze pohodlně definovat pomocí uživatelsky přívětivého menu. To umožňuje flexibilní zpracování procesních dat v rámci platformy Statistica.
Nástroj ETL je speciálně optimalizován pro požadavky na vyhodnocení dat pomocí osvědčeného podnikového řešení Enterprise Server. Data, která se mají extrahovat, mohou pocházet ze standardních databází, jako jsou například databáze Oracle nebo SQL Server, soubory Statistica nebo speciální procesní databázový systém PI. Různé zdroje dat lze extrahovat, upravovat a přenášet do analytických tabulek v jednom kroku. Tento nastavený proces ETL může být zaznamenán a integrován do Enterprise Serveru, aby mohl být vyvolán a automatizován nebo později změněn.
To umožňuje analytikovi interaktivně kompilovat data z externích zdrojů v rozhraní Statistica způsobem, který je optimální pro analýzu dat. Následující analýzy dat mohou být prováděny interaktivně nebo automaticky, takže lze vytvořit automatizovaný proces od extrakce dat až po zprávu o analýze.

Funkce Modul tvorby pravidel

Neomezená tvorba parametrizovatelných pravidel a workflow.

Funkce PI konektor

Funkce Variace

Funkce Testování hypotéz

Testování hypotéz (WoE) usnadňuje pochopení a modelování vztahů, kde existují binární cíle. Tak je tomu v mnoha průmyslových odvětvích, bez ohledu na to, zda jde o různé cílové kategorie jako "dobré" vs. "špatné", "zdraví" vs. "nemoc" nebo "ano" vs. "ne".

S testováním hypotéz jsou proměnné rekodifikovány takovým způsobem, že separační síla k závislé proměnné je maximalizována. Metrické proměnné se převádějí do tříd a kategorické proměnné se rekodují.

V praxi si lze představit, jak se úvěrová splatnost snižuje s tím, jak se doba splácení zvyšuje. Každému (různě širokým) měsíčnímu intervalu je přiřazena hodnota WoE, což znamená, že negativní hodnoty WoE znamenají nepřiměřeně mnoho úvěrových ztrát.

Hledání nejefektivnějšího řešení probíhá automaticky pomocí metody rozhodovacího stromu, a to i pro více ovlivňujících se proměnných, a může také zvládnout odlehlá a chybějící data.

Uživatelé mohou určit, zda by měly být zobrazeny složité nelineární vztahy a interakce mezi ovlivňujícími proměnnými nebo by měly být zobrazeny pouze jednoduché trendy. Pro snadnější porozumění lze použít i méně granulární klasifikaci.

Kódování WoE je vydáno ve formě pravidel, které snadno aplikujete na data pouhým kliknutím.

S testováním hypotéz můžete často získat lepší výsledky při modelování, zejména při logické regresi. Vzhledem k tomu, že metrické hodnoty WoE jsou přiřazeny k třídám nebo kódům s přímým odkazem na cílová data, není zapotřebí fiktivního či efektivního kódování (což také často zahrnuje problémy s odhadem) a usnadňuje interpretaci modelů.

Funkce Data Mining

Funkce Data Mining (dolování dat) nástroje Statistica obsluhuje celý proces dolování dat - od vytvoření databázového dotazu až po vytvoření metody konečné sestavy – modul je výkonný a snadno použitelný.

Funkce Data Mining nástroje Statistica se přizpůsobují vašim potřebám a znalostem. Vyberte si mezi různými aplikačními režimy, které se liší možností obsluhy a stupněm automatizace:

  • V expertním režimu používáte celou řadu metod a možností.
  • Vizualizace projektu automatizuje celý proces dolování dat, od získávání dat až po výstupní výsledky.
  • Asistent vás provede nejdůležitějšími kroky analýzy s jasným návodem k použití.

Data Mining často přesouvá velmi velké objemy dat a provádí komplexní výpočty modelů - proto je nezbytným předpokladem dobrá výkonnost softwaru.

S dataminingovými funkcemi softwaru Statistica jste dobře připraveni na:

  • Optimalizované algoritmy vyvinuté pomocí nejmodernější technologie kompilátorů, 64 bitové verze pro podporu rychlejších procesorů a k distribuci procesů na více procesorech.
  • Optimalizovaný přístup k čtení a zápisu do velkých databází.
  • Procesní technologie čte data asynchronně přímo z databázových serverů.

Serverová verze také umožňuje přenos všech výpočtů na vysoce výkonné víceprocesorové počítače a také z počítače v intranetu nebo Internetu prostřednictvím webového rozhraní - tedy bez instalovaných komponent Statistica - jsou řízeny.

Nejlepší metoda pro dolování dat neexistuje. Dobrý nástroj pro dolování dat musí proto nabízet širokou škálu metod. Funkce Data Mining softwaru Statistica jsou ideální pro tato použití:

  • Četné metody přípravy dat, jako je filtrování, výběr a transformace.
  • Výběr funkcí pro identifikaci relevantních prediktorů.
  • Klasifikační a regresní stromy (CART, CHAID), interaktivní rozhodovací stromy, posílené stromy a náhodné lesy.
  • Generalizované doplňkové modely, MAR Splines.
  • EM a k-menas-clustering, nezávislá analýza komponent, jednoduchá a sekvenční pravidla přidružení.
  • Postupy neuronové sítě včetně samoorganizačních map (SOM).
  • K-nearest sousedé, podpůrné vektorové stroje (SVM), Bayesovský postup.
  • Techniky jako Hlasování, Bagging, Boosting, Meta-Learning.
  • Všechny jednoduché a vyšší statistické metody (jako je regrese, diskriminace a analýzy časových řad).
  • Vynikající interaktivní vizualizační nástroje a mnohem více.

Scénáře

Požadavky na dolování dat jsou různorodé ve všech odvětvích: banky, pojišťovny, masmédia, maloobchod, zásilkový obchod, e-commerce nebo telekomunikační společnosti je již úspěšně používají. Ale i průmyslová výroba, logistika, biochemie, výzkum, medicína a farmaceutický výzkum se stále setkává s potřebou dolování dat k optimalizaci procesů a zkoumání příčiny.

Tradiční Data Mining aplikace

zákaznická segmentace nabízí segmentaci zákazníků do skupin s podobnými sociodemografickými profily a poptávkovými modely pro cílený přístup.

Vyhodnocení rizik

Předpovědi na základě již získaných dat, aby se minimalizovalo riziko selhání. Vytvořte modely a scénáře pro hodnocení rizik. Vyhodnoťte úvěrové riziko podle Basel II.

Optimalizace marketingu

Zvyšte odezvu a návratnost investic vašich přímých marketingových kampaní: individuálním kontaktem s klientem, frekvencí zasílání a nabídkou na míru. Optimalizujte up i cross-selling.

Nákupní košík a webové analýzy

Které produkty a služby by měly být nabídnuty zákazníkům? A za jakých podmínek? Volby vašich zákazníků vám dávají odpovědi.

Další scénáře CRM

Využívání dolování dat v analytickém CRM pro detekci podvodů, analýzy zákaznické hodnoty či správu stížností.

Dolování dat v průmyslovém prostředí

Optimalizace

Automatizované procesy potřebují ukládat data při vysokých rychlostech, zejména v průmyslové výrobě nebo výrobě elektrické energie. Pomocí dolování dat můžete dokonce určit rozhodující parametry hromadných sběrů dat. Simulace vám ukazují, co můžete skutečně zlepšit.

Zabezpečení kvality

Sledujte celou řadu vlastností kvality současně s mapami víceřádkových kontrol. Online monitorování a prognózy v reálném čase umožňují opětovné úpravy během probíhajícího výrobního procesu.

Analýza chyb

Zjištění chyb a chybových vzorků v přípravě surovin, ve výrobním procesu nebo v hotových výrobcích. Pravidla přidružení odhalují častý výskyt různých problémů s kvalitou nebo typických chybových sekvencí. Interaktivní rozhodovací stromy umožňují flexibilní a srozumitelnou analýzu základních příčin.
Vývojové nástroje Nástroj umožňuje exportovat připravené prognostické modely v různých programovacích jazycích (např. C #, Java, SQL uložené procedury). To umožňuje, aby modely byly použity přímo v koncové aplikaci či nástroji, například k dosažení maximálního výkonu a nemusely se nejprve přenášet data na servery přes složité infrastruktury.
Existující kódy PMML mohou být také konvertovány do různých jazyků pomocí převodníku modelů i po vytvoření modelu. Zahrnuje také aplikaci Java for MapReduce, která umožňuje používat předpovědní modely přímo v prostředí Hadoop.
Funkce analýzy v databázi také umožňuje, aby byly celé procesy analýzy analyzovány přímo databází.

Funkce Optimalizace procesů

Funkce Text Mining

Statistika Text Mining transformuje nestrukturovaná textová data do srozumitelné a použitelné formy, kterou následně můžete zpracovat přes různé rozhodovací procesy. Ve skutečnosti jsou data v mnoha formátech a nelze je vždy přímo hodnotit. Statistické dolování textu umožnuje vysledovat další, zdánlivě skryté informace.

Funkce pro dolování textu v programu Statistica poskytují bohatou a výkonnou sadu nástrojů. Jsou navrženy tak, aby byly vysoce efektivní a škálovatelné díky nejmodernějším technologiím, aby co nejlépe využívaly sofistikované víceprocesorové serverové systémy. Analytické nástroje lze aplikovat na textové dokumenty nebo webové stránky. Ale i z předběžně zpracovaných bitmap a zvukových souborů mohou být nestrukturované informace roztříděny, seskupeny nebo jinak zahrnuty do analýzy.

Funkce In-Database Analytics

S In-database analytikou (vyžaduje server Enterprise Server) lze procesy analýzy provádět externě přímo v databázích. V grafickém rozhraní projektu Statistica jsou připraveny a připojeny interní databázové analytické uzly. Tyto procesy se pak provádějí přímo v databázi a pouze výsledky jsou přenášeny uživateli. Podporované operace zahrnují: výpočet statistik a korelaci, odhad regresních modelů, vzorkování a filtrování, výběr prvků, rozhodovací stromy a mnoho dalších. Kromě klasických databází, jako jsou například Microsoft SQL Server, Teradata, Oracle a další, je podporován i Apache Hive.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Ke stažení

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Licence a obchod - (+420) ‭739 569 987‬
Školení - (+420) 773 217 132

Volejte Po - Pá: 9.00 - 16.00 hod

info@statistica.pro
Odpovíme do 1 pracovního dne

Sídlo společnosti:
ArcIT Consulting, s.r.o.
Tylova 473/27
Plzeň 3
IČ: 05689651
DIČ: CZ05689651

Kanceláře:
ArcIT Consulting s.r.o.
Zelený Pruh 95/97
140 00 Praha 4

Kurzy a semináře se konají na adrese:
Kuta a.s.
Zelený Pruh 95/97
140 00 Praha 4




Zapsána u Krajského soudu v Plzni, oddíl C, složka 33739

Napište nám

Statistica.pro je projektem ArcIT Consulting s.r.o.

S používání webových stránek statistica.pro, souhlasíte s využíváním cookies ve vašem prohlížeči.

Pokračovat

Newsletter