Zavřít
Výkonný balíček pro tvorbu a nasazování rozsáhlých data miningových projektů zahrnující kompletní sadu metod od základních přes strojové učení až k text miningu.

Data Scientist

  • O Statistice
  • Data Scientist
  • Funkce
  • Ke stažení

TIBCO Statistica je špičkový analytický software a jediný software světového formátu lokalizovaný do češtiny. Je určený pro rychlé a jednoduché vyhodnocování dat. Obsahuje široký výběr základních i pokročilých metod a funkcionalit speciálně vyvinutých pro oblasti Business Intelligence, Big Data, kontrolu a řízení kvality, optimalizaci procesů, výzkum, vývoj a mnoho dalších. Již přes 35 let je vyvíjený s důrazem na intuitivní ovládání a jednoduchost používání, aby jste získali potřebné výsledky na několik kliknutí myší.

Software Vám umožní řídit celý analytický proces, od načítání dat z různých datových zdrojů, přes jejich přípravu, vizualizaci, vyhodnocení, tvorbu modelů, až po tvorbu výstupů v mnoha formátech nebo nasazení vytvořeného modelu na nová data, resp. do produkce. Všechna práce je rychlá, intuitivní a probíhá v prostředí jednoho softwaru bez potřeby znalosti programování. Využít můžete více než 17.000 funkcí, kterými software disponuje a neustále své možnosti rozšiřuje.

Nahraní dat

Data do sofwaru pohodlně nahrajete z aplikace MS Excel i ze standardních databázových systémů MS SQL, Oracle, Teradata, atd. včetně Hadoopu a dalších moderních systémů. Touto možností se komfortně vyhnete zbytečnému mezikroku v podobě exportu dát z různých systémů nejčastěji do Excelu a následně jeho nutného dalšího komplikovaného zpracování. Připojením přímo do databází pomocí nástroje na tvorbu dotazů si nahrajete potřebná data přímo do softwaru Statistica k následnému vyhodnocení.

Konektory pro připojení dat z průmyslových zařízení technologiíí PI

Příprava dat

Po nahrání dat je pro Vás v softwaru k dispozici celá řada metod a funkcionalit pomocí kterých si data na jednom místě, rychle a snadno připravíte do podoby potřebné pro jejích vyhodnocení.

Vyhodnocení dat

Pro vyhodnocení dat je pro Vás v softwaru připravené nepřeberné množství statistických metod od základních popisných statistik, jednorozměrných metod, vícerozměrných metod, lineárních a nelineárních modelů, přes průmyslové statistiky, neuronové sítě až po pokročilé metody strojového učení, prediktivního modelování a text miningu. Jednotlivé moduly se od sebe liší především rozsahem těchto analytických metod.

Software je vyvíjen s důrazem na rychlé a jednoduché získání výsledků v jednom prostředí. Eliminuje nutnost využití vícero různých softwarových nástrojů pro zpracování dílčích úkolů. Celý proces nahrání dat, jejích přípravy, vyhodnocení, tvorby výstupů je tedy možné řídit z prostředí softwaru Statistica.

Pro ty z Vás, kteří si rozumíte s jazykem R, nebo Python máte možnost použít skripty v těchto jazycích přímo v softwaru a tím spojit jednoduchou práci v softwaru Statistica s obrovskými možnostmi těchto programovacích jazyků.

Tvorba výstupů

Získané výsledky lze zpracovat do výstupů pro použití mimo prostředí softwaru Statistica. Podporovaný je export do různých formátů, jako .pdf, .html, .xml, případně export do nástrojů MS Office. Napočítané výsledky lze exportovat do dalších TIBCO nástrojů, nebo zapsat zpět do databáze pro další zpracování.

Tvorba grafů

Pro vizuální analýzu nebo finální grafickou prezentaci výsledků obsahuje software Statistica širokou paletu nejrůznějších grafů s možností její plné editace a přizpůsobení vašim potřebám.

Pro univerzity jsou k dispozici speciální produkty v rámci Univerzitního programu.

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Ve verzi Statistica Data Scientist jsou nabízeny metody pro optimalizaci procesů a licence umožňuje importovaní či exportování modelů do jiných formátů, aby mohly být začleněny do aplikací třetích stran a použity nezávisle na Statistice. Verze Statistica Data Scientist je k dispozici na koncových stanicích, v síťové licenci a v serverových verzích a může být nasazen jako celopodnikový analytický systém. Serverová verze umožňuje kompletní automatizaci procesů a správu všech analytických procesů v podniku, včetně přístupu k datům, analýzám, přehledům a distribucím informací.

Pro univerzity jsou k dispozici speciální produkty v rámci Univerzitního programu.
Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

TIBCO Statistica Data Scientist obsahuje: 

  • automatizaci pro čištění dat; “špinavá” data (chybějící, vadná, duplikovaná, nekonzistentní atd.) jsou nejčastějším problémem datových analýz 
  • nástroj na tvorbu business pravidel; poskytuje transformační krok pro čištění dat, analýzy a reporting. Vytvoříte Vami definovaná pravidla, spustíte je a uložíte. Poté jsou pravidla prováděna a vyhodnocena pro každý řádek dat. Tento modul zahrnuje  
  • obecné transformace v tabulce (např. vzorce) 
  • podmíněné výrazy – if/elseif/else 
  • set pravidel, které můžou volat jiný set pravidel (běžná pravidla lze napsat jednou a použít mnohokrát) 
  • explorační analýzu & vizualizace 
  • popisnou a neparametrickou statistiku 
  • lineární regresní modely, nelineární regresní modely; odhaduje vztahy mezi vašimi proměnnými a vytváří prediktivní modely (Machine Learning - strojové učení); využívá také nasimulovaná data k vytvoření lineárních regresních modelů  
  • vícerozměrné průzkumné techniky (vícerozměrné statistické metody); organizuje data do smysluplných klastrů/shluků, klasifikuje/třídí proměnné (redukuje proměnné a hledá mezi nimi vztahy), provádí klasifikační analýzu 
  • analýzu procesů (procesní analýzu), kontrolu kvality, vícerozměrné statistické řízení procesů; pomáhá porozumět klíčovým procesním parametrům, které mají vliv na kritické atributy kvality  
  • navrhování experimentů (Design of Experiments)analýzu síly testu (Power Analysis) a odhad intervalu (Interval estimation); umožňuje experimentovat a objevovat/zjišťovat; také používá simulovaná data k provádění virtuálních experimentů  
  • možnosti vytváření tabulek; každý potřebuje souhrnnou tabulku pro svou prezentaci managementu  

V softwaru Statistica existují dva základní způsoby práce s analytikou - tabulka a pracovní prostor (workspace). Pracovní prostor (workspace) je vizuální analytický nástroj pro správu pracovního postupu (workflow) a je doporučujeme jej při práci využívat. Umožňuje Vám práci uložit a znovu použít. K práci v pracovním prostoru není potřeba žádné psaní kóduPro ty uživatele, kteří však potřebují použít i svoje skripty, má pracovní prostor tzv. „kódový uzel“ („code node“), který je schopen pracovat s jazykem C #, Python nebo R. 

Pro zpracování ad-hoc analýzy, která nemusí být duplikována, máte možnost importovat data do datové tabulky Statistica pracovat s menu, proměnnými a datovými řádky. 

V softwaru TIBCO Statistica Data Scientist jsou k dispozici 2D a 3D vizualizace; histogram, spojnicový graf, rozptyl, průměr chyb, dále tzv. bag ploty, které jsou dvourozměrnou variantou krabicových grafů, kvantil-kvantil (beta, exponenciální, extrémní, gama, lognormální, normální, Rayleigh, Weibull), variabilita, normální pravděpodobnost atd. 

Profilování dat, čištění, transformace 

Uzel na kontrolu stavu dat, tzv. Data Health Check (DHC) uzel prochází hodnoty, rozsahy hodnot, textové popisky, chybějící data, odlehlé hodnoty atd. na každé proměnné. Výsledkem této analýzje diagnostická zpráva/report. DHC lze také nakonfigurovat tak, aby automaticky opravoval problémy v datech diagnostikovaných analýzami. 

K dispozici jsou Vám i další možnosti transformace a čištění; odstranění duplicit, překódování, hodnocení, slučovánízpracování invariantních proměnných, překódování odlehlých hodnot, doplňování chybějících dat, překódování chybějících dat, tvorba vzorků, podmnožin, atd. 

Box-Coxova transformace je k dispozici pro transformaci proměnných tak, aby měly rozložení co nejblíže k normálnímu (Box and Cox, 1964). Tato funkcionalita Vám umožňí použití algoritmů, jako je regresní analýza, které fungují pouze s normálním rozložením dat. 

Vlastnosti pracovního prostoru (Workspace) 

Workspace je vizuálné pracovní prostředí, které: 

  • dokumentuje analytické kroky  
  • importuje data z excelu, csv, data s pevnou šířkou (mainframe data) 
  • vkládá data do pracovního prostoru jako vyhledávací tabulku; převádí "p" na “Pondělí” pro lepší čitelnost  
  • importuje Spotfire SBDF datový soubor a konfiguruje analytiku  
  • načítá data z databáze pomocí ODBC konektoru and konfiguruje analytiku  
  • integruje dva nebo více datových setů do jednoho grafického prostředí a série výstupů 
  • vytváří vizualizace  
  • formátuje výstupy pro reporting 
  • exportuje výsledky do excelu, csv, Spotfire SBDF, atd.. 
  • zapisuje výsledky do databáze; SQL Server, Oracle, Teradata, SQL Server PDW, PostgreSQL, DB2 
  • workspace vyvolává jiný workspace 

Workspace můžete také roršířit o své vlastní skripty v jazycích R, C# nebo Python pomocí tzv. „Code Node“. 

Analytické metody

 

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Ke stažení

Chcete si vyzkoušet TIBCO Statistica? Trial verze ke stažení:

Licence a obchod - (+420) ‭739 569 987‬
Školení - (+420) 773 217 132

Volejte Po - Pá: 9.00 - 16.00 hod

info@statistica.pro
Odpovíme do 1 pracovního dne

Sídlo společnosti:
DataFriends s.r.o.
Tylova 473/27
Plzeň 3
IČ: 05689651
DIČ: CZ05689651

Kanceláře:
DataFriends s.r.o.
Lazarská 11/6
120 00 Praha 2

Kurzy a semináře se konají na adrese:
DataFriends s.r.o.
Lazarská 11/6
120 00 Praha 2




Zapsána u Krajského soudu v Plzni, oddíl C, složka 33739

Napište nám

Statistica.pro je projektem DataFriends s.r.o.

Newsletter