Co je nového v TIBCO Statistica?

TIBCO Statistica 13.5

Definice chybějících dat pro práci ve vzorcích nad tabulkou (DŮLEŽITÉ)

Práce s chybějícími daty (MD = chybějící data, prázdné buňky) ve vzorcích nad tabulkou se změnila. Chcete-li se vrátit k předchozí verzi před 13.5, zvolte volbu Home -> Options -> Spreadsheets -> Use legacy MD comparisons in formulas. Po změně této volby ukončete a restartujte program Statistica.

Spotfire Integration – více možností parametrizace

Analytické postupy v softwaru Spotfire, fungující zejména jako grafická nadstavba nad softwarem Statistica, můžete nyní parametrizovat přímo z workspace programu Statistica. Když uživatel programu Statistica definuje ve workspaces novou funkci, zapíší se vstupní a výstupní parametry této funkce do tzv. nodu a Spotfire je schopný se do tohoto nodu připojit a vstupní i výstupní parametry této funkce využít.

To dává analytikům větší kontrolu nad nastavením analýzy. Také je možné snížit množství parametrů z workspace programu Statistica, které se následně budou zobrazovat ve Spotfire Analyst. Při úpravě workspace v rámci programu Statistica vyberte tlačítko Designer view. Můžete vybrat specifické nody nebo zrušit výběr sdílených nodů a i parametrů v rámci nodu.

Doporučujeme podívat se na video.

Spotfire Integration – prvek Reporting Documents

Prvek Reporting Documents v rámci workspace programu Statistica nemohl být použit před verzí 13.5. Nyní budou všechny vygenerované a uložené tabulkové typy dokumentů (tabulky) v prvku Reporting Documents použitelné ve Spotfire Data Function.

Spotfire Integration – sdílení s dalšími analytiky Spotfire

… zavolání workspace programu Statistica (bez kódované analytiky) pomocí Spotfire Data Function

… vložení workspace programu Statistica do souboru Spotfire.dxp a sdílení s dalšími analytiky Spotfire

Nyní je možné nainstalovat program Statistica na stejném počítači pomocí nástroje Spotfire Analyst. Spotfire X potřebuje mít nainstalován balík Statistica Extension.

Poznámka: Dashboard Spotfire může být vytvořen pouze lokálně pomocí Spotfire Analyst. Je to výhodné pro Ad-hoc analysis, Exploring, Model Building, Feature Selection. Tato funkcionalita nemůže být používána uživatelem nástroje Spotfire Consumer.

Variable Selection

Když pracujete s velkými datovými sadami a s výběrem dlouhých složitých seznamů proměnných pro analýzy s různými kategoriemi proměnných (příklad: závislé, kategorické, kontinuální), pokud se některé proměnné v těchto seznamech překrývají, je těžké určit, které proměnné to jsou a opravit je. Chybové hlášení o překryvu proměnných bylo vylepšeno. Uvádí, které proměnné se překrývají. A nabízí následující tři možnosti:

odstranění duplikátů z prvního seznamu
odstranění duplikátů z druhého seznamu
manuální úprava výběrů proměnných

Tato funkce snižuje čas strávený výběrem proměnných v interaktivních modulech a prvcích workspace.

Workspace

Prvek Alternative Least Squares Deployment

Prvek Alternative Least Squares Deployment byl aktualizován.

Po výběru tlačítka Deploy to Enterprise může uživatel nyní vybrat místo možnosti Deploy to Enterprise novou možnost None.

Customize Output pro Workspace

Funkce Customize Output se většinou běžně používá k nastavení počtu desetinných míst pro statistiku, tučně označený text nebo formát grafiky. Tato funkce je přístupná klepnutím pravým tlačítkem na libovolný prvek ve workspace. Zobrazí se vám nabídka pro výběr a otevření dialogového okna Customize Options.

Byla přidána nová možnost k zatrhnutí Suppress output. To umožňuje designerovi workspace se rozhodnout, který výstupní prvek se zobrazí v nodu Reporting Documents. Všechny grafy ze všech prvků nebo konkrétních prvků mohou být potlačeny. Všechny výstupy tabulek (tabulky) lze potlačit pro všechny prvky nebo konkrétní prvky. Jednotlivé grafy nebo tabulky lze také potlačit.

Tato funkce poskytuje detailní kontrolu nad tím, co uživatel ve workspace vidí.

Prvek Data Health Check

Do prvku Kontrola stavu dat bylo přidán políčko použití předchozího popisu. Bylo to přidáno, aby to pomohlo vytvořit šablonu. Například to může být kombinováno s novým prvkem Select Predictors.

Prvek Elasticsearch Text Analytics

Na kartě Specifications -> Quick, vyberte Files. Zkontrolujte dialogové okno Procházet složku. Vybraný adresář se nyní zobrazí v tomto dialogovém okně.

Prvek Filter and Process Data

Filter Duplicate Cases, Filter Sparse Data, MD Imputation, Process Invariant Variables, Process MD and Rank nodes nyní podporují zástupné znaky při výběru proměnných. Výběr proměnných je důležitý pro vytváření šablon, které lze znovu použít. Jiné prvky již tuto funkci mají.

Například může být zvolena proměnná:

*KOČKA*

1 *

Obecný lineární (GLM) prvek

Obecný lineární (GLM) prvek je ověřen a uvolněn ve verzi 13.5. Bylo to vydáno jako „beta“ v předchozích vydáních.

Prvky ITrees CHAID

Volba Always split on minimum p je přidána do prvků ITrees CHAID Classsification and Regression.

Prvek K-Means Clustering

Prvek K-Means Clustering je ověřen a uvolněn ve verzi 13.5. Bylo to vydáno jako „beta“ verze v předchozích vydáních.

Prvek Lasso Regression

Použití předchozího vstupního popisu bylo přidáno do prvku Lasso Regression. Bylo to přidáno, aby to pomohlo vytvořit šablonu. Například to může být kombinováno s novým prvkem Select Predictors.

Prvek Normality tests

Prvek Normality tests vypočítává testy normálnosti (Kolmogorov-Smirnov test statistic, Kolmogorov-Smirnov p-value, Lilliefors p-value, Anderson-Darling test statistic, Anderson-Darling p-value, Shapiro-Wilks p-value) pro každou proměnnou. Pokud jsou vybrány dvě nebo více proměnných, můžete vypočítat následující testy vícerozměrných normálností:

Mardia’s test of multivariate skewness
Mardia’s test of multivariate kurtosis

Proč testovat normálnost? Normální distribuce je základem mnoha algoritmů. A ověření normality datového souboru může být rozhodující pro získání správného výsledku analýzy. Ověřením lze považovat výběr za vhodný pro algoritmy, které mají potvrdit hypotézu.

Například: „Nemám rád průměr. Mám rád individualitu. Jeden člověk může mít šest jídel během den a někdo jiný ani jedno. Neznamená to, že by oba měli průměrně tři jídla během dne a byly najedení.“ ~ Louis D. Brandeis, Spřízněný soudce Nejvyššího soudu Spojených států v letech 1916 až 1939

Prvek PI

Řízení kalendáře se přidává do polí startu času a ukončení času všech prvků PI.

Prvek Reporting Tables

Nyní můžete změnit uspořádání prvků v poli Placement group box v prvku Reporting Tables.

Prvek nyní generuje datový soubor pro další analýzu. Před verzí 13.5 byla tato možnost ve výchozím nastavení vypnutá.

Prvek Select Predictors

Prvek Select Predictors se připojí k jedinému zdroji dat. To může být velmi užitečné se Spotfire Integration. Uživatel může vybrat jednu cílovou proměnnou pro problémy s prediktivní analýzou. Prvek klasifikuje a vybírá zbývající proměnné jako kontinuální nebo kategorické prediktory. Poté prochází výběrem proměnných jednu po druhé.

Připojte prvek Select Predictors node to Advanced Classification Trees (C&RT), Advanced Regression Trees (C&RT), Advanced Classification CHAID, Advanced Regression CHAID, Boosted Trees, Data Health Check, K-Nearest Neighbors, Lasso Regression, Feature Selection, MARSplines, Random Forest, SANN Classification, SANN Clustering, SANN Regression, Support Vector Machines and SVB, který používají výběr závislé / predikované proměnné.

Obsah

TIBCO Statistica 13.5

Definice chybějících dat pro práci ve vzorcích nad tabulkou (DŮLEŽITÉ)

Spotfire Integration – více možností parametrizace

Spotfire Integration – prvek Reporting Documents

Spotfire Integration – sdílení s dalšími analytiky Spotfire

Variable Selection

Workspace

Prvek Alternative Least Squares Deployment

Customize Output pro Workspace

Prvek Data Health Check

Prvek Elasticsearch Text Analytics

Prvek Filter and Process Data

Obecný lineární (GLM) prvek

Prvky ITrees CHAID

Prvek K-Means Clustering

Prvek Lasso Regression

Prvek Normality tests

Prvek PI

Prvek Reporting Tables

Prvek Select Predictors

Další články

Podklady k certifikaci – Advanced analytics and automatization (Advanced)

[ZÁZNAM WEBINÁŘE] Jak efektivně využívat principy Open Science

[30. 3. 2023] Webinář ZDARMA: Jak správně využívat principy Open Science ve výzkumu

Statistica 14 je dostupná v češtině. Co přináší a jak mění licenční podmínky?

Geo-analytika na vzestupu

Nevymýšlejte znovu kolo. Použijte embedded BI.

Užitečné odkazy

Užitečné kontakty