Webinář ZDARMA [24 .4. 2024]

Porovnání nezávislých výběrů – neparametrická ANOVA

V souboru http://www.statsoft.cz/file1/Newsletter/kruskal.sta jsou data týkající se skupiny opic stejného druhu, které byly náhodně rozděleny do tří experimentálních skupin. Každému exempláři byla ukázána série předmětů. Úkolem bylo vybrat určitý předmět. Za správnou volbu byla opice odměněna. Pro korektní rozhodnutí bylo v první skupině důležité dobře určit tvar, ve druhé skupině barvu a ve třetí skupině velikost. Na základě počtu pokusů potřebných k úspěšnému výběru chceme rozhodnout, zda jsou úlohy založené na rozpoznání tvaru, barvy a velikosti pro konkrétní druh opic stejně obtížné.

Řešení

Zdá se, že vhodnou metodou, jak tuto úlohu řešit by mohla být jednofaktorová ANOVA (analýza jednoduchého třídění). Než však začneme analýzu provádět, podívejme se, zda jsou splněny její předpoklady. Tyto by bylo vhodnější vyzkoušet např. na pilotním vzorku (na kterém bychom si opravdu pouze ověřili předpoklady). Nicméně obvykle však jiná data k dispozici nejsou, a proto ověříme předpoklady na datech, která máme k dispozici. Prvním předpokladem, který je potřeba ověřit, je normalita závislé proměnné ve všech skupinách. Možností v softwaru Statisticaje více, tentokrát k tomu využijeme normální pravděpodobnostní graf.
Ze základní nabídky vybereme Grafy / 2D Grafy / Normální pravděpodobnostní grafy. Na záložce Základní nastavení klikneme na tlačítko Proměnné: a vybereme proměnnou počet pokusů. V oddílu Statistiky zaškrtneme volbu Shapiro-Wilkův test pro testování normality. Na záložce Kategorizovaný zaškrtneme v oddílu Kategorie X volbu Zapnuto, čímž se zpřístupní nabídka, kde klikneme na tlačítko Změnit proměnnou. Otevře se okno Výběr kategorizační proměnné, kde vybereme skupina a potvrdíme. Ještě jednou klikneme na OK a dostaneme následující normální pravděpodobnostní grafy pro jednotlivé skupiny.

Z grafu i z hodnot Shapiro-Wilkova testu je patrné, že ve skupině velikost byl porušen předpoklad normality. Navíc počet pokusu v jednotlivých skupinách je velmi malý na to, abychom mohli počítat s výsledky centrální limitní věty. Místo ANOVY tedy použijeme její neparametrickou obdobu Kruskal-Wallisův test, jenž je založený na pořadí a nepředpokládá se, že data pocházejí z normálního rozdělení, nicméně se předpokládá, že pozorování jsou nezávislá (což v našem případě víme z povahy pokusu), ze spojitého rozdělení a že v každé skupině pocházejí pozorování z populací se stejným tvarem distribuce.
K dispozici je kromě Kruskal-Wallisovy ANOVY také mediánový test, který porovnává počet pozorování nad a pod mediánem v jednotlivých skupinách. Můžeme se tedy rozhodnout, jestli použijeme Kruskal-Wallise nebo mediánový test. Není ale korektní používat oba testy najednou.

Oba testy najdeme ve stejné nabídce následovně: ze základní nabídky vybereme Statistiky / Neparametrická statistika / Porovnání více nezávislých vzorků (skupiny). Otevře se dialog Kruskal-Wallisova ANOVA a mediánový test. Klikneme na tlačítko Proměnné. Jako závislou proměnnou vybereme počet pokusů. Grupovací proměnná bude skupina. Klikneme na OK. Dialog by měl vypadat takto:

Klikneme na tlačítko Shrnutí: Kruskal-Wallis ANOVA a mediánový test. Vytvoří se dvě tabulky.

Poznamenejme, že Kruskal-Wallisův test nepracuje s původními hodnotami, ale s pořadovými čísly, která jim byla přiřazena. Z hodnot součtu pořadí pro jednotlivé skupiny vyplývá, že nejobtížnější bylo rozpoznat velikost, nejsnáze se identifikoval tvar. Ke stejným závěrům dojdeme také pomocí mediánového testu, kdy zkoumáme počty případů nad a pod společným mediánem. Opět se potvrzuje, že nejlépe byly předměty rozpoznávány podle tvaru a nejhůře podle velikosti. Pokud bychom se pro mediánový test rozhodli, tak jeho výsledek ukazuje druhá tabulka:

Výsledky můžeme zobrazit také graficky. V dialogu Kruskal-Wallisova ANOVA a mediánový test Kruskal-Wallisova ANOVA a mediánový test klikneme na tlačítko Krabicový graf. Ještě je třeba vybrat proměnnou, kterou chceme v grafu zobrazit, což je počet pokusů a zvolit typ krabicového grafu. Nás zajímá krabicový graf znázorňující medián, dolní a horní kvartil a rozpětí (tj. první volba v dialogu Typ krabicového grafu), protože medián odpovídá povaze Kruskal-Wallisova testu.

Také krabicový graf potvrzuje, že nejsnáze byl rozpoznán tvar a nejvíce pokusů opice potřebovaly ke správnému určení velikosti předmětu.

Dalším způsobem, jak si můžeme prohlédnout rozložení hodnot závislé proměnné v jednotlivých skupinách, je kategorizovaný histogram. V dialogu Kruskal-Wallisova ANOVA a mediánový test tlačítko Kategorizovaný histogram. Otevře se dialog, ve kterém vybereme proměnnou, kterou v grafu zobrazíme, tj. počet pokusů. Klikneme na OK. Výsledek je na obrázku.

Opět se potvrzuje, že opice lépe rozpoznávaly tvar (tj. distribuce je mírně zešikmená vlevo) než barvu a velikost. Výsledky se zdají být zřetelně nejhorší v případě velikosti.

Již víme, že mezi skupinami je významný rozdíl. Ale mezi kterými z nich? Na tyto otázky dostaneme odpověď, pokud klikneme na tlačítko Vícenásobné porovnání průměrného pořadí pro všechny skupiny v dialogu Kruskal-Wallisova ANOVA a mediánový test.


Na základě vícenásobného porovnání můžeme říct, že naše exempláře dosahovaly významně lepších výsledků při určování tvaru a barvy než velikosti. Rozdíl v úspěšnosti při určování tvaru a barvy není statisticky významný. Více informací o pozadí metody se můžete dozvědět na našem odborném kurzu Analýza rozptylu, případně v kurzu Neparametrická statistika.

Závěr

Jak se zdá z výsledků analýzy, můžeme konstatovat, že mezi faktory existují rozdíly a pro opice jsou tyto úlohy odlišné svou obtížností. Nejjednodušší je rozpoznání tvaru, velikost způsobuje naopak největší problémy. Zvolený test prokázal signifikantní rozdíl mezi barvou a velikostí, tvarem a velikostí.

Nenašli jste co jste hledali?

Pro univerzity jsou k dispozici speciální produkty v rámci Univerzitního programu

Kontaktní formulář

*tyto položky prosíme vyplňte