Mi az ANOVA (Analysis Of Variance) és mire használhatom?

Mi az ANOVA?

Az ANOVA az Analysis of Variance rövidítése. Ez egy statisztikai teszt, amelyet Ronald Fisher fejlesztett ki 1918-ban, és azóta is használják. Leegyszerűsítve, az ANOVA megmondja, hogy van-e statisztikai különbség három vagy több független csoport átlagai között.

Az egyutas ANOVA a legalapvetőbb forma. Vannak más változatok is, amelyeket különböző helyzetekben lehet használni, például:

  • Kétirányú ANOVA
  • Faktorális ANOVA
  • Welch F-teszt ANOVA
  • Rangsorolt ANOVA
  • Games-Howell páros teszt

Hogyan működik az ANOVA?

A t-próbához hasonlóan az ANOVA is segít kideríteni, hogy az adatcsoportok közötti különbségek statisztikailag szignifikánsak-e. Úgy működik, hogy a csoportokon belüli varianciaszinteket elemzi az egyes csoportokból vett mintákon keresztül.

Ha az adatcsoportokon belül nagy a variancia (az adatok szórása az átlagtól), akkor nagyobb az esélye annak, hogy az adatokból kiválasztott minta átlaga véletlenszerűen eltér.

Az ANOVA az adatcsoportokon belüli variancia vizsgálata mellett figyelembe veszi a minta méretét (minél nagyobb a minta, annál kisebb az esélye annak, hogy véletlenszerűen kiugró értékeket választunk ki a mintából) és a minták átlagai közötti különbségeket (ha a minták átlagai messze vannak egymástól, akkor valószínűbb, hogy az egész csoport átlagai is azok lesznek).

Mindezeket az elemeket F-értékké kombináljuk, amelyet aztán elemezve megadható a valószínűség (p-érték) arra vonatkozóan, hogy a csoportok közötti különbségek statisztikailag szignifikánsak-e.

Az egyirányú ANOVA egy független változó (más dolgokat befolyásoló tényező) hatását hasonlítja össze több függő változóra. A kétutas ANOVA ugyanezt teszi, de egynél több független változóval, míg a faktoriális ANOVA még tovább bővíti a független változók számát.

Hogyan segíthet az ANOVA?

Az egyutas ANOVA segítségével megtudhatja, hogy vannak-e szignifikáns különbségek a független változók átlagai között.

Miért hasznos ez?

Mert ha megérti, hogy az egyes független változók átlaga hogyan különbözik a többitől, akkor elkezdheti megérteni, hogy melyiküknek van kapcsolata a függő változójával (például a céloldali kattintásokkal), és elkezdheti megtudni, hogy mi irányítja ezt a viselkedést.

A dolgot meg is fordíthatja, és megnézheti, hogy egyetlen független változó (például a hőmérséklet) hatással van-e több függő változóra (például a naptej vásárlási arányára, a szabadtéri rendezvények látogatottságára és a főzőverseny megtartásának valószínűségére), és ha igen, melyekre.

Mikor használhatja az ANOVA-t?

Marketingesként akkor használhatja az ANOVA-t (Analysis of Variance), ha egy adott hipotézist szeretne tesztelni. Az ANOVA-t arra használná, hogy megértse, hogyan reagálnak a különböző csoportok, és a teszthez nullhipotézist állítana fel, miszerint a különböző csoportok átlagai egyenlők. Ha statisztikailag szignifikáns eredmény születik, akkor ez azt jelenti, hogy a két populáció egyenlőtlen (vagy különböző).

Példák az ANOVA használatára

Az ANOVA-t az alábbi kérdések megválaszolásához használhatja:

A kor, a nem vagy a jövedelem hatással van-e arra, hogy valaki mennyit költ az üzletében havonta?

A kérdés megválaszolásához faktoriális ANOVA-t használhat, mivel három független változója és egy függő változója van. Különböző korcsoportokra (például 0-20, 21-40, 41-70, 71+), különböző jövedelmi kategóriákra és az összes releváns nemre vonatkozóan kell adatokat gyűjtenie. Egy kétirányú ANOVA-val ezután egyszerre értékelheti ezeknek a változóknak a függő változóra (kiadások) gyakorolt hatását, és meghatározhatja, hogy ezek különbséget tesznek-e.

A családi állapot (egyedülálló, házas, elvált, özvegy) befolyásolja-e a hangulatot?

Az erre adott válaszhoz egyirányú ANOVA-t használhat, mivel egyetlen független változója van (családi állapot). 4 adatcsoportod lesz, egy-egy a családi állapot kategóriákhoz, és mindegyiknél a hangulati pontszámokat fogod vizsgálni, hogy megnézd, van-e különbség az átlagok között.

Ha megérti, hogy a független változón belül a csoportok hogyan különböznek egymástól (például özvegy vagy egyedülálló, nem házas vagy elvált), akkor elkezdheti megérteni, hogy ezek közül melyiknek van kapcsolata a függő változóval (hangulat).

Meg kell azonban jegyeznie, hogy az ANOVA csak azt mondja meg, hogy az összes csoport átlagos hangulatpontszámai azonosak vagy nem azonosak. Nem mondja meg, hogy melyik csoportnak van szignifikánsan magasabb vagy alacsonyabb átlagos hangulati pontszáma.

Az ANOVA-feltevések megértése

Az ANOVA más típusú statisztikai tesztekhez hasonlóan összehasonlítja a különböző csoportok átlagait, és megmutatja, hogy vannak-e statisztikai különbségek az átlagok között. Az ANOVA-t az omnibusz tesztstatisztikák közé sorolják. Ez azt jelenti, hogy nem tudja megmondani, hogy mely konkrét csoportok különböztek statisztikailag szignifikánsan egymástól, csak azt, hogy legalább két csoport különbözött egymástól.

Nem szabad elfelejtenünk, hogy az ANOVA fő kutatási kérdése az, hogy a minta átlagai különböző populációkból származnak-e? Az ANOVA két feltételezésen alapul:

  1. Az adatgyűjtés technikájától függetlenül az egyes mintavételezett populáción belüli megfigyelések normális eloszlásúak.
  2. A mintavételezett populáció közös varianciája s2.

Az ANOVA típusai

Az alapvető egyutas ANOVA-tól a speciális esetekre vonatkozó változatokig, mint például a rangsorolt ANOVA a nem kategorikus változók esetében, sokféle megközelítés létezik az ANOVA használatára az adatelemzéshez. Az alábbiakban bemutatunk néhányat a leggyakoribbak közül.

Mi a különbség az egyutas és a kétutas ANOVA-tesztek között?

Ezt az határozza meg, hogy hány független változót tartalmaz az ANOVA-teszt. Az egyirányú azt jelenti, hogy a varianciaanalízis egy független változót tartalmaz. A kétutas azt jelenti, hogy a tesztnek két független változója van. Erre példa lehet, hogy a független változó az ital márkája (egyirányú), vagy független változók az ital márkája és az, hogy hány kalóriát tartalmaz, vagy hogy eredeti vagy diétás.

Faktoriális ANOVA

A faktoriális ANOVA egy gyűjtőfogalom, amely két vagy több független kategorikus változóval végzett ANOVA-teszteket foglal magában. (A kétirányú ANOVA valójában egyfajta faktoriális ANOVA.) A kategorikus azt jelenti, hogy a változókat nem hierarchikus kategóriák (például Mountain Dew vs Dr Pepper) szerint fejezik ki, nem pedig rangsorolt skála vagy számérték segítségével.

Welch’s F Test ANOVA

A Stats iQ a rangsorolatlan Welch’s F tesztet ajánlja, ha az adatokkal kapcsolatban több feltételezés is érvényesül:

  • A mintanagyság nagyobb, mint a számításban szereplő csoportok számának tízszerese (a csak egy értékkel rendelkező csoportokat kizárjuk), és ezért a központi határértéktétel kielégíti a normális eloszlású adatok követelményét.
  • A folytonos/diszkrét adatokban kevés vagy nincs kiugró érték.

A valamivel gyakoribb, egyenlő szórásokra vonatkozó F-teszttel ellentétben a Welch-féle F-teszt nem feltételezi, hogy az összehasonlított csoportok szórása egyenlő. Az egyenlő varianciák feltételezése kevésbé pontos eredményekhez vezet, ha a varianciák valójában nem egyenlőek, és eredményei nagyon hasonlóak, ha a varianciák valóban egyenlőek.

Rangsorolt ANOVA

Ha a feltételezések sérülnek, a rangsorolatlan ANOVA már nem feltétlenül érvényes. Ebben az esetben a Stats iQ a rangsorolt ANOVA-t (más néven “rangsorolt ANOVA”) ajánlja; a Stats iQ rangsoroltan transzformálja az adatokat (az értékeket a rangsorolásukkal helyettesíti), majd lefuttatja ugyanazt az ANOVA-t az átalakított adatokon.

A rangsorolt ANOVA robusztus a kiugró értékekkel és a nem normális eloszlású adatokkal szemben. A rangsor-transzformáció egy jól bevált módszer a feltételezések megsértése elleni védelemre (“nemparametrikus” módszer), és leggyakrabban a Pearson- és Spearman-korreláció közötti különbségben látható. A Welch-féle F-teszt által követett rangtranszformáció hasonló hatású, mint a Kruskal-Wallis-teszt.

Megjegyezzük, hogy a Stats iQ rangsorolt és rangsorolatlan ANOVA hatásméretei (Cohen f) az egyenlő varianciákra vonatkozó F-teszt F-értékének felhasználásával kerülnek kiszámításra.

Games-Howell páros teszt

A Stats iQ az ANOVA-teszt eredményétől függetlenül Games-Howell teszteket futtat (Zimmerman, 2010 szerint). A Stats iQ a rangsorolatlan vagy rangsorolt Games-Howell páros teszteket ugyanazok alapján mutatja meg, mint a rangsorolt vs. rangsorolatlan ANOVA esetében, így ha a bővített kimeneten a “Rangsorolt ANOVA” feliratot látja, a páros tesztek is rangsoroltak lesznek.

A Games-Howell lényegében egy t-próba egyenlőtlen varianciákra, amely figyelembe veszi a sok páros teszt futtatásakor a véletlenből származó statisztikailag szignifikáns eredmények megtalálásának megnövekedett valószínűségét. A kissé elterjedtebb Tukey-féle b-teszttel ellentétben a Games-Howell-teszt nem feltételezi, hogy az összehasonlított csoportok szórása egyenlő. Az egyenlő varianciák feltételezése kevésbé pontos eredményekhez vezet, ha a varianciák valójában nem egyenlőek, és eredményei nagyon hasonlóak, ha a varianciák valóban egyenlőek (Howell, 2012).

Megjegyzendő, hogy míg a rangsorolatlan páros teszt a két csoport átlagainak egyenlőségét vizsgálja, a rangsorolt páros teszt nem teszteli kifejezetten a csoportok átlagai vagy mediánjai közötti különbségeket. Inkább azt vizsgálja, hogy az egyik csoport általános tendenciája nagyobb értékeket mutat-e, mint a másiké.

Kiegészítésképpen, bár a Stats iQ nem mutatja a négynél kevesebb értéket tartalmazó csoportok páronkénti tesztjeinek eredményeit, ezek a csoportok szerepelnek a többi páronkénti teszt szabadságfokainak kiszámításánál.

Hogyan végezhetünk ANOVA-tesztet

Mint sok régebbi statisztikai teszt esetében, az ANOVA-t is el lehet végezni képleteken alapuló kézi számítással. Az ANOVA-t bármelyik népszerű statisztikai szoftvercsomag és rendszer, például az R, az SPSS vagy a Minitab segítségével is elvégezheti. Újabb fejlemény az olyan automatizált eszközök használata, mint a Qualtrics által kínált Stats iQ, amelyek minden eddiginél hozzáférhetőbbé és egyszerűbbé teszik a statisztikai elemzést.

Stats iQ és ANOVA

A Qualtrics által kínált Stats iQ segíthet az ANOVA teszt futtatásában. Ha kiválaszt egy kategorikus változót három vagy több csoporttal és egy folytonos vagy diszkrét változót, a Stats iQ lefuttat egy egyirányú ANOVA-t (Welch F-teszt) és egy sor páros “post hoc” tesztet (Games-Howell-tesztek).

Az egyirányú ANOVA a két változó közötti általános kapcsolatot vizsgálja, a páros tesztek pedig minden lehetséges csoportpárt megvizsgálnak, hogy az egyik csoport hajlamos-e magasabb értékekkel rendelkezni, mint a másik.

Hogyan futtathatunk ANOVA-tesztet a Stats iQ segítségével

A Stats iQ-ban található Overall Stat Test of Averages úgy működik, mint egy ANOVA, egy kategorikus és egy numerikus változó közötti kapcsolatot teszteli két vagy több átlag közötti különbség vizsgálatával. Ez a teszt p-értéket eredményez annak megállapítására, hogy a kapcsolat szignifikáns-e vagy sem.

Az ANOVA futtatásához a StatsiQ-ban a következő lépéseket kell tennie:

  • Válasszon ki egy változót 3+ csoporttal és egy számokkal
  • Válassza a “Relate”-t
  • Ezután kap egy ANOVA-t, egy kapcsolódó “hatásméretet” és egy egyszerű, könnyen érthető összefoglalót

Qualtrics Crosstabs és ANOVA

A Qualtrics Crosstabs funkcióján keresztül is futtathat ANOVA tesztet. Íme, hogyan:

  • Győződjön meg róla, hogy a “banner” (oszlop) változója 3+ csoportot tartalmaz, és a “stub” (sorok) változója számokat (mint az életkor) vagy numerikus átkódolásokat (mint a “Nagyon elégedett” = 7)
  • Válassza ki az “Overall stat test of averages”
  • Egy alapvető ANOVA p-értéket fog látni

Melyek az ANOVA korlátai?

Míg az ANOVA segít elemezni két független változó közötti átlagkülönbséget, nem fogja megmondani, hogy mely statisztikai csoportok különböztek egymástól. Ha a tesztje szignifikáns F-statisztikát ad vissza (az ANOVA teszt futtatásakor kapott értéket), akkor szükség lehet egy ad hoc teszt futtatására (például a legkisebb szignifikáns különbség tesztjére), hogy pontosan megmondja, mely csoportok átlagai között volt különbség.

Kiegészítő megfontolások az ANOVA-val kapcsolatban

  • Kisebb mintanagyság esetén az adatok vizuálisan megvizsgálhatók annak megállapítására, hogy valóban normális eloszlásúak-e; ha igen, akkor a rangsorolatlan t-próba eredményei kis minták esetén is érvényesek. A gyakorlatban ezt az értékelést nehéz lehet elvégezni, ezért a Stats iQ kis minták esetén alapértelmezésben a rangsorolt t-teszteket ajánlja.
  • Nagyobb mintaméretek esetén a kiugró értékek kevésbé valószínű, hogy negatívan befolyásolják az eredményeket. A Stats iQ a Tukey-féle “külső kerítést” használja a kiugró értékek meghatározására, mint a 75. percentilis pont feletti vagy a 25. percentilis pont alatti intrakvartilis tartomány háromszorosánál nagyobb pontok.
  • Az olyan adatok, mint a “Legmagasabb befejezett iskolai végzettség” vagy a “Befejezési sorrend a maratonon” egyértelműen ordinálisak. Bár a Likert-skálák (mint például az 1-től 7-ig terjedő skála, ahol az 1 a nagyon elégedetlen és a 7 a nagyon elégedett) technikailag ordinálisak, a társadalomtudományokban bevett gyakorlat, hogy úgy kezelik őket, mintha folytonosak lennének (pl., rangsorolatlan t-próbával).

Bővebben további statisztikai elemzéstípusokról:

  • Conjoint Analysis
  • T-Tests
  • CrossTab Analysis
  • Cluster Analysis
  • Factor Analysis