ANOVA (varianssianalyysi):

13 syyskuun, 2021

Mikä on ANOVA?

ANOVA on lyhenne sanoista Analysis of Variance. Se on tilastollinen testi, jonka Ronald Fisher kehitti vuonna 1918 ja joka on ollut käytössä siitä lähtien. Yksinkertaisesti sanottuna ANOVA kertoo, onko kolmen tai useamman riippumattoman ryhmän keskiarvojen välillä tilastollisia eroja.

Yksisuuntainen ANOVA on yksinkertaisin muoto. On olemassa muitakin muunnelmia, joita voidaan käyttää eri tilanteissa, kuten:

Kaksisuuntainen ANOVA
Faktoriaalinen ANOVA
Welchin F-testin ANOVA
Ranking ANOVA
Games-Howellin parittainen testi

Miten ANOVA toimii?

Kuten t-testi, ANOVA auttaa selvittämään, ovatko aineistoryhmien väliset erot tilastollisesti merkitseviä. Se toimii analysoimalla ryhmien sisäisiä varianssitasoja kustakin ryhmästä otettujen otosten avulla.

Jos aineistoryhmien sisällä on paljon varianssia (tietojen hajonta pois keskiarvosta), on todennäköisempää, että aineistosta valitun otoksen keskiarvo poikkeaa sattumasta johtuen.

Niin kuin tarkastellaan varianssia aineistoryhmien sisällä, ANOVA ottaa huomioon otoksen koon (mitä suurempi otos, sitä pienempi mahdollisuus on, että otokseen poimitaan satunnaisesti poikkeavia arvoja) ja otoskeskiarvojen väliset erot (jos otosten keskiarvot ovat kaukana toisistaan, on todennäköisempää, että myös koko ryhmän keskiarvot ovat kaukana toisistaan).

Kaikki nämä elementit yhdistetään F-arvoksi, jota voidaan sitten analysoida, jotta saadaan todennäköisyys (p-arvo) siitä, ovatko ryhmien väliset erot tilastollisesti merkitseviä.

Yksisuuntaisessa ANOVA:ssa verrataan riippumattoman muuttujan (tekijä, joka vaikuttaa muihin asioihin) vaikutuksia useisiin riippuvaisiin muuttujiin. Kaksisuuntainen ANOVA tekee saman asian, mutta useammalla kuin yhdellä riippumattomalla muuttujalla, kun taas faktoriaalinen ANOVA laajentaa riippumattomien muuttujien määrää entisestään.

Miten ANOVA voi auttaa?

Yksisuuntainen ANOVA voi auttaa sinua saamaan selville, onko riippumattomien muuttujien keskiarvojen välillä merkittäviä eroja.

Miksi siitä on hyötyä?

Koska ymmärrät, miten kunkin riippumattoman muuttujan keskiarvo eroaa muista, voit alkaa ymmärtää, millä niistä on yhteys riippuvaiseen muuttujaasi (kuten laskeutumissivun klikkauksiin), ja alkaa oppia, mikä ohjaa kyseistä käyttäytymistä.

Voisit myös kääntää asiat toisin päin ja katsoa, vaikuttaako yksittäinen riippumaton muuttuja (kuten lämpötila) useisiin riippuvaisiin muuttujiin (kuten aurinkovoiteen ostoprosenttiin, ulkoilmapaikoilla käyntiin osallistumiseen ja kokkailun järjestämisen todennäköisyyteen), ja jos vaikuttaa, niin mihin muuttujiin.

Missä tilanteissa voisit käyttää ANOVA-analyysia?

Voit käyttää varianssianalyysia (ANOVA) markkinoijana silloin, kun haluaisit testata tiettyä hypoteesia. Käyttäisit ANOVA:ta auttaaksesi sinua ymmärtämään, miten eri ryhmät reagoivat, ja testin nollahypoteesina olisi, että eri ryhmien keskiarvot ovat yhtä suuret. Jos tulos on tilastollisesti merkitsevä, se tarkoittaa, että nämä kaksi perusjoukkoa ovat eriarvoisia (tai erilaisia).

Esimerkkejä ANOVA:n käytöstä

Voit käyttää ANOVA:ta auttaaksesi sinua vastaamaan seuraavankaltaisiin kysymyksiin:

vaikuttavatko ikä, sukupuoli tai tulot siihen, kuinka paljon joku kuluttaa myymälässäsi kuukaudessa?

Kysymykseen vastaamiseksi voidaan käyttää faktoriaalista ANOVAa, koska sinulla on kolme riippumatonta muuttujaa ja yksi riippuvainen muuttuja. Sinun on kerättävä tietoja eri ikäryhmistä (kuten 0-20, 21-40, 41-70, 71+), eri tuloluokista ja kaikista merkityksellisistä sukupuolista. Kaksisuuntaisella ANOVA:lla voidaan sitten arvioida samanaikaisesti näiden muuttujien vaikutusta riippuvaiseen muuttujaan (menot) ja määrittää, onko niillä eroa.

Vaikuttaako siviilisääty (naimaton, naimisissa, eronnut, leski) mielialaan?

Vastaaksesi tähän voit käyttää yksisuuntaista ANOVA:ta, koska sinulla on yksi riippumaton muuttuja (siviilisääty). Sinulla on neljä aineistoryhmää, yksi kullekin siviilisääty-luokalle, ja jokaisen osalta tarkastelet mielialapisteitä nähdäksesi, onko keskiarvojen välillä eroa.

Kun ymmärrät, miten riippumattoman muuttujan sisällä olevat ryhmät eroavat toisistaan (esimerkiksi leski tai sinkku, ei naimisissa tai eronnut), voit alkaa ymmärtää, millä niistä on yhteys riippuvaiseen muuttujaasi (mielialaan).

Huomaa kuitenkin, että ANOVA kertoo sinulle vain sen, että kaikkien ryhmien keskimääräiset mielialapistemäärät ovat samat tai eivät ole samat. Se ei kerro sinulle, millä ryhmällä on merkitsevästi korkeampi tai matalampi keskimääräinen mielialapistemäärä.

ANOVA-oletusten ymmärtäminen

Kuten muunkinlaiset tilastolliset testit, ANOVA vertaa eri ryhmien keskiarvoja ja näyttää, onko keskiarvojen välillä tilastollisia eroja. ANOVA luokitellaan omnibustilastoksi. Tämä tarkoittaa sitä, että se ei voi kertoa, mitkä tietyt ryhmät erosivat tilastollisesti merkitsevästi toisistaan, vaan ainoastaan sen, että vähintään kaksi ryhmää erosi tilastollisesti merkitsevästi toisistaan.

On tärkeää muistaa, että ANOVA:n tärkein tutkimuskysymys on se, ovatko otoskeskiarvot eri populaatioista. On kaksi oletusta, joihin ANOVA perustuu:

Aineistonkeruutekniikasta riippumatta kunkin otospopulaation sisällä olevat havainnot ovat normaalijakautuneita.
Otokseen otetulla populaatiolla on yhteinen varianssi s2.

ANOVA:n tyypit

Yksisuuntaisen ANOVA:n perusversiosta erikoistapausten variaatioihin, kuten luokittelemattomien muuttujien ranked ANOVA:han, ANOVA:n käyttämiseen data-analyysissä on monenlaisia lähestymistapoja. Seuraavassa esitellään joitakin yleisimpiä.

Mitä eroa on yksisuuntaisen ja kaksisuuntaisen ANOVA-testin välillä?

Ero määritellään sen mukaan, kuinka monta riippumatonta muuttujaa ANOVA-testissä on mukana. Yksisuuntainen tarkoittaa, että varianssianalyysissä on yksi riippumaton muuttuja. Kaksisuuntainen tarkoittaa, että testissä on kaksi riippumatonta muuttujaa. Esimerkkinä tästä voi olla, että riippumaton muuttuja on juomamerkki (yksisuuntainen) tai riippumattomat muuttujat juomamerkki ja kuinka monta kaloria siinä on tai onko se alkuperäistä vai laihdutusjuomaa.

Faktoriaalinen ANOVA

Faktoriaalinen ANOVA on sateenvarjotermi, joka kattaa ANOVA-testit, joissa on kaksi tai useampi riippumaton kategorinen muuttuja. (Kaksisuuntainen ANOVA on itse asiassa eräänlainen faktoriaalinen ANOVA.) Kategorinen tarkoittaa, että muuttujat ilmaistaan ei-hierarkkisten luokkien avulla (kuten Mountain Dew vs. Dr Pepper) sen sijaan, että käytettäisiin luokiteltua asteikkoa tai numeerista arvoa.

Welchin F-testi ANOVA

Stats iQ suosittelee luokittelematonta Welchin F-testiä, jos useat aineistoa koskevat oletukset pitävät paikkansa:

Otoksen koko on suurempi kuin 10 kertaa ryhmien lukumäärä laskennassa (ryhmät, joissa on vain yksi arvo, jätetään pois), ja näin ollen Central Limit Theorem (keskusrajateoreema) täyttää normaalisti jakautuneen aineiston vaatimuksen.
Jatkuvassa/diskreetissä aineistossa on vähän tai ei lainkaan outliereitä.

Ei Welchin F-testi oleta, että vertailtavien ryhmien varianssit ovat yhtä suuret, toisin kuin hieman yleisempi F-testi yhtäläisille variansseille. Yhtäläisten varianssien olettaminen johtaa epätarkempiin tuloksiin silloin, kun varianssit eivät todellisuudessa ole yhtäläisiä, ja sen tulokset ovat hyvin samankaltaisia silloin, kun varianssit todella ovat yhtäläisiä.

Ranking ANOVA

Kun oletuksia rikotaan, rankkaamaton ANOVA ei välttämättä ole enää pätevä. Tällöin Stats iQ suosittelee ranked ANOVA:ta (kutsutaan myös nimellä ”ANOVA on ranks”); Stats iQ rank-transformoi datan (korvaa arvot niiden rank-järjestyksellä) ja suorittaa sitten saman ANOVA:n kyseiselle transformoidulle datalle.

Ranked ANOVA on vankka poikkeaville arvoille ja epänormaalisti jakautuneelle datalle. Rank-muunnos on vakiintunut menetelmä, jolla suojaudutaan olettamusten rikkomiselta (”ei-parametrinen” menetelmä), ja se on yleisimmin nähtävissä Pearsonin ja Spearmanin korrelaatioiden välisessä erossa. Rank-muunnos, jota seuraa Welchin F-testi, on vaikutukseltaan samanlainen kuin Kruskal-Wallisin testi.

Huomaa, että Stats iQ:n rankatut ja rankkaamattomat ANOVA-vaikutuskoot (Cohenin f) lasketaan käyttäen F-arvoa, joka saadaan F-testillä yhtäläisiä variansseja varten.

Games-Howellin pareittainen testi

Stats iQ suorittaa Games-Howellin testejä ANOVA-testin lopputuloksesta riippumatta (Zimmermanin 2010 mukaan). Stats iQ näyttää sijoittamattomat tai sijoittuneet Games-Howellin parittaiset testit samojen kriteerien perusteella kuin mitä käytetään sijoittuneelle vs. sijoittamattomalle ANOVA:lle, joten jos näet ”Ranked ANOVA” (sijoittunut ANOVA) edistyneessä tulosteessa, myös parittaiset testit ovat sijoittuneita.

Games-Howell on pohjimmiltaan t-testi epätasa-arvoisille variansseille, joka ottaa huomioon sen, että kun ajetaan monia parittaisia testejä, tilastollisesti merkitsevien tuloksien löytyminen sattumalta on todennäköisempää. Toisin kuin hieman yleisempi Tukeyn b-testi, Games-Howellin testi ei oleta, että vertailtavien ryhmien varianssit ovat samat. Yhtäläisten varianssien olettaminen johtaa epätarkempiin tuloksiin silloin, kun varianssit eivät todellisuudessa ole yhtäläisiä, ja sen tulokset ovat hyvin samankaltaisia silloin, kun varianssit ovat todellisuudessa yhtäläisiä (Howell, 2012).

Huomaa, että siinä missä järjestämätön parikohtainen testi testaa kahden ryhmän keskiarvojen yhtäläisyyttä, järjestetty parikohtainen testi ei testaa eksplisiittisesti ryhmien keskiarvojen tai mediaanien välisiä eroja. Pikemminkin se testaa yhden ryhmän yleistä taipumusta saada suurempia arvoja kuin toinen ryhmä.

Lisäksi, vaikka Stats iQ ei näytä pareittaisten testien tuloksia millekään ryhmälle, jossa on alle neljä arvoa, nämä ryhmät otetaan mukaan muiden pareittaisten testien vapausasteita laskettaessa.

Miten ANOVA-testi tehdään

Kuten monien vanhempien tilastollisten testien kohdalla, ANOVA-testiä on mahdollista tehdä manuaalisesti laskemalla se kaavojen perusteella. Voit myös suorittaa ANOVA-testin käyttämällä mitä tahansa suosittuja tilasto-ohjelmistopaketteja ja -järjestelmiä, kuten R:ää, SPSS:ää tai Minitabia. Viimeaikainen kehityssuunta on automaattisten työkalujen, kuten Qualtricsin Stats iQ:n, käyttäminen, jotka tekevät tilastollisesta analyysistä helpommin lähestyttävää ja suoraviivaisempaa kuin koskaan aikaisemmin.

Stats iQ ja ANOVA

Stats iQ Qualtricsista voi auttaa sinua ANOVA-testin suorittamisessa. Kun valitset yhden kategorisen muuttujan, jossa on kolme tai useampia ryhmiä, ja yhden jatkuvan tai diskreetin muuttujan, Stats iQ suorittaa yksisuuntaisen ANOVA-analyysin (Welchin F-testi) ja sarjan pareittaisia ”post hoc” -testejä (Games-Howellin testit).

Yksisuuntaisella ANOVA-analyysillä testataan näiden kahden muuttujan yleistä suhdetta toisiinsa, ja pareittaisilla testeillä testataan jokaisen mahdollisen ryhmäparin kohdalla sitä, onko jollakulla ryhmällä taipumus saada korkeammat arvot kuin toisella.

How to run an ANOVA test through Stats iQ

The Overall Stat Test of Averages in Stats iQ acts as an ANOVA, testing the relationship between a categorical and a numberic variable by testing the differences between two or more means. Tämä testi tuottaa p-arvon, jolla määritetään, onko suhde merkitsevä vai ei.

Voit suorittaa ANOVA:n StatsiQ:ssa seuraavasti:

Valitse muuttuja, jossa on 3+ ryhmää ja yksi, jossa on numeroita
Valitse ”Relate”
Sitten saat ANOVA:n, siihen liittyvän ”efektikoon” ja yksinkertaisen, helposti ymmärrettävän yhteenvedon

Qualtricsin ristiintaulukot (Crosstabs) ja ANOVA

Voit suorittaa ANOVA-testin myös Qualtricsin ristiintaulukot-toiminnolla. Näin toimitaan:

Varmista, että ”banner”-muuttujallasi (sarakkeella) on 3+ ryhmää ja ”stub”-muuttujallasi (riveillä) on numeroita (kuten Ikä) tai numeerisia uudelleenkoodeja (kuten ”Erittäin tyytyväinen” = 7)
Valitse ”Overall stat test of averages”
Näet ANOVA:n perustason p-arvon

Mitkä ovat ANOVA:n rajoitukset?

Vaikka ANOVA auttaa sinua analysoimaan kahden riippumattoman muuttujan keskiarvojen eroa, se ei kerro, mitkä tilastolliset ryhmät erosivat toisistaan. Jos testisi palauttaa merkitsevän F-statistiikan (arvo, jonka saat suorittaessasi ANOVA-testin), saatat joutua suorittamaan ad hoc -testin (kuten Least Significant Difference -testin) kertoaksesi tarkalleen, mitkä ryhmät erosivat keskiarvoissa.

Lisähuomioita ANOVA:n kanssa

Vähäisemmillä otoskokoluokilla aineisto voidaan tarkastaa silmämääräisesti sen määrittämiseksi, onko se itse asiassa normaalisti jakautunut; jos se on, järjestämättömän t-testin tulokset ovat edelleen päteviä myös pienillä otoksilla. Käytännössä tämän arvioinnin tekeminen voi olla vaikeaa, joten Stats iQ suosittelee oletusarvoisesti luokiteltuja t-testejä pienille otoksille.
Suurilla otoskoolla poikkeamat vaikuttavat tuloksiin vähemmän todennäköisesti negatiivisesti. Stats iQ käyttää Tukeyn ”ulompaa aitaa” määrittelemään outlierit pisteiksi, jotka ovat yli kolme kertaa kvartiilin sisäistä vaihteluväliä 75. prosenttipisteen yläpuolella tai 25. prosenttipisteen alapuolella.
Tiedot, kuten ”Korkein suoritettu koulutustaso” tai ”Maalijärjestys maratonilla”, ovat yksiselitteisesti ordinaalisia. Vaikka Likertin asteikot (kuten asteikko 1-7, jossa 1 on erittäin tyytymätön ja 7 on erittäin tyytyväinen) ovat teknisesti ordinaalisia, yhteiskuntatieteissä on yleinen käytäntö käsitellä niitä ikään kuin ne olisivat jatkuvia (ts, luokittelemattomalla t-testillä).

Lue lisää muista tilastollisista analyysityypeistä:

Conjoint-analyysi
T-testit
CrossTab-analyysi
Cluster-analyysi
Faktorianalyysi

Savage Rose

Mikä on ANOVA (varianssianalyysi) ja mihin sitä voi käyttää?