Hvad er ANOVA (Analysis Of Variance) og hvad kan jeg bruge det til?

Hvad er ANOVA?

ANOVA står for Analysis Of Variance. Det er en statistisk test, der blev udviklet af Ronald Fisher i 1918 og har været anvendt lige siden. Kort sagt fortæller ANOVA dig, om der er statistiske forskelle mellem middelværdierne for tre eller flere uafhængige grupper.

Envejs ANOVA er den mest grundlæggende form. Der findes andre varianter, som kan bruges i forskellige situationer, herunder:

  • Two-way ANOVA
  • Factorial ANOVA
  • Welch’s F-test ANOVA
  • Ranked ANOVA
  • Games-Howell pairwise test

Hvordan virker ANOVA?

Som t-testen hjælper ANOVA dig med at finde ud af, om forskellene mellem grupper af data er statistisk signifikante. Den fungerer ved at analysere variansniveauerne inden for grupperne ved hjælp af stikprøver, der er udtaget fra hver af dem.

Hvis der er stor varians (spredning af data væk fra gennemsnittet) inden for datagrupperne, er der større chance for, at gennemsnittet af en stikprøve, der er udvalgt fra dataene, vil være anderledes på grund af tilfældigheder.

Selvom man ser på variansen inden for datagrupperne, tager ANOVA hensyn til stikprøvens størrelse (jo større stikprøven er, jo mindre chance vil der være for at udvælge outliers for stikprøven ved en tilfældighed) og forskellene mellem stikprøvens gennemsnit (hvis der er stor afstand mellem stikprøvernes gennemsnit, er der større sandsynlighed for, at hele gruppens gennemsnit også vil være det).

Alle disse elementer kombineres til en F-værdi, som derefter kan analyseres for at give en sandsynlighed (p-værdi) for, om forskellene mellem dine grupper er statistisk signifikante eller ej.

En envejs ANOVA sammenligner virkningerne af en uafhængig variabel (en faktor, der påvirker andre ting) på flere afhængige variabler. Tovejs ANOVA gør det samme, men med mere end én uafhængig variabel, mens en faktoriel ANOVA udvider antallet af uafhængige variabler yderligere.

Hvordan kan ANOVA hjælpe?

Envejs ANOVA kan hjælpe dig med at finde ud af, om der er signifikante forskelle mellem middelværdierne for dine uafhængige variabler eller ej.

Hvorfor er det nyttigt?

For når du forstår, hvordan hver enkelt uafhængig variabels gennemsnit er forskellig fra de andre, kan du begynde at forstå, hvilke af dem der har en forbindelse til din afhængige variabel (f.eks. klik på landingssiden) og begynde at lære, hvad der driver denne adfærd.

Du kan også vende tingene om og se, om en enkelt uafhængig variabel (f.eks. temperatur) påvirker flere afhængige variabler (f.eks. købsrater af solcreme, deltagelse i udendørs arrangementer og sandsynligheden for at holde en madlavning), og i så fald hvilke.

Hvornår kan du bruge ANOVA?

Du kan bruge variansanalyse (ANOVA) som marketingmedarbejder, når du ønsker at teste en bestemt hypotese. Du ville bruge ANOVA til at hjælpe dig med at forstå, hvordan dine forskellige grupper reagerer, med en nulhypotese for testen om, at de forskellige gruppers gennemsnit er lige store. Hvis der er et statistisk signifikant resultat, betyder det, at de to populationer er ulige (eller forskellige).

Eksempler på brug af ANOVA

Du vil måske bruge ANOVA til at hjælpe dig med at besvare spørgsmål som dette:

Har alder, køn eller indkomst en effekt på, hvor meget en person bruger i din butik om måneden?

For at besvare dette spørgsmål kan du bruge en faktoriel ANOVA, da du har tre uafhængige variabler og én afhængig variabel. Du skal indsamle data for forskellige aldersgrupper (f.eks. 0-20, 21-40, 41-70, 71+), forskellige indkomstkategorier og alle relevante køn. En tovejs ANOVA kan derefter samtidig vurdere virkningen af disse variabler på din afhængige variabel (udgifter) og afgøre, om de gør en forskel.

Har civilstand (enlig, gift, fraskilt, enke) indflydelse på humøret?

For at besvare dette spørgsmål kan du bruge en envejs ANOVA, da du har en enkelt uafhængig variabel (civilstand). Du vil have 4 datagrupper, en for hver af civilstandskategorierne, og for hver gruppe vil du se på stemningsscorer for at se, om der er en forskel mellem gennemsnittene.

Når du forstår, hvordan grupperne inden for den uafhængige variabel adskiller sig fra hinanden (f.eks. enke eller single, ikke gift eller skilt), kan du begynde at forstå, hvilken af dem der har en sammenhæng med din afhængige variabel (humør).

Du skal dog være opmærksom på, at ANOVA kun fortæller dig, at de gennemsnitlige humørscorer på tværs af alle grupper er ens eller ikke er ens. Den fortæller dig ikke, hvilken gruppe der har en signifikant højere eller lavere gennemsnitlig humørscore.

Forstå ANOVA-forudsætninger

Som andre typer statistiske test sammenligner ANOVA middelværdierne for forskellige grupper og viser dig, om der er statistiske forskelle mellem middelværdierne. ANOVA er klassificeret som en omnibus-teststatistik. Det betyder, at den ikke kan fortælle dig, hvilke specifikke grupper der var statistisk signifikant forskellige fra hinanden, men kun at mindst to af grupperne var det.

Det er vigtigt at huske, at det vigtigste ANOVA-undersøgelsesspørgsmål er, om prøvens gennemsnit stammer fra forskellige populationer. Der er to antagelser, som ANOVA hviler på:

  1. Uanset hvilken teknik der anvendes til dataindsamling, er observationerne inden for hver population i stikprøven normalt fordelt.
  2. Populationen i stikprøven har en fælles varians på s2.

Typer af ANOVA

Fra den grundlæggende envejs ANOVA til variationer for særlige tilfælde, såsom rangeret ANOVA for ikke-kategoriske variabler, er der en række forskellige tilgange til at bruge ANOVA til din dataanalyse. Her er en introduktion til nogle af de mest almindelige.

Hvad er forskellen mellem envejs og tovejs ANOVA-test?

Dette er defineret ved, hvor mange uafhængige variabler der indgår i ANOVA-testen. Envejs betyder, at variansanalysen har én uafhængig variabel. To-vejs betyder, at testen har to uafhængige variabler. Et eksempel på dette kan være, at den uafhængige variabel er et drikkevaremærke (envejs), eller uafhængige variabler af drikkevaremærke og hvor mange kalorier det har, eller om det er originalt eller light.

Factorial ANOVA

Factorial ANOVA er et paraplybegreb, der dækker ANOVA-tests med to eller flere uafhængige kategoriske variabler. (En tovejs ANOVA er faktisk en slags faktoriel ANOVA.) Kategorisk betyder, at variablerne udtrykkes i form af ikke-hierarkiske kategorier (som Mountain Dew vs. Dr Pepper) i stedet for at anvende en rangordnet skala eller en numerisk værdi.

Welch’s F-test ANOVA

Stats iQ anbefaler en uklassificeret Welch’s F-test, hvis flere antagelser om dataene holder:

  • Stikprøvestørrelsen er større end 10 gange antallet af grupper i beregningen (grupper med kun én værdi er udelukket), og derfor opfylder det centrale grænseteorem kravet om normalfordelte data.
  • Der er få eller ingen outliers i de kontinuerte/diskrete data.

I modsætning til den lidt mere almindelige F-test for lige varianser antager Welchs F-test ikke, at varianserne for de grupper, der sammenlignes, er lige store. Antagelsen om lige varianser fører til mindre præcise resultater, når varianserne faktisk ikke er lige store, og dens resultater er meget ens, når varianserne faktisk er lige store.

Ranked ANOVA

Når antagelserne overtrædes, er den u-rankede ANOVA muligvis ikke længere gyldig. I så fald anbefaler Stats iQ den rangordnede ANOVA (også kaldet “ANOVA on ranks”); Stats iQ rangtransformerer dataene (erstatter værdierne med deres rangorden) og kører derefter den samme ANOVA på de transformerede data.

Den rangordnede ANOVA er robust over for outliers og ikke-normalt fordelte data. Rangtransformation er en veletableret metode til beskyttelse mod overtrædelse af antagelser (en “ikke-parametrisk” metode) og ses oftest i forskellen mellem Pearson- og Spearman-korrelationerne. Rangtransformation efterfulgt af Welch’s F-test har samme effekt som Kruskal-Wallis-testen.

Bemærk, at Stats iQ’s rangordnede og urangordnede ANOVA-effektstørrelser (Cohen’s f) beregnes ved hjælp af F-værdien fra F-testen for lige varianser.

Games-Howell parvis test

Stats iQ kører Games-Howell-test uanset resultatet af ANOVA-testen (i overensstemmelse med Zimmerman, 2010). Stats iQ viser uklassificerede eller rangordnede Games-Howell parvise tests baseret på de samme kriterier som dem, der anvendes til rangordnede vs. uklassificerede ANOVA, så hvis du ser “Ranked ANOVA” i det avancerede output, vil de parvise tests også være rangordnede.

Games-Howell er i det væsentlige en t-test for ulige varianser, der tager højde for den øgede sandsynlighed for at finde statistisk signifikante resultater ved en tilfældighed, når man kører mange parvise tests. I modsætning til den lidt mere almindelige Tukey’s b-test antager Games-Howell-testen ikke, at varianserne for de grupper, der sammenlignes, er lige store. Antagelsen om lige varianser fører til mindre præcise resultater, når varianserne faktisk ikke er lige store, og dens resultater er meget ens, når varianserne faktisk er lige store (Howell, 2012).

Bemærk, at mens den uklassificerede parvise test tester for lighed mellem de to gruppers gennemsnit, tester den rangordnede parvise test ikke eksplicit for forskelle mellem gruppernes gennemsnit eller medianer. Den tester snarere for en generel tendens til, at den ene gruppe har større værdier end den anden.

Dertil kommer, at mens Stats iQ ikke viser resultaterne af parvise test for en gruppe med færre end fire værdier, er disse grupper inkluderet i beregningen af frihedsgrader for de andre parvise test.

Sådan udfører du en ANOVA-test

Som med mange af de ældre statistiske test er det muligt at udføre ANOVA ved hjælp af en manuel beregning baseret på formler. Du kan også udføre ANOVA ved hjælp af en række populære statistiksoftwarepakker og -systemer, f.eks. R, SPSS eller Minitab. En nyere udvikling er at bruge automatiserede værktøjer som Stats iQ fra Qualtrics, som gør statistisk analyse mere tilgængelig og ukompliceret end nogensinde før.

Stats iQ og ANOVA

Stats iQ fra Qualtrics kan hjælpe dig med at udføre en ANOVA-test. Når du vælger en kategorisk variabel med tre eller flere grupper og en kontinuerlig eller diskret variabel, kører Stats iQ en envejs ANOVA (Welchs F-test) og en række parvise “post hoc”-test (Games-Howell-test).

Den envejs ANOVA tester for et generelt forhold mellem de to variabler, og de parvise test tester hvert muligt par af grupper for at se, om den ene gruppe har en tendens til at have højere værdier end den anden.

Sådan kører du en ANOVA-test via Stats iQ

Den samlede Stat-test af gennemsnit i Stats iQ fungerer som en ANOVA, der tester forholdet mellem en kategorisk og en numerisk variabel ved at teste forskellene mellem to eller flere gennemsnit. Denne test producerer en p-værdi for at afgøre, om forholdet er signifikant eller ej.

For at køre en ANOVA i StatsiQ skal du tage følgende trin:

  • Vælg en variabel med 3+ grupper og en med tal
  • Vælg “Relate”
  • Du får derefter en ANOVA, en relateret “effektstørrelse” og et simpelt, letforståeligt resumé

Qualtrics Crosstabs og ANOVA

Du kan også køre en ANOVA-test via Qualtrics Crosstabs-funktionen. Her er hvordan:

  • Sørg for, at din “banner”-variabel (kolonne) har 3+ grupper, og at din “stub”-variabel (rækker) har tal (som alder) eller numeriske omkodninger (som “Meget tilfreds” = 7)
  • Vælg “Overall stat test of averages”
  • Du vil se en grundlæggende ANOVA p-værdi

Hvad er begrænsningerne ved ANOVA?

Selv om ANOVA hjælper dig med at analysere forskellen i gennemsnit mellem to uafhængige variabler, vil den ikke fortælle dig, hvilke statistiske grupper der var forskellige fra hinanden. Hvis din test returnerer en signifikant F-statistik (den værdi, du får, når du udfører en ANOVA-test), skal du muligvis udføre en ad hoc-test (som f.eks. testen Least Significant Difference) for at fortælle dig præcis, hvilke grupper der havde en forskel i midlerne.

Supplerende overvejelser med ANOVA

  • Med mindre stikprøvestørrelser kan dataene inspiceres visuelt for at afgøre, om de rent faktisk er normalfordelte; hvis de er det, er resultaterne af den uklassificerede t-test stadig gyldige, selv for små stikprøver. I praksis kan denne vurdering være vanskelig at foretage, så Stats iQ anbefaler som standard rangordnede t-tests for små stikprøver.
  • Med større stikprøvestørrelser er der mindre sandsynlighed for, at outliers påvirker resultaterne negativt. Stats iQ bruger Tukeys “ydre hegn” til at definere outliers som punkter, der ligger mere end tre gange intrakvartilområdet over det 75. eller under det 25. percentilpunkt.
  • Data som “Højeste fuldførte uddannelsesniveau” eller “Slutrækkefølge i maraton” er entydigt ordinale. Selv om Likert-skalaer (som f.eks. en skala fra 1 til 7, hvor 1 er meget utilfreds og 7 er meget tilfreds) teknisk set er ordinale, er det almindelig praksis i samfundsvidenskaberne at behandle dem som om de er kontinuerte (dvs, med en uklassificeret t-test).

Læs mere om yderligere statistiske analysetyper:

  • Conjoint Analysis
  • T-Tests
  • CrossTab Analysis
  • Cluster Analysis
  • Factor Analysis