Vad är ANOVA (Variansanalys) och vad kan jag använda den till?

Vad är ANOVA?

ANOVA står för Variansanalys. Det är ett statistiskt test som utvecklades av Ronald Fisher 1918 och har använts sedan dess. Enkelt uttryckt säger ANOVA om det finns några statistiska skillnader mellan medelvärdena för tre eller flera oberoende grupper.

Envägs ANOVA är den mest grundläggande formen. Det finns andra varianter som kan användas i olika situationer, bland annat:

  • Tvåvägs ANOVA
  • Faktoriell ANOVA
  • Welchs F-test ANOVA
  • Rankad ANOVA
  • Games-Howell parvis test

Hur fungerar ANOVA?

Likt t-testet hjälper ANOVA dig att ta reda på om skillnaderna mellan grupper av data är statistiskt signifikanta. Det fungerar genom att analysera variansnivåerna inom grupperna genom stickprov från var och en av dem.

Om det finns mycket varians (spridning av data bort från medelvärdet) inom datagrupperna är det större chans att medelvärdet för ett stickprov som valts ut från data kommer att skilja sig åt på grund av slumpen.

Som man tittar på variansen inom datagrupperna tar ANOVA hänsyn till urvalets storlek (ju större urvalet är, desto mindre chans finns det att man av en slump väljer utfallare för urvalet) och skillnaderna mellan urvalets medelvärden (om medelvärdena för urvalet ligger långt ifrån varandra är det mer troligt att medelvärdena för hela gruppen också kommer att göra det).

Alla dessa element kombineras till ett F-värde, som sedan kan analyseras för att ge en sannolikhet (p-värde) för om skillnaderna mellan dina grupper är statistiskt signifikanta eller inte.

En envägs ANOVA jämför effekterna av en oberoende variabel (en faktor som påverkar andra saker) på flera beroende variabler. Tvåvägs ANOVA gör samma sak, men med mer än en oberoende variabel, medan en faktoriell ANOVA utökar antalet oberoende variabler ytterligare.

Hur kan ANOVA hjälpa till?

Envägs ANOVA kan hjälpa dig att veta om det finns signifikanta skillnader mellan medelvärdena för dina oberoende variabler eller inte.

Varför är det användbart?

När du förstår hur varje oberoende variabels medelvärde skiljer sig från de andra kan du börja förstå vilka av dem som har en koppling till din beroende variabel (t.ex. klick på en landningssida) och börja lära dig vad som driver detta beteende.

Du kan också vända på saken och se om en enskild oberoende variabel (t.ex. temperatur) påverkar flera beroende variabler (t.ex. köpfrekvens av solkräm, närvaro vid utomhusträffar och sannolikheten att anordna en grillfest) och i så fall vilka.

När kan du använda ANOVA?

Som marknadsförare kan du använda analys av varians (ANOVA) när du vill testa en viss hypotes. Du skulle använda ANOVA för att hjälpa dig att förstå hur dina olika grupper reagerar, med en nollhypotes för testet att medelvärdena för de olika grupperna är lika. Om det finns ett statistiskt signifikant resultat betyder det att de två populationerna är ojämna (eller olika).

Exempel på användning av ANOVA

Du kanske vill använda ANOVA för att hjälpa dig att besvara frågor som denna:

Har ålder, kön eller inkomst en effekt på hur mycket någon spenderar i din butik per månad?

För att besvara denna fråga kan en faktoriell ANOVA användas, eftersom du har tre oberoende variabler och en beroende variabel. Du måste samla in data för olika åldersgrupper (t.ex. 0-20, 21-40, 41-70, 71+), olika inkomstklasser och alla relevanta kön. En tvåvägs ANOVA kan sedan samtidigt bedöma effekten av dessa variabler på din beroende variabel (utgifter) och avgöra om de gör en skillnad.

Influerar civilstånd (singel, gift, skild, änkling) på humöret?

För att besvara den här frågan kan du använda en envägs ANOVA, eftersom du har en enda oberoende variabel (civilstånd). Du kommer att ha fyra datagrupper, en för var och en av civilståndskategorierna, och för varje grupp kommer du att titta på humörpoäng för att se om det finns en skillnad mellan medelvärdena.

När du förstår hur grupperna inom den oberoende variabeln skiljer sig åt (t.ex. änka eller singel, ogift eller skild) kan du börja förstå vilken av dem som har ett samband med din beroende variabel (humör).

Du bör dock notera att ANOVA endast kommer att tala om för dig att de genomsnittliga humörpoängen i alla grupper är desamma eller inte är desamma. Den talar inte om för dig vilken grupp som har en signifikant högre eller lägre genomsnittlig humörpoäng.

Förstå ANOVA-antaganden

Likt andra typer av statistiska tester jämför ANOVA medelvärdena för olika grupper och visar om det finns några statistiska skillnader mellan medelvärdena. ANOVA klassificeras som en omnibus teststatistik. Det innebär att den inte kan tala om för dig vilka specifika grupper som var statistiskt signifikant skilda från varandra, bara att minst två av grupperna var det.

Det är viktigt att komma ihåg att ANOVA:s huvudsakliga forskningsfråga är om provmedlen kommer från olika populationer. Det finns två antaganden som ANOVA vilar på:

  1. Oavsett tekniken för datainsamling är observationerna inom varje urvalspopulation normalfördelade.
  2. Utvalspopulationen har en gemensam varians på s2.

Typer av ANOVA

Från den grundläggande envägs-ANOVA till varianter för specialfall, såsom rangordnad ANOVA för icke-kategoriska variabler, finns det en mängd olika tillvägagångssätt för att använda ANOVA för din dataanalys. Här är en introduktion till några av de vanligaste.

Vad är skillnaden mellan envägs- och tvåvägs-ANOVA-test?

Det definieras av hur många oberoende variabler som ingår i ANOVA-testet. Envägs innebär att variansanalysen har en oberoende variabel. Tvåvägs innebär att testet har två oberoende variabler. Ett exempel på detta kan vara att den oberoende variabeln är ett dryckesmärke (envägs), eller oberoende variabler av dryckesmärke och hur många kalorier det har eller om det är original eller light.

Faktoriell ANOVA

Faktoriell ANOVA är ett paraplybegrepp som omfattar ANOVA-tester med två eller fler oberoende kategoriska variabler. (En tvåvägs-ANOVA är faktiskt en typ av faktoriell ANOVA.) Kategorisk betyder att variablerna uttrycks i termer av icke-hierarkiska kategorier (som Mountain Dew vs Dr Pepper) i stället för att använda en rangordnad skala eller ett numeriskt värde.

Welchs F-test ANOVA

Stats iQ rekommenderar ett orankat Welchs F-test om flera antaganden om data håller:

  • Samplestorleken är större än 10 gånger antalet grupper i beräkningen (grupper med endast ett värde utesluts), och därför uppfyller det centrala gränsvärdessatsen kravet på normalfördelade data.
  • Det finns få eller inga outliers i de kontinuerliga/diskreta uppgifterna.

I motsats till det något vanligare F-testet för lika varianser förutsätter Welchs F-test inte att varianserna för de jämförda grupperna är lika. Att anta lika varianser leder till mindre exakta resultat när varianserna i själva verket inte är lika, och dess resultat är mycket likartade när varianserna i själva verket är lika.

Rankad ANOVA

När antagandena överträds kan det hända att den orankade ANOVA:n inte längre är giltig. I det fallet rekommenderar Stats iQ rankad ANOVA (även kallad ”ANOVA on ranks”); Stats iQ rank-transformerar data (ersätter värden med deras rangordning) och kör sedan samma ANOVA på de transformerade data.

Den rankade ANOVA:n är robust mot outliers och icke-normalt fördelade data. Rangtransformation är en väletablerad metod för att skydda mot antagandeöverträdelser (en ”icke-parametrisk” metod) och ses oftast i skillnaden mellan Pearson- och Spearmankorrelationen. Rangtransformation följt av Welchs F-test har samma effekt som Kruskal-Wallis-testet.

Bemärk att Stats iQ:s rangordnade och orangordnade ANOVA-effektstorlekar (Cohen’s f) beräknas med hjälp av F-värdet från F-testet för lika varianser.

Games-Howell parvis test

Stats iQ kör Games-Howell-tester oavsett resultatet av ANOVA-testet (enligt Zimmerman, 2010). Stats iQ visar orankade eller rangordnade Games-Howell parvisa tester baserat på samma kriterier som de som används för rangordnad vs. orankad ANOVA, så om du ser ”Ranked ANOVA” i den avancerade utdatan kommer de parvisa testerna också att vara rangordnade.

Games-Howell är i huvudsak ett t-test för ojämna varianser som tar hänsyn till den ökade sannolikheten för att hitta statistiskt signifikanta resultat av en slump när man kör många parvisa tester. Till skillnad från det något vanligare Tukey’s b-testet utgår Games-Howell-testet inte från att varianserna för de grupper som jämförs är lika stora. Att anta lika varianser leder till mindre exakta resultat när varianserna i själva verket inte är lika, och dess resultat är mycket likartade när varianserna i själva verket är lika (Howell, 2012).

Bemärk att medan det orankade parvisa testet testar likheten mellan de två gruppernas medelvärden, testar det rangordnade parvisa testet inte uttryckligen skillnader mellan gruppernas medelvärden eller medianer. Snarare testar det för en allmän tendens att den ena gruppen har större värden än den andra.

Till detta kommer att även om Stats iQ inte visar resultaten av parvisa tester för någon grupp med färre än fyra värden, inkluderas dessa grupper i beräkningen av frihetsgrader för de andra parvisa testerna.

Hur man utför ett ANOVA-test

Som med många äldre statistiska tester är det möjligt att göra ANOVA med hjälp av en manuell beräkning som baseras på formler. Du kan också utföra ANOVA med hjälp av ett antal populära statistikprogrampaket och system, till exempel R, SPSS eller Minitab. En nyare utveckling är att använda automatiserade verktyg som Stats iQ från Qualtrics, som gör statistisk analys mer lättillgänglig och okomplicerad än någonsin tidigare.

Stats iQ och ANOVA

Stats iQ från Qualtrics kan hjälpa dig att utföra ett ANOVA-test. När du väljer en kategorisk variabel med tre eller fler grupper och en kontinuerlig eller diskret variabel kör Stats iQ en envägs ANOVA (Welchs F-test) och en serie parvisa ”post hoc”-tester (Games-Howell-tester).

Envägs ANOVA testar om det finns ett övergripande samband mellan de två variablerna, och de parvisa testerna testar varje möjligt par av grupper för att se om den ena gruppen tenderar att ha högre värden än den andra.

Hur man kör ett ANOVA-test via Stats iQ

Det övergripande Stat-testet av medelvärden i Stats iQ fungerar som en ANOVA och testar förhållandet mellan en kategorisk och en numerisk variabel genom att testa skillnaderna mellan två eller flera medelvärden. Detta test ger ett p-värde för att avgöra om förhållandet är signifikant eller inte.

För att köra en ANOVA i StatsiQ, gör du följande:

  • Välj en variabel med 3+ grupper och en med siffror
  • Välj ”Relate”
  • Du får då en ANOVA, en relaterad ”effektstorlek” och en enkel, lättförståelig sammanfattning

Qualtrics Crosstabs och ANOVA

Du kan köra ett ANOVA-test via Qualtrics Crosstabs-funktion också. Så här går det till:

  • Säkerställ att din ”banner”-variabel (kolumn) har 3 eller fler grupper och att din ”stub”-variabel (rader) har siffror (t.ex. ålder) eller numeriska omkodningar (t.ex. ”Very Satisfied” = 7)
  • Välj ”Overall stat test of averages”
  • Du kommer att få se ett grundläggande ANOVA-värde

Vad är begränsningarna med ANOVA?

Anova hjälper dig att analysera skillnaden i medelvärden mellan två oberoende variabler, men den talar inte om för dig vilka statistiska grupper som skiljer sig från varandra. Om ditt test ger en signifikant F-statistik (det värde du får när du kör ett ANOVA-test) kan du behöva köra ett ad hoc-test (t.ex. testet Least Significant Difference) för att få reda på exakt vilka grupper som hade en skillnad i medelvärden.

Att ytterligare överväganden med ANOVA

  • Med mindre urvalsstorlekar kan data inspekteras visuellt för att avgöra om de faktiskt är normalfördelade; om de är det är det, är resultaten av oklassade t-test fortfarande giltiga även för små urval. I praktiken kan denna bedömning vara svår att göra, så Stats iQ rekommenderar rangordnade t-test som standard för små urval.
  • Med större urvalsstorlekar är det mindre sannolikt att outliers påverkar resultaten negativt. Stats iQ använder Tukey’s ”outer fence” för att definiera outliers som punkter som är mer än tre gånger intrakvartilområdet över den 75:e eller under den 25:e percentilpunkten.
  • Data som ”Högsta avslutade utbildningsnivå” eller ”Slutordning i maraton” är otvetydigt ordinala. Även om Likert-skalor (t.ex. en skala från 1 till 7 där 1 är mycket missnöjd och 7 är mycket nöjd) tekniskt sett är ordinala, är det vanligt att man inom samhällsvetenskaperna behandlar dem som om de vore kontinuerliga (dvs, med ett oklassat t-test).

Läs mer om ytterligare statistiska analystyper:

  • Konjointanalys
  • T-test
  • Korsanalys
  • Klusteranalys
  • Klusteranalys
  • Faktoranalys