Ce este ANOVA (Analysis Of Variance) și la ce o pot folosi?

Ce este ANOVA?

ANOVA înseamnă Analiza Varianței. Este un test statistic care a fost dezvoltat de Ronald Fisher în 1918 și a fost folosit de atunci. Pe scurt, ANOVA vă spune dacă există diferențe statistice între mediile a trei sau mai multe grupuri independente.

ANOVA cu o singură cale este cea mai de bază formă. Există și alte variante care pot fi folosite în diferite situații, inclusiv:

  • AnOVA în două direcții
  • AnOVA factorială
  • AnOVA cu testul F al lui Welch
  • AnOVA clasificată
  • Testul perechilor Games-Howell

Cum funcționează ANOVA?

Ca și testul t, ANOVA vă ajută să aflați dacă diferențele dintre grupurile de date sunt semnificative din punct de vedere statistic. Funcționează prin analizarea nivelurilor de varianță din cadrul grupurilor prin intermediul unor eșantioane prelevate din fiecare dintre ele.

Dacă există o mare varianță (răspândirea datelor departe de medie) în cadrul grupurilor de date, atunci există mai multe șanse ca media unui eșantion selectat din date să fie diferită din întâmplare.

Pe lângă faptul că analizează varianța în cadrul grupurilor de date, ANOVA ia în considerare dimensiunea eșantionului (cu cât eșantionul este mai mare, cu atât mai puține șanse vor fi de a alege valori aberante pentru eșantion din întâmplare) și diferențele dintre mediile eșantioanelor (dacă mediile eșantioanelor sunt foarte îndepărtate, este mai probabil ca și mediile întregului grup să fie la fel).

Toate aceste elemente sunt combinate într-o valoare F, care poate fi apoi analizată pentru a oferi o probabilitate (p-vale) de a ști dacă diferențele dintre grupurile dumneavoastră sunt sau nu semnificative din punct de vedere statistic.

O ANOVA cu o singură direcție compară efectele unei variabile independente (un factor care influențează alte lucruri) asupra mai multor variabile dependente. ANOVA cu două căi face același lucru, dar cu mai mult de o variabilă independentă, în timp ce o ANOVA factorială extinde și mai mult numărul de variabile independente.

Cum vă poate ajuta ANOVA?

AnOVA cu o singură cale vă poate ajuta să știți dacă există sau nu diferențe semnificative între mediile variabilelor dumneavoastră independente.

De ce este acest lucru util?

Pentru că atunci când înțelegeți cum media fiecărei variabile independente este diferită de celelalte, puteți începe să înțelegeți care dintre ele are o legătură cu variabila dvs. dependentă (cum ar fi clicurile pe pagina de destinație) și puteți începe să aflați ce determină acest comportament.

Ați putea, de asemenea, să răsturnați lucrurile și să vedeți dacă o singură variabilă independentă (cum ar fi temperatura) afectează sau nu mai multe variabile dependente (cum ar fi ratele de cumpărare a cremei de soare, participarea la localuri în aer liber și probabilitatea de a organiza o petrecere la grătar) și, dacă da, care dintre ele.

Când ați putea folosi ANOVA?

Ați putea folosi Analiza varianței (ANOVA) în calitate de marketer atunci când doriți să testați o anumită ipoteză. Ați folosi ANOVA pentru a vă ajuta să înțelegeți cum răspund diferitele grupuri, cu o ipoteză nulă pentru testul conform căreia mediile diferitelor grupuri sunt egale. Dacă există un rezultat semnificativ din punct de vedere statistic, atunci înseamnă că cele două populații sunt inegale (sau diferite).

Exemple de utilizare a ANOVA

S-ar putea să doriți să utilizați ANOVA pentru a vă ajuta să răspundeți la întrebări precum aceasta:

Vârsta, sexul sau venitul au un efect asupra sumei cheltuite de cineva în magazinul dumneavoastră pe lună?

Pentru a răspunde la această întrebare, se poate folosi o ANOVA factorială, deoarece aveți trei variabile independente și o variabilă dependentă. Va trebui să colectați date pentru diferite grupe de vârstă (cum ar fi 0-20, 21-40, 41-70, 71+), diferite tranșe de venit și toate sexele relevante. O ANOVA cu două căi poate evalua apoi simultan efectul acestor variabile asupra variabilei dumneavoastră dependente (cheltuielile) și poate determina dacă acestea fac diferența.

Afectează starea civilă (singur, căsătorit, divorțat, văduv) starea de spirit?

Pentru a răspunde la această întrebare, puteți folosi o ANOVA cu o singură cale, deoarece aveți o singură variabilă independentă (starea civilă). Veți avea 4 grupuri de date, unul pentru fiecare dintre categoriile de stare civilă, iar pentru fiecare dintre ele veți analiza scorurile stării de spirit pentru a vedea dacă există o diferență între medii.

Când înțelegeți cum diferă grupurile din cadrul variabilei independente (cum ar fi văduv sau necăsătorit, necăsătorit sau divorțat), puteți începe să înțelegeți care dintre ele are legătură cu variabila dumneavoastră dependentă (starea de spirit).

Totuși, trebuie să rețineți că ANOVA vă va spune doar că scorurile medii ale stării de spirit din toate grupurile sunt aceleași sau nu sunt aceleași. Nu vă va spune care dintre ele are un scor mediu al dispoziției semnificativ mai mare sau mai mic.

Înțelegerea ipotezelor ANOVA

Ca și alte tipuri de teste statistice, ANOVA compară mediile diferitelor grupuri și vă arată dacă există diferențe statistice între medii. ANOVA este clasificată ca un test statistic omnibus. Acest lucru înseamnă că nu vă poate spune ce grupuri specifice au fost semnificativ de diferite din punct de vedere statistic unul față de celălalt, ci doar că cel puțin două dintre grupuri au fost.

Este important să vă amintiți că principala întrebare de cercetare ANOVA este dacă mediile eșantioanelor provin din populații diferite. Există două ipoteze pe care se bazează ANOVA:

  1. Indiferent de tehnica de colectare a datelor, observațiile din cadrul fiecărei populații eșantionate sunt distribuite normal.
  2. Populația eșantionată are o varianță comună de s2.

Tipuri de ANOVA

De la ANOVA unidirecțională de bază până la variantele pentru cazuri speciale, cum ar fi ANOVA clasificată pentru variabile necategoriale, există o varietate de abordări pentru utilizarea ANOVA pentru analiza datelor dumneavoastră. Iată o introducere la unele dintre cele mai comune.

Care este diferența dintre testele ANOVA unidirecționale și bidirecționale?

Este definită de câte variabile independente sunt incluse în testul ANOVA. One-way înseamnă că analiza de varianță are o singură variabilă independentă. Two-way înseamnă că testul are două variabile independente. Un exemplu poate fi ca variabila independentă să fie o marcă de băutură (cu o singură direcție), sau variabile independente de marcă de băutură și câte calorii are sau dacă este originală sau dietetică.

ANOVA factorială

ANOVA factorială este un termen generic care acoperă testele ANOVA cu două sau mai multe variabile categorice independente. (O ANOVA bidirecțională este, de fapt, un fel de ANOVA factorială.) Categorică înseamnă că variabilele sunt exprimate în termeni de categorii neierarhice (cum ar fi Mountain Dew vs. Dr. Pepper), mai degrabă decât folosind o scală clasată sau o valoare numerică.

Testul F al lui Welch ANOVA

Stats iQ recomandă un test F al lui Welch neordonat dacă sunt valabile mai multe ipoteze despre date:

  • Dimensiunea eșantionului este mai mare de 10 ori decât numărul de grupuri din calcul (grupurile cu o singură valoare sunt excluse) și, prin urmare, Teorema limitei centrale satisface cerința pentru date distribuite normal.
  • Există puține sau deloc valori aberante în datele continue/discrete.

În comparație cu testul F puțin mai comun pentru varianțe egale, testul F al lui Welch nu presupune că varianțele grupurilor care sunt comparate sunt egale. Presupunerea varianțelor egale duce la rezultate mai puțin precise atunci când varianțele nu sunt, de fapt, egale, iar rezultatele sale sunt foarte asemănătoare atunci când varianțele sunt de fapt egale.

ANOVA cu rang

Când ipotezele sunt încălcate, ANOVA fără rang poate să nu mai fie valabilă. În acest caz, Stats iQ recomandă ANOVA clasificată (numită și „ANOVA pe ranguri”); Stats iQ transformă datele în funcție de rang (înlocuiește valorile cu ordinea lor de rang) și apoi execută aceeași ANOVA pe aceste date transformate.

AnOVA clasificată este robustă la valorile aberante și la datele distribuite non-normal. Transformarea rangului este o metodă bine stabilită de protecție împotriva încălcării ipotezelor (o metodă „neparametrică”) și este cel mai des întâlnită în diferența dintre corelația Pearson și Spearman. Transformarea rangului urmată de testul F al lui Welch are un efect similar cu cel al testului Kruskal-Wallis.

Rețineți că mărimile efectului ANOVA clasate și neclasificate ale lui Stats iQ (Cohen’s f) sunt calculate folosind valoarea F din testul F pentru varianțe egale.

Games-Howell Pairwise Test

Stats iQ execută testele Games-Howell indiferent de rezultatul testului ANOVA (conform Zimmerman, 2010). Stats iQ afișează testele Games-Howell pe perechi, clasate sau neclasificate, pe baza acelorași criterii ca și cele utilizate pentru ANOVA clasată vs. ANOVA neclasificată, astfel încât, dacă vedeți „Ranked ANOVA” (ANOVA clasată) în rezultatul avansat, testele pe perechi vor fi, de asemenea, clasate.

Testul Games-Howell este, în esență, un test t pentru varianțe inegale care ține cont de probabilitatea crescută de a găsi rezultate semnificative din punct de vedere statistic din întâmplare atunci când se execută multe teste pe perechi. Spre deosebire de testul b al lui Tukey, puțin mai comun, testul Games-Howell nu presupune că varianțele grupurilor comparate sunt egale. Presupunerea unor varianțe egale duce la rezultate mai puțin precise atunci când varianțele nu sunt de fapt egale, iar rezultatele sale sunt foarte asemănătoare atunci când varianțele sunt de fapt egale (Howell, 2012).

Rețineți că, în timp ce testul pe perechi fără clasament testează egalitatea mediilor celor două grupuri, testul pe perechi cu clasament nu testează în mod explicit diferențele dintre mediile sau mediile grupurilor. Mai degrabă, acesta testează o tendință generală a unui grup de a avea valori mai mari decât celălalt.

În plus, în timp ce Stats iQ nu afișează rezultatele testelor pe perechi pentru orice grup cu mai puțin de patru valori, acele grupuri sunt incluse în calcularea gradelor de libertate pentru celelalte teste pe perechi.

Cum se efectuează un test ANOVA

Ca și în cazul multor teste statistice mai vechi, este posibil să se efectueze ANOVA folosind un calcul manual bazat pe formule. De asemenea, puteți efectua ANOVA utilizând orice număr de pachete și sisteme software de statistică populare, cum ar fi R, SPSS sau Minitab. O evoluție mai recentă este utilizarea unor instrumente automatizate, cum ar fi Stats iQ de la Qualtrics, care fac analiza statistică mai accesibilă și mai simplă ca niciodată.

Stats iQ și ANOVA

Stats iQ de la Qualtrics vă poate ajuta să efectuați un test ANOVA. Atunci când selectați o variabilă categorială cu trei sau mai multe grupuri și o variabilă continuă sau discretă, Stats iQ execută o ANOVA într-o singură direcție (testul F al lui Welch) și o serie de teste „post hoc” pe perechi (teste Games-Howell).

AnOVA într-o singură direcție testează o relație generală între cele două variabile, iar testele pe perechi testează fiecare pereche posibilă de grupuri pentru a vedea dacă un grup tinde să aibă valori mai mari decât celălalt.

Cum se execută un test ANOVA prin Stats iQ

Testul statistic general al mediilor din Stats iQ acționează ca o ANOVA, testând relația dintre o variabilă categorială și una numerică prin testarea diferențelor dintre două sau mai multe medii. Acest test produce o valoare p pentru a determina dacă relația este semnificativă sau nu.

Pentru a rula o ANOVA în StatsiQ, parcurgeți următorii pași:

  • Selectați o variabilă cu 3+ grupuri și una cu numere
  • Selectați „Relate”
  • Apoi veți obține o ANOVA, o „mărime a efectului” aferent și un rezumat simplu, ușor de înțeles

Qualtrics Crosstabs and ANOVA

Puteți executa un test ANOVA și prin intermediul funcției Qualtrics Crosstabs. Iată cum:

  • Asigură-te că variabila ta „banner” (coloană) are 3+ grupuri, iar variabila ta „stub” (rânduri) are numere (cum ar fi vârsta) sau recodificări numerice (cum ar fi „Very Satisfied” = 7)
  • Selectează „Overall stat test of medii”
  • Vă veți vedea o valoare p ANOVA de bază

Care sunt limitările ANOVA?

În timp ce ANOVA vă va ajuta să analizați diferența de medii între două variabile independente, nu vă va spune ce grupuri statistice au fost diferite una de cealaltă. În cazul în care testul dvs. returnează o statistică F semnificativă (valoarea pe care o obțineți atunci când efectuați un test ANOVA), este posibil să aveți nevoie să efectuați un test ad hoc (cum ar fi testul Diferența cea mai puțin semnificativă) pentru a vă spune exact ce grupuri au avut o diferență de medii.

Considerații suplimentare cu ANOVA

  • Cu eșantioane de dimensiuni mai mici, datele pot fi inspectate vizual pentru a determina dacă sunt, de fapt, distribuite în mod normal; dacă sunt distribuite normal, rezultatele testelor t neordonate sunt încă valabile chiar și pentru eșantioane mici. În practică, această evaluare poate fi dificil de făcut, astfel încât Stats iQ recomandă testele t clasificate în mod implicit pentru eșantioane mici.
  • Cu dimensiuni mai mari ale eșantioanelor, este mai puțin probabil ca valorile aberante să afecteze negativ rezultatele. Stats iQ utilizează „gardul exterior” al lui Tukey pentru a defini valorile aberante ca fiind puncte de peste trei ori mai mari decât intervalul intraquartil deasupra punctului percentila 75 sau sub punctul percentila 25.
  • Date precum „Cel mai înalt nivel de educație finalizat” sau „Ordinea de sosire la maraton” sunt fără ambiguitate ordinale. Deși scalele Likert (cum ar fi o scală de la 1 la 7 unde 1 este Foarte nemulțumit și 7 este Foarte mulțumit) sunt tehnic ordinale, este o practică obișnuită în științele sociale să le tratăm ca și cum ar fi continue (de ex, cu un test t neordonat).

Citește mai multe despre alte tipuri de analiză statistică:

  • Analiză comună
  • T-Test
  • Analiză încrucișată
  • Analiză cluster
  • Analiză factorială

.