Che cos’è l’ANOVA (Analisi della Varianza) e per cosa posso usarla?

Che cos’è l’ANOVA?

ANOVA sta per Analisi della Varianza. È un test statistico che è stato sviluppato da Ronald Fisher nel 1918 ed è in uso da allora. In parole povere, l’ANOVA ti dice se ci sono differenze statistiche tra le medie di tre o più gruppi indipendenti.

L’ANOVA a una via è la forma più semplice. Ci sono altre varianti che possono essere usate in situazioni diverse, tra cui:

  • AnOVA a due vie
  • AnOVA fattoriale
  • AnOVA con test F di Welch
  • AnOVA classificata
  • Test a coppie Games-Howell

Come funziona l’ANOVA?

Come il test t, l’ANOVA ti aiuta a scoprire se le differenze tra gruppi di dati sono statisticamente significative. Funziona analizzando i livelli di varianza all’interno dei gruppi attraverso campioni presi da ciascuno di essi.

Se c’è molta varianza (diffusione dei dati lontano dalla media) all’interno dei gruppi di dati, allora c’è più possibilità che la media di un campione selezionato dai dati sia diversa per caso.

Oltre a guardare la varianza all’interno dei gruppi di dati, l’ANOVA prende in considerazione la dimensione del campione (più grande è il campione, meno possibilità ci saranno di scegliere outlier per il campione per caso) e le differenze tra le medie dei campioni (se le medie dei campioni sono molto distanti, è più probabile che lo siano anche le medie dell’intero gruppo).

Tutti questi elementi sono combinati in un valore F, che può poi essere analizzato per dare una probabilità (p-vaue) che le differenze tra i gruppi siano o meno statisticamente significative.

Un’ANOVA a una via confronta gli effetti di una variabile indipendente (un fattore che influenza altre cose) su più variabili dipendenti. L’ANOVA a due vie fa la stessa cosa, ma con più di una variabile indipendente, mentre l’ANOVA fattoriale estende ulteriormente il numero di variabili indipendenti.

Come può aiutare l’ANOVA?

L’ANOVA a una via può aiutarti a sapere se ci sono o meno differenze significative tra le medie delle tue variabili indipendenti.

Perché è utile?

Perché quando capisci come la media di ogni variabile indipendente è diversa dalle altre, puoi cominciare a capire quale di esse ha una connessione con la tua variabile dipendente (come i click sulla landing page) e cominciare a imparare cosa sta guidando quel comportamento.

Potresti anche capovolgere le cose e vedere se una singola variabile indipendente (come la temperatura) influisce o meno su più variabili dipendenti (come i tassi di acquisto di crema solare, la partecipazione a locali all’aperto e la probabilità di organizzare una grigliata) e, se sì, quali.

Quando potresti usare l’ANOVA?

Come marketer potresti usare l’analisi della varianza (ANOVA) quando vuoi verificare una particolare ipotesi. Useresti l’ANOVA per aiutarti a capire come rispondono i tuoi diversi gruppi, con un’ipotesi nulla per il test che le medie dei diversi gruppi sono uguali. Se c’è un risultato statisticamente significativo, allora significa che le due popolazioni sono disuguali (o diverse).

Esempi di utilizzo dell’ANOVA

Potresti voler utilizzare l’ANOVA per aiutarti a rispondere a domande come questa:

Età, sesso o reddito hanno un effetto su quanto qualcuno spende nel tuo negozio al mese?

Per rispondere a questa domanda, si può usare un’ANOVA fattoriale, dato che si hanno tre variabili indipendenti e una variabile dipendente. Avrete bisogno di raccogliere dati per diversi gruppi di età (come 0-20, 21-40, 41-70, 71+), diverse fasce di reddito e tutti i sessi interessati. Un’ANOVA a due vie può quindi valutare simultaneamente l’effetto di queste variabili sulla vostra variabile dipendente (la spesa) e determinare se fanno la differenza.

Lo stato civile (single, sposato, divorziato, vedovo) influenza l’umore?

Per rispondere a questa domanda, potete usare un’ANOVA a una via, poiché avete una sola variabile indipendente (lo stato civile). Avrai 4 gruppi di dati, uno per ciascuna delle categorie di stato civile, e per ciascuno di essi guarderai i punteggi dell’umore per vedere se c’è una differenza tra le medie.

Quando capirete come i gruppi all’interno della variabile indipendente differiscono (come vedovi o single, non sposati o divorziati), potrete iniziare a capire quale di essi ha una connessione con la vostra variabile dipendente (l’umore).

Tuttavia, dovete notare che l’ANOVA vi dirà solo che i punteggi medi dell’umore in tutti i gruppi sono uguali o non sono uguali. Non vi dirà quale gruppo ha un punteggio medio dell’umore significativamente più alto o più basso.

Comprendere le ipotesi dell’ANOVA

Come altri tipi di test statistici, l’ANOVA confronta le medie di diversi gruppi e vi mostra se ci sono differenze statistiche tra le medie. L’ANOVA è classificata come un test statistico omnibus. Questo significa che non può dirvi quali gruppi specifici sono statisticamente diversi l’uno dall’altro, ma solo che almeno due dei gruppi lo sono.

È importante ricordare che la domanda principale della ricerca ANOVA è se le medie dei campioni provengono da popolazioni diverse. Ci sono due presupposti su cui poggia l’ANOVA:

  1. Qualunque sia la tecnica di raccolta dei dati, le osservazioni all’interno di ogni popolazione campionata sono normalmente distribuite.
  2. La popolazione campionata ha una varianza comune di s2.

Tipi di ANOVA

Dall’ANOVA di base a senso unico alle variazioni per casi speciali, come l’ANOVA classificata per variabili non categoriche, ci sono una varietà di approcci per usare l’ANOVA per l’analisi dei dati. Ecco un’introduzione ad alcuni dei più comuni.

Qual è la differenza tra i test ANOVA a una via e a due vie?

Questo è definito da quante variabili indipendenti sono incluse nel test ANOVA. A senso unico significa che l’analisi della varianza ha una sola variabile indipendente. A due vie significa che il test ha due variabili indipendenti. Un esempio di questo può essere la variabile indipendente che è una marca di bevanda (a senso unico), o variabili indipendenti di marca di bevanda e quante calorie ha o se è originale o dietetica.

AnOVA fattoriale

L’ANOVA fattoriale è un termine generico che copre i test ANOVA con due o più variabili categoriche indipendenti. (Categorico significa che le variabili sono espresse in termini di categorie non gerarchiche (come Mountain Dew vs Dr Pepper) piuttosto che usare una scala classificata o un valore numerico.

Welch’s F Test ANOVA

Stats iQ raccomanda un test F di Welch non classificato se diverse ipotesi sui dati sono valide:

  • La dimensione del campione è maggiore di 10 volte il numero di gruppi nel calcolo (i gruppi con un solo valore sono esclusi), e quindi il Teorema del limite centrale soddisfa il requisito di dati normalmente distribuiti.
  • Non ci sono pochi o nessun outlier nei dati continui/discreti.

A differenza del leggermente più comune test F per varianze uguali, il test F di Welch non presuppone che le varianze dei gruppi da confrontare siano uguali. Assumere varianze uguali porta a risultati meno accurati quando le varianze non sono, di fatto, uguali, e i suoi risultati sono molto simili quando le varianze sono effettivamente uguali.

AnOVA classificata

Quando le ipotesi sono violate, l’ANOVA non classificata può non essere più valida. In tal caso, Stats iQ raccomanda l’ANOVA classificata (chiamata anche “ANOVA su ranghi”); Stats iQ trasforma i dati in ranghi (sostituisce i valori con il loro ordine di rango) e poi esegue la stessa ANOVA su quei dati trasformati.

L’ANOVA classificata è robusta agli outlier e ai dati distribuiti in modo non normale. La trasformazione dei ranghi è un metodo consolidato per la protezione contro la violazione delle assunzioni (un metodo “non parametrico”) ed è più comunemente visto nella differenza tra la correlazione di Pearson e Spearman. La trasformazione dei ranghi seguita dal test F di Welch ha un effetto simile al test di Kruskal-Wallis.

Nota che le dimensioni degli effetti ANOVA classificati e non classificati di Stats iQ (Cohen’s f) sono calcolati usando il valore F del test F per varianze uguali.

Games-Howell Pairwise Test

Stats iQ esegue i test Games-Howell indipendentemente dal risultato del test ANOVA (come da Zimmerman, 2010). Stats iQ mostra i test a coppie Games-Howell non classificati o classificati in base agli stessi criteri utilizzati per l’ANOVA classificata o non classificata, quindi se si vede “Ranked ANOVA” nell’output avanzato, anche i test a coppie saranno classificati.

Il Games-Howell è essenzialmente un test t per varianze disuguali che tiene conto della maggiore probabilità di trovare risultati statisticamente significativi per caso quando si eseguono molti test a coppie. A differenza del leggermente più comune Tukey’s b-test, il test Games-Howell non presuppone che le varianze dei gruppi da confrontare siano uguali. Assumere varianze uguali porta a risultati meno accurati quando le varianze non sono di fatto uguali, e i suoi risultati sono molto simili quando le varianze sono effettivamente uguali (Howell, 2012).

Nota che mentre il test a coppie non classificato verifica l’uguaglianza delle medie dei due gruppi, il test a coppie classificato non verifica esplicitamente le differenze tra le medie o mediane dei gruppi. Piuttosto, verifica la tendenza generale di un gruppo ad avere valori più grandi dell’altro.

Inoltre, mentre Stats iQ non mostra i risultati dei test a coppie per qualsiasi gruppo con meno di quattro valori, questi gruppi sono inclusi nel calcolo dei gradi di libertà per gli altri test a coppie.

Come eseguire un test ANOVA

Come per molti dei vecchi test statistici, è possibile eseguire l’ANOVA usando un calcolo manuale basato su formule. È anche possibile eseguire l’ANOVA usando un qualsiasi numero di pacchetti e sistemi software statistici popolari, come R, SPSS o Minitab. Uno sviluppo più recente è l’uso di strumenti automatizzati come Stats iQ di Qualtrics, che rendono l’analisi statistica più accessibile e semplice che mai.

Stats iQ e ANOVA

Stats iQ di Qualtrics può aiutarti a eseguire un test ANOVA. Quando selezioni una variabile categorica con tre o più gruppi e una variabile continua o discreta, Stats iQ esegue un’ANOVA a senso unico (test F di Welch) e una serie di test “post hoc” a coppie (test Games-Howell).

L’ANOVA a senso unico verifica una relazione complessiva tra le due variabili, e i test a coppie verificano ogni possibile coppia di gruppi per vedere se un gruppo tende ad avere valori più alti dell’altro.

Come eseguire un test ANOVA attraverso Stats iQ

Il test statistico globale delle medie in Stats iQ agisce come un ANOVA, testando la relazione tra una variabile categorica e una numerica testando le differenze tra due o più medie. Questo test produce un p-value per determinare se la relazione è significativa o meno.

Per eseguire un’ANOVA in StatsiQ, eseguite i seguenti passi:

  • Seleziona una variabile con 3+ gruppi e una con numeri
  • Seleziona “Relaziona”
  • Allora otterrai un’ANOVA, una relativa “dimensione dell’effetto”, e un riassunto semplice e facile da capire

Qualtrics Crosstabs e ANOVA

Puoi eseguire un test ANOVA anche attraverso la funzione Crosstabs di Qualtrics. Ecco come:

  • Assicurati che la tua variabile “banner” (colonna) abbia 3+ gruppi e che la tua variabile “stub” (riga) abbia numeri (come l’età) o ricodifiche numeriche (come “Molto soddisfatto” = 7)
  • Seleziona “Test statistico globale delle medie”
  • Vedrai un p-value ANOVA base

Quali sono i limiti dell’ANOVA?

Sebbene l’ANOVA ti aiuti ad analizzare la differenza di media tra due variabili indipendenti, non ti dirà quali gruppi statistici sono diversi tra loro. Se il vostro test restituisce una statistica F significativa (il valore che si ottiene quando si esegue un test ANOVA), potrebbe essere necessario eseguire un test ad hoc (come il test Least Significant Difference) per dirvi esattamente quali gruppi avevano una differenza nelle medie.

Considerazioni aggiuntive con l’ANOVA

  • Con campioni più piccoli, i dati possono essere ispezionati visivamente per determinare se sono effettivamente distribuiti normalmente; se lo sono, i risultati del t-test non graduato sono ancora validi anche per campioni piccoli. In pratica, questa valutazione può essere difficile da fare, quindi Stats iQ raccomanda i test t classificati di default per i campioni piccoli.
  • Con campioni più grandi, è meno probabile che i valori anomali influenzino negativamente i risultati. Stats iQ usa il “recinto esterno” di Tukey per definire i valori anomali come punti superiori a tre volte l’intervallo intraquartile sopra il 75° o sotto il 25° percentile.
  • Dati come “Massimo livello di istruzione completato” o “Ordine di arrivo nella maratona” sono inequivocabilmente ordinali. Anche se le scale Likert (come una scala da 1 a 7 dove 1 è molto insoddisfatto e 7 è molto soddisfatto) sono tecnicamente ordinali, è pratica comune nelle scienze sociali trattarle come se fossero continue (ad es, con un t-test non graduato).

Leggi di più su altri tipi di analisi statistica:

  • Conjoint Analysis
  • T-Test
  • CrossTab Analysis
  • Cluster Analysis
  • Factor Analysis