- Wat is ANOVA?
- Hoe werkt ANOVA?
- Hoe kan ANOVA helpen?
- Wanneer zou u ANOVA kunnen gebruiken?
- Voorbeelden van het gebruik van ANOVA
- Hebben leeftijd, geslacht, of inkomen een effect op hoeveel iemand per maand in uw winkel uitgeeft?
- Heeft de burgerlijke staat (alleenstaand, getrouwd, gescheiden, weduwe) invloed op de stemming?
- Uitleg ANOVA-aannames
- Typen ANOVA
- Wat is het verschil tussen one-way en two-way ANOVA-tests?
- Factoriële ANOVA
- Welch’s F Test ANOVA
- Ranked ANOVA
- Games-Howell Pairwise Test
- Hoe voer je een ANOVA-test uit
- Stats iQ en ANOVA
- Hoe voer je een ANOVA-test uit met Stats iQ
- Qualtrics Crosstabs en ANOVA
- Wat zijn de beperkingen van ANOVA?
- Aanvullende overwegingen bij ANOVA
- Lees meer over aanvullende statistische analysetypen:
Wat is ANOVA?
ANOVA staat voor Analysis of Variance. Het is een statistische test die in 1918 door Ronald Fisher werd ontwikkeld en sindsdien in gebruik is. Eenvoudig gezegd, ANOVA vertelt u of er statistische verschillen zijn tussen de gemiddelden van drie of meer onafhankelijke groepen.
Eenzijdige ANOVA is de meest elementaire vorm. Er zijn andere variaties die in verschillende situaties kunnen worden gebruikt, waaronder:
- Tweezijdige ANOVA
- Factoriële ANOVA
- Welch’s F-test ANOVA
- Ranked ANOVA
- Games-Howell-paargewijze test
Hoe werkt ANOVA?
Zoals de t-toets, helpt ANOVA u om uit te vinden of de verschillen tussen groepen gegevens statistisch significant zijn. Het werkt door de niveaus van variantie binnen de groepen te analyseren door middel van steekproeven die uit elk van hen worden genomen.
Als er veel variantie (spreiding van gegevens uit de buurt van het gemiddelde) is binnen de gegevensgroepen, dan is er meer kans dat het gemiddelde van een steekproef die uit de gegevens is geselecteerd, verschillend zal zijn als gevolg van toeval.
Naast de variantie binnen de gegevensgroepen houdt ANOVA ook rekening met de steekproefgrootte (hoe groter de steekproef, hoe kleiner de kans dat er bij toeval uitschieters voor de steekproef worden gekozen) en met de verschillen tussen de steekproefgemiddelden (als de gemiddelden van de steekproeven ver uit elkaar liggen, is de kans groter dat de gemiddelden van de hele groep dat ook zullen zijn).
Al deze elementen worden gecombineerd tot een F-waarde, die vervolgens kan worden geanalyseerd om een waarschijnlijkheid (p-vaue) te geven of verschillen tussen uw groepen statistisch significant zijn of niet.
Een eenweg ANOVA vergelijkt de effecten van een onafhankelijke variabele (een factor die andere dingen beïnvloedt) op meerdere afhankelijke variabelen. Tweeweg ANOVA doet hetzelfde, maar met meer dan één onafhankelijke variabele, terwijl een factorial ANOVA het aantal onafhankelijke variabelen nog verder uitbreidt.
Hoe kan ANOVA helpen?
De eenweg ANOVA kan u helpen te weten of er al dan niet significante verschillen zijn tussen de gemiddelden van uw onafhankelijke variabelen.
Waarom is dat nuttig?
Omdat wanneer u begrijpt hoe het gemiddelde van elke onafhankelijke variabele verschilt van de andere, u kunt beginnen te begrijpen welke van hen een verband heeft met uw afhankelijke variabele (zoals klikken op landingspagina’s) en beginnen te leren wat de drijvende kracht achter dat gedrag is.
U kunt de zaken ook omdraaien en kijken of een enkele onafhankelijke variabele (zoals temperatuur) invloed heeft op meerdere afhankelijke variabelen (zoals de aankoopcijfers van zonnebrandcrème, aanwezigheid bij openluchtgelegenheden en de waarschijnlijkheid om een cook-out te houden) en zo ja, welke.
Wanneer zou u ANOVA kunnen gebruiken?
U als marketeer zou Analysis of Variance (ANOVA) kunnen gebruiken wanneer u een bepaalde hypothese wilt testen. U zou ANOVA gebruiken om u te helpen begrijpen hoe uw verschillende groepen reageren, met een nulhypothese voor de test dat de gemiddelden van de verschillende groepen gelijk zijn. Als er een statistisch significant resultaat is, betekent dit dat de twee populaties ongelijk (of verschillend) zijn.
Voorbeelden van het gebruik van ANOVA
U kunt ANOVA gebruiken om u te helpen vragen als deze te beantwoorden:
Hebben leeftijd, geslacht, of inkomen een effect op hoeveel iemand per maand in uw winkel uitgeeft?
Om deze vraag te beantwoorden, kan een factorial ANOVA worden gebruikt, omdat u drie onafhankelijke variabelen en één afhankelijke variabele hebt. U moet gegevens verzamelen voor verschillende leeftijdsgroepen (zoals 0-20, 21-40, 41-70, 71+), verschillende inkomensklassen, en alle relevante geslachten. Met een tweeweg ANOVA kan dan tegelijkertijd het effect van deze variabelen op uw afhankelijke variabele (uitgaven) worden beoordeeld en kan worden bepaald of zij een verschil maken.
Heeft de burgerlijke staat (alleenstaand, getrouwd, gescheiden, weduwe) invloed op de stemming?
Om deze vraag te beantwoorden, kunt u een eenweg ANOVA gebruiken, omdat u maar één onafhankelijke variabele hebt (burgerlijke staat). U hebt 4 groepen gegevens, één voor elke burgerlijke staat, en voor elke groep bekijkt u de stemmingsscores om te zien of er een verschil is tussen de gemiddelden.
Wanneer je begrijpt hoe de groepen binnen de onafhankelijke variabele verschillen (zoals weduwe of alleenstaande, niet getrouwd of gescheiden), kun je beginnen te begrijpen welke van hen een verband heeft met je afhankelijke variabele (stemming).
Maar je moet opmerken dat ANOVA je alleen zal vertellen dat de gemiddelde stemmingsscores in alle groepen hetzelfde zijn of niet hetzelfde zijn. Het vertelt je niet welke groep een significant hogere of lagere gemiddelde stemmingsscore heeft.
Uitleg ANOVA-aannames
Net als andere soorten statistische tests vergelijkt ANOVA de gemiddelden van verschillende groepen en laat het je zien of er statistische verschillen tussen de gemiddelden zijn. ANOVA wordt geclassificeerd als een omnibus teststatistiek. Dit betekent dat het u niet kan vertellen welke specifieke groepen statistisch significant van elkaar verschilden, alleen dat ten minste twee van de groepen dat waren.
Het is belangrijk om te onthouden dat de belangrijkste ANOVA-onderzoeksvraag is of de steekproefgemiddelden afkomstig zijn van verschillende populaties. Er zijn twee veronderstellingen waarop ANOVA berust:
- Wat de techniek van gegevensverzameling ook is, de waarnemingen binnen elke bemonsterde populatie zijn normaal verdeeld.
- De bemonsterde populatie heeft een gemeenschappelijke variantie van s2.
Typen ANOVA
Van de basis eenweg ANOVA tot de variaties voor speciale gevallen, zoals de gerangschikte ANOVA voor niet-categorische variabelen, zijn er een verscheidenheid aan benaderingen om ANOVA te gebruiken voor uw gegevensanalyse. Hier is een inleiding tot enkele van de meest voorkomende.
Wat is het verschil tussen one-way en two-way ANOVA-tests?
Dit wordt bepaald door hoeveel onafhankelijke variabelen zijn opgenomen in de ANOVA-test. Eenrichtingsverkeer betekent dat de variantieanalyse één onafhankelijke variabele heeft. Twee-weg betekent dat de test twee onafhankelijke variabelen heeft. Een voorbeeld hiervan kan zijn dat de onafhankelijke variabele een merk drank is (eenrichtingsverkeer), of onafhankelijke variabelen van merk drank en hoeveel calorieën het heeft of dat het origineel of dieet is.
Factoriële ANOVA
Factoriële ANOVA is een overkoepelende term die ANOVA-tests met twee of meer onafhankelijke categorische variabelen omvat. (Een bidirectionele ANOVA is eigenlijk een soort factorial ANOVA.) Categorisch betekent dat de variabelen worden uitgedrukt in termen van niet-hiërarchische categorieën (zoals Mountain Dew vs Dr Pepper) in plaats van een gerangschikte schaal of numerieke waarde te gebruiken.
Welch’s F Test ANOVA
Stats iQ beveelt een niet-gerangschikte Welch’s F-test aan als aan een aantal aannames over de gegevens wordt voldaan:
- De steekproefgrootte is groter dan 10 keer het aantal groepen in de berekening (groepen met slechts één waarde worden uitgesloten), en daarom voldoet de Central Limit Theorem aan de eis voor normaal verdeelde gegevens.
- Er zijn weinig of geen uitschieters in de continue/discrete gegevens.
In tegenstelling tot de iets gebruikelijker F-test voor gelijke varianties, gaat de F-test van Welch er niet van uit dat de varianties van de groepen die vergeleken worden gelijk zijn. Het aannemen van gelijke varianties leidt tot minder nauwkeurige resultaten wanneer de varianties in feite niet gelijk zijn, en de resultaten zijn zeer vergelijkbaar wanneer de varianties wel gelijk zijn.
Ranked ANOVA
Wanneer de aannames worden geschonden, kan het zijn dat de unranked ANOVA niet langer geldig is. In dat geval beveelt Stats iQ de gerangschikte ANOVA aan (ook wel “ANOVA op rangen” genoemd); Stats iQ rangschikt de gegevens (vervangt waarden door hun rangvolgorde) en voert vervolgens dezelfde ANOVA uit op die getransformeerde gegevens.
De gerangschikte ANOVA is robuust tegen uitbijters en niet-normaal verdeelde gegevens. Rangtransformatie is een beproefde methode ter bescherming tegen schending van veronderstellingen (een “niet-parametrische” methode) en komt het meest voor in het verschil tussen de Pearson- en de Spearman-correlatie. Rangtransformatie gevolgd door Welch’s F-test is qua effect vergelijkbaar met de Kruskal-Wallis Test.
Merk op dat de gerangschikte en niet-gerangschikte ANOVA-effectgroottes (Cohen’s f) van Stats iQ worden berekend met behulp van de F-waarde uit de F-test voor gelijke varianties.
Games-Howell Pairwise Test
Stats iQ voert Games-Howell-tests uit, ongeacht de uitkomst van de ANOVA-test (zoals per Zimmerman, 2010). Stats iQ toont niet-gerangschikte of gerangschikte Games-Howell paarsgewijze tests op basis van dezelfde criteria als die worden gebruikt voor gerangschikte vs. niet-gerangschikte ANOVA, dus als u “Gerangschikte ANOVA” ziet in de geavanceerde uitvoer, zullen de paarsgewijze tests ook gerangschikt zijn.
De Games-Howell is in wezen een t-toets voor ongelijke varianties die rekening houdt met de verhoogde kans op het vinden van statistisch significante resultaten door toeval bij het uitvoeren van veel paarsgewijze tests. In tegenstelling tot de iets meer gebruikelijke Tukey’s b-toets, gaat de Games-Howell test er niet van uit dat de varianties van de groepen die vergeleken worden gelijk zijn. De aanname van gelijke varianties leidt tot minder nauwkeurige resultaten wanneer de varianties in feite niet gelijk zijn, en de resultaten zijn zeer vergelijkbaar wanneer de varianties wel gelijk zijn (Howell, 2012).
Merk op dat terwijl de niet-gerangschikte paarsgewijze toets de gelijkheid van de gemiddelden van de twee groepen test, de gerangschikte paarsgewijze toets niet expliciet test op verschillen tussen de gemiddelden of medianen van de groepen. In plaats daarvan wordt getest op een algemene tendens dat de ene groep grotere waarden heeft dan de andere.
Hoewel Stats iQ geen resultaten toont van paarsgewijze toetsen voor groepen met minder dan vier waarden, worden die groepen wel meegenomen in de berekening van de vrijheidsgraden voor de andere paarsgewijze toetsen.
Hoe voer je een ANOVA-test uit
Zoals met veel van de oudere statistische toetsen, is het mogelijk om ANOVA uit te voeren met behulp van een handmatige berekening op basis van formules. U kunt de ANOVA ook uitvoeren met behulp van een aantal populaire statistische softwarepakketten en systemen, zoals R, SPSS of Minitab. Een meer recente ontwikkeling is het gebruik van geautomatiseerde tools zoals Stats iQ van Qualtrics, die statistische analyse toegankelijker en eenvoudiger maken dan ooit tevoren.
Stats iQ en ANOVA
Stats iQ van Qualtrics kan je helpen een ANOVA-test uit te voeren. Wanneer u een categorische variabele met drie of meer groepen en een continue of discrete variabele selecteert, voert Stats iQ een eenweg ANOVA (Welch’s F-test) en een reeks paarsgewijze “post hoc” tests (Games-Howell tests) uit.
De eenweg ANOVA test voor een algemene relatie tussen de twee variabelen, en de paarsgewijze tests testen elk mogelijk paar groepen om te zien of de ene groep de neiging heeft om hogere waarden te hebben dan de andere.
Hoe voer je een ANOVA-test uit met Stats iQ
De Overall Stat Test of Averages in Stats iQ werkt als een ANOVA, waarbij de relatie tussen een categorische en een numerieke variabele wordt getest door de verschillen tussen twee of meer gemiddelden te testen. Deze test levert een p-waarde op om te bepalen of het verband significant is of niet.
Om een ANOVA in StatsiQ uit te voeren, neemt u de volgende stappen:
- Selecteer een variabele met 3+ groepen en een met getallen
- Selecteer “Relate”
- U krijgt dan een ANOVA, een gerelateerde “effect size”, en een eenvoudige, makkelijk te begrijpen samenvatting
Qualtrics Crosstabs en ANOVA
U kunt ook een ANOVA test uitvoeren via de Qualtrics Crosstabs functie. Hier staat hoe:
- Zorg ervoor dat je “banner” (kolom) variabele 3+ groepen heeft en dat je “stub” (rijen) variabele getallen heeft (zoals Leeftijd) of numerieke recodes (zoals “Zeer tevreden” = 7)
- Selecteer “Overall stat test of averages”
- Je ziet een basis ANOVA p-waarde
Wat zijn de beperkingen van ANOVA?
Hoewel ANOVA u helpt het verschil in gemiddelden tussen twee onafhankelijke variabelen te analyseren, vertelt het u niet welke statistische groepen van elkaar verschilden. Als uw test een significante F-statistiek oplevert (de waarde die u krijgt wanneer u een ANOVA-test uitvoert), moet u wellicht een ad-hoctest uitvoeren (zoals de test met het kleinst significante verschil) om u precies te vertellen welke groepen een verschil in gemiddelden hadden.
Aanvullende overwegingen bij ANOVA
- Bij kleinere steekproeven kunnen de gegevens visueel worden geïnspecteerd om te bepalen of ze inderdaad normaal verdeeld zijn; als dat het geval is, zijn de resultaten van niet-gerangschikte t-toetsen zelfs voor kleine steekproeven nog steeds geldig. In de praktijk kan deze beoordeling moeilijk zijn, dus Stats iQ beveelt standaard gerangschikte t-tests aan voor kleine steekproeven.
- Met grotere steekproeven is de kans kleiner dat uitschieters de resultaten negatief beïnvloeden. Stats iQ gebruikt de “buitenste omheining” van Tukey om uitschieters te definiëren als punten die meer dan drie keer het intrakwartielbereik boven het 75e of onder het 25e percentielpunt liggen.
- Gegevens zoals “Hoogste voltooide onderwijsniveau” of “Eindvolgorde in marathon” zijn ondubbelzinnig ordinaal. Hoewel Likert-schalen (zoals een schaal van 1 tot 7, waarbij 1 zeer ontevreden en 7 zeer tevreden is) technisch gezien ordinaal zijn, is het in de sociale wetenschappen gebruikelijk ze te behandelen alsof ze continu zijn (d.w.z, met een niet-gerangschikte t-test).
Lees meer over aanvullende statistische analysetypen:
- Conjoint Analysis
- T-Tests
- CrossTab Analysis
- Cluster Analysis
- Factor Analysis