- Was ist ANOVA?
- Wie funktioniert die ANOVA?
- Wie kann die ANOVA helfen?
- Wann können Sie die ANOVA verwenden?
- Beispiele für die Verwendung von ANOVA
- Wirken sich Alter, Geschlecht oder Einkommen darauf aus, wie viel jemand pro Monat in Ihrem Geschäft ausgibt?
- Wirkt sich der Familienstand (ledig, verheiratet, geschieden, verwitwet) auf die Stimmung aus?
- Verständnis der ANOVA-Annahmen
- Arten der ANOVA
- Was ist der Unterschied zwischen einseitigen und zweiseitigen ANOVA-Tests?
- Faktorielle ANOVA
- Welch’s F Test ANOVA
- Gereihte ANOVA
- Games-Howell-Paartest
- Wie man einen ANOVA-Test durchführt
- Stats iQ und ANOVA
- So führen Sie einen ANOVA-Test mit Stats iQ durch
- Qualtrics Crosstabs und ANOVA
- Was sind die Einschränkungen der ANOVA?
- Zusätzliche Überlegungen zur ANOVA
- Lesen Sie mehr über zusätzliche statistische Analysetypen:
Was ist ANOVA?
ANOVA steht für Analysis of Variance. Es handelt sich um einen statistischen Test, der 1918 von Ronald Fisher entwickelt wurde und seither verwendet wird. Einfach ausgedrückt, zeigt die ANOVA, ob es statistische Unterschiede zwischen den Mittelwerten von drei oder mehr unabhängigen Gruppen gibt.
Die einseitige ANOVA ist die einfachste Form. Es gibt weitere Varianten, die in verschiedenen Situationen verwendet werden können, darunter:
- Zwei-Wege-ANOVA
- Faktorielle ANOVA
- Welch’s F-Test ANOVA
- Rangierte ANOVA
- Games-Howell-Paartest
Wie funktioniert die ANOVA?
Wie der t-Test hilft die ANOVA herauszufinden, ob die Unterschiede zwischen Datengruppen statistisch signifikant sind.
Wenn es eine große Varianz (Streuung der Daten vom Mittelwert weg) innerhalb der Datengruppen gibt, dann ist die Wahrscheinlichkeit größer, dass der Mittelwert einer aus den Daten ausgewählten Stichprobe zufällig unterschiedlich ist.
Die ANOVA berücksichtigt nicht nur die Varianz innerhalb der Datengruppen, sondern auch den Stichprobenumfang (je größer die Stichprobe, desto geringer ist die Wahrscheinlichkeit, dass zufällig Ausreißer für die Stichprobe ausgewählt werden) und die Unterschiede zwischen den Stichprobenmittelwerten (wenn die Mittelwerte der Stichproben weit auseinander liegen, ist es wahrscheinlicher, dass auch die Mittelwerte der gesamten Gruppe weit auseinander liegen).
Alle diese Elemente werden zu einem F-Wert kombiniert, der dann analysiert werden kann, um eine Wahrscheinlichkeit (p-Wert) dafür zu erhalten, ob die Unterschiede zwischen den Gruppen statistisch signifikant sind oder nicht.
Eine einseitige ANOVA vergleicht die Auswirkungen einer unabhängigen Variablen (ein Faktor, der andere Dinge beeinflusst) auf mehrere abhängige Variablen. Die zweifache ANOVA tut dasselbe, aber mit mehr als einer unabhängigen Variablen, während die faktorielle ANOVA die Anzahl der unabhängigen Variablen noch weiter erhöht.
Wie kann die ANOVA helfen?
Die einseitige ANOVA kann Ihnen dabei helfen herauszufinden, ob es signifikante Unterschiede zwischen den Mittelwerten Ihrer unabhängigen Variablen gibt oder nicht.
Warum ist das nützlich?
Wenn Sie verstehen, wie sich die Mittelwerte der einzelnen unabhängigen Variablen von den anderen unterscheiden, können Sie herausfinden, welche von ihnen mit der abhängigen Variable (z. B. Klicks auf die Landing Page) zusammenhängt, und herausfinden, was dieses Verhalten verursacht.
Sie können die Dinge auch umdrehen und herausfinden, ob eine einzelne unabhängige Variable (z. B. die Temperatur) mehrere abhängige Variablen beeinflusst (z. B. die Kaufrate von Sonnencreme, die Anzahl der Besucher von Veranstaltungen im Freien und die Wahrscheinlichkeit, ein Grillfest zu veranstalten), und wenn ja, welche.
Wann können Sie die ANOVA verwenden?
Als Marketingspezialist können Sie die Varianzanalyse (ANOVA) verwenden, wenn Sie eine bestimmte Hypothese testen möchten. Sie würden die ANOVA verwenden, um zu verstehen, wie Ihre verschiedenen Gruppen reagieren, mit einer Nullhypothese für den Test, dass die Mittelwerte der verschiedenen Gruppen gleich sind. Wenn das Ergebnis statistisch signifikant ist, bedeutet dies, dass die beiden Populationen ungleich (oder unterschiedlich) sind.
Beispiele für die Verwendung von ANOVA
Die ANOVA kann Ihnen helfen, Fragen wie diese zu beantworten:
Wirken sich Alter, Geschlecht oder Einkommen darauf aus, wie viel jemand pro Monat in Ihrem Geschäft ausgibt?
Um diese Frage zu beantworten, kann eine faktorielle ANOVA verwendet werden, da Sie drei unabhängige Variablen und eine abhängige Variable haben. Sie müssen Daten für verschiedene Altersgruppen (z. B. 0-20, 21-40, 41-70, 71+), verschiedene Einkommensklassen und alle relevanten Geschlechter erheben. Mit einer zweiseitigen ANOVA können Sie dann gleichzeitig die Auswirkungen dieser Variablen auf Ihre abhängige Variable (Ausgaben) bewerten und feststellen, ob sie einen Unterschied machen.
Wirkt sich der Familienstand (ledig, verheiratet, geschieden, verwitwet) auf die Stimmung aus?
Um diese Frage zu beantworten, können Sie eine einseitige ANOVA verwenden, da Sie nur eine einzige unabhängige Variable haben (Familienstand). Sie werden 4 Datengruppen haben, eine für jede der Familienstandskategorien, und für jede Gruppe werden Sie die Stimmungswerte untersuchen, um zu sehen, ob es einen Unterschied zwischen den Durchschnittswerten gibt.
Wenn Sie verstehen, wie sich die Gruppen innerhalb der unabhängigen Variable unterscheiden (z. B. verwitwet oder ledig, nicht verheiratet oder geschieden), können Sie anfangen zu verstehen, welche von ihnen eine Verbindung zu Ihrer abhängigen Variable (Stimmung) hat.
Sie sollten jedoch beachten, dass die ANOVA Ihnen nur sagt, dass die durchschnittlichen Stimmungswerte über alle Gruppen hinweg gleich sind oder nicht gleich sind. Sie sagt Ihnen nicht, welche Gruppe einen signifikant höheren oder niedrigeren durchschnittlichen Stimmungswert hat.
Verständnis der ANOVA-Annahmen
Wie andere Arten von statistischen Tests vergleicht die ANOVA die Mittelwerte verschiedener Gruppen und zeigt Ihnen, ob es statistische Unterschiede zwischen den Mittelwerten gibt. Die ANOVA wird als eine Omnibus-Teststatistik eingestuft. Das bedeutet, dass sie keine Aussage darüber machen kann, welche Gruppen sich statistisch signifikant voneinander unterscheiden, sondern nur, dass dies bei mindestens zwei der Gruppen der Fall ist.
Es ist wichtig, sich daran zu erinnern, dass die wichtigste Forschungsfrage bei der ANOVA darin besteht, ob die Stichprobenmittelwerte aus verschiedenen Populationen stammen. Es gibt zwei Annahmen, auf denen die ANOVA beruht:
- Unabhängig von der Technik der Datenerhebung sind die Beobachtungen innerhalb jeder Stichprobenpopulation normal verteilt.
- Die Stichprobenpopulation hat eine gemeinsame Varianz von s2.
Arten der ANOVA
Von der grundlegenden einseitigen ANOVA bis hin zu den Varianten für Spezialfälle, wie der gerankten ANOVA für nicht kategoriale Variablen, gibt es eine Vielzahl von Ansätzen zur Verwendung der ANOVA für Ihre Datenanalyse. Hier eine Einführung in einige der gebräuchlichsten Ansätze.
Was ist der Unterschied zwischen einseitigen und zweiseitigen ANOVA-Tests?
Dies wird dadurch definiert, wie viele unabhängige Variablen in den ANOVA-Test einbezogen werden. Einseitig bedeutet, dass die Varianzanalyse eine unabhängige Variable enthält. Zweifach bedeutet, dass der Test zwei unabhängige Variablen enthält. Ein Beispiel dafür ist, dass die unabhängige Variable eine Getränkemarke ist (einseitig), oder unabhängige Variablen der Getränkemarke und wie viele Kalorien sie hat, oder ob sie original oder diätetisch ist.
Faktorielle ANOVA
Faktorielle ANOVA ist ein Oberbegriff, der ANOVA-Tests mit zwei oder mehr unabhängigen kategorialen Variablen umfasst. (Eine zweifache ANOVA ist eigentlich eine Art faktorielle ANOVA.) Kategorial bedeutet, dass die Variablen in Form von nicht-hierarchischen Kategorien ausgedrückt werden (wie Mountain Dew vs. Dr Pepper), anstatt eine Rangskala oder einen numerischen Wert zu verwenden.
Welch’s F Test ANOVA
Stats iQ empfiehlt einen nicht gerankten Welch’s F Test, wenn mehrere Annahmen über die Daten zutreffen:
- Der Stichprobenumfang ist größer als das Zehnfache der Anzahl der Gruppen in der Berechnung (Gruppen mit nur einem Wert werden ausgeschlossen), und daher erfüllt der zentrale Grenzwertsatz die Anforderung an normalverteilte Daten.
- Es gibt wenige oder keine Ausreißer in den kontinuierlichen/diskreten Daten.
Im Gegensatz zu dem etwas häufigeren F-Test für gleiche Varianzen geht der Welch’sche F-Test nicht davon aus, dass die Varianzen der zu vergleichenden Gruppen gleich sind. Die Annahme gleicher Varianzen führt zu weniger genauen Ergebnissen, wenn die Varianzen tatsächlich nicht gleich sind, und die Ergebnisse sind sehr ähnlich, wenn die Varianzen tatsächlich gleich sind.
Gereihte ANOVA
Wenn die Annahmen verletzt werden, ist die ungereihte ANOVA möglicherweise nicht mehr gültig. In diesem Fall empfiehlt Stats iQ die gerankte ANOVA (auch „ANOVA auf Rängen“ genannt); Stats iQ transformiert die Daten in Ränge (ersetzt die Werte durch ihre Rangfolge) und führt dann dieselbe ANOVA auf diesen transformierten Daten durch.
Die gerankte ANOVA ist robust gegenüber Ausreißern und nicht normal verteilten Daten. Die Rangtransformation ist eine bewährte Methode zum Schutz gegen die Verletzung von Annahmen (eine „nichtparametrische“ Methode) und wird am häufigsten bei der Differenz zwischen der Pearson-Korrelation und der Spearman-Korrelation beobachtet. Die Rangtransformation, gefolgt vom Welch’s F-Test, hat eine ähnliche Wirkung wie der Kruskal-Wallis-Test.
Bitte beachten Sie, dass die Effektgrößen (Cohen’s f) der gerankten und nicht gerankten ANOVA von Stats iQ unter Verwendung des F-Wertes aus dem F-Test für gleiche Varianzen berechnet werden.
Games-Howell-Paartest
Stats iQ führt Games-Howell-Tests unabhängig vom Ergebnis des ANOVA-Tests durch (gemäß Zimmerman, 2010). Stats iQ zeigt nicht gerankte oder gerankte Games-Howell-Paartests auf der Grundlage derselben Kriterien an, die für gerankte vs. nicht gerankte ANOVA verwendet werden. Wenn Sie also „Gerankte ANOVA“ in der erweiterten Ausgabe sehen, werden die paarweisen Tests ebenfalls gerankt.
Der Games-Howell-Test ist im Wesentlichen ein t-Test für ungleiche Varianzen, der die erhöhte Wahrscheinlichkeit berücksichtigt, statistisch signifikante Ergebnisse durch Zufall zu finden, wenn viele paarweise Tests durchgeführt werden. Anders als der etwas gebräuchlichere Tukey’s b-Test geht der Games-Howell-Test nicht davon aus, dass die Varianzen der zu vergleichenden Gruppen gleich sind. Die Annahme gleicher Varianzen führt zu weniger genauen Ergebnissen, wenn die Varianzen tatsächlich nicht gleich sind, und die Ergebnisse sind sehr ähnlich, wenn die Varianzen tatsächlich gleich sind (Howell, 2012).
Beachten Sie, dass, während der ungereihte paarweise Test auf die Gleichheit der Mittelwerte der beiden Gruppen testet, der gerankte paarweise Test nicht ausdrücklich auf Unterschiede zwischen den Mittelwerten oder Medianen der Gruppen testet. Er testet vielmehr auf eine allgemeine Tendenz, dass eine Gruppe größere Werte hat als die andere.
Außerdem zeigt Stats iQ zwar keine Ergebnisse von paarweisen Tests für Gruppen mit weniger als vier Werten an, aber diese Gruppen werden bei der Berechnung der Freiheitsgrade für die anderen paarweisen Tests berücksichtigt.
Wie man einen ANOVA-Test durchführt
Wie bei vielen der älteren statistischen Tests ist es möglich, die ANOVA mit einer manuellen Berechnung auf der Grundlage von Formeln durchzuführen. Sie können die ANOVA auch mit einer beliebigen Anzahl gängiger Statistiksoftwarepakete und -systeme durchführen, wie z. B. R, SPSS oder Minitab. Eine neuere Entwicklung ist die Verwendung automatisierter Tools wie Stats iQ von Qualtrics, die die statistische Analyse zugänglicher und einfacher machen als je zuvor.
Stats iQ und ANOVA
Stats iQ von Qualtrics kann Ihnen helfen, einen ANOVA-Test durchzuführen. Wenn Sie eine kategoriale Variable mit drei oder mehr Gruppen und eine kontinuierliche oder diskrete Variable auswählen, führt Stats iQ eine einseitige ANOVA (Welch’s F-Test) und eine Reihe von paarweisen „Post-hoc“-Tests (Games-Howell-Tests) durch.
Die einseitige ANOVA testet auf eine allgemeine Beziehung zwischen den beiden Variablen, und die paarweisen Tests testen jedes mögliche Gruppenpaar, um festzustellen, ob eine Gruppe tendenziell höhere Werte als die andere hat.
So führen Sie einen ANOVA-Test mit Stats iQ durch
Der Gesamtstat-Test der Mittelwerte in Stats iQ funktioniert wie eine ANOVA und testet die Beziehung zwischen einer kategorialen und einer numerischen Variablen, indem er die Unterschiede zwischen zwei oder mehr Mittelwerten testet. Dieser Test liefert einen p-Wert, um festzustellen, ob die Beziehung signifikant ist oder nicht.
Um eine ANOVA in StatsiQ durchzuführen, gehen Sie wie folgt vor:
- Wählen Sie eine Variable mit 3+ Gruppen und eine mit Zahlen
- Wählen Sie „Relate“
- Sie erhalten dann eine ANOVA, eine zugehörige „Effektgröße“ und eine einfache, leicht verständliche Zusammenfassung
Qualtrics Crosstabs und ANOVA
Sie können einen ANOVA-Test auch über die Qualtrics Crosstabs-Funktion durchführen. So geht’s:
- Stellen Sie sicher, dass Ihre „Banner“-Variable (Spalte) 3+ Gruppen hat und Ihre „Stub“-Variable (Zeilen) Zahlen (wie Alter) oder numerische Umkodierungen (wie „Sehr zufrieden“ = 7)
- Wählen Sie „Gesamtstatistik-Test der Mittelwerte“
- Sie sehen einen einfachen ANOVA p-Wert
Was sind die Einschränkungen der ANOVA?
Die ANOVA hilft Ihnen zwar bei der Analyse des Mittelwertunterschieds zwischen zwei unabhängigen Variablen, aber sie sagt Ihnen nicht, welche statistischen Gruppen sich voneinander unterscheiden. Wenn Ihr Test eine signifikante F-Statistik ergibt (der Wert, den Sie erhalten, wenn Sie einen ANOVA-Test durchführen), müssen Sie möglicherweise einen Ad-hoc-Test durchführen (wie den Test der kleinsten signifikanten Differenz), um genau festzustellen, welche Gruppen einen Unterschied in den Mittelwerten hatten.
Zusätzliche Überlegungen zur ANOVA
- Bei kleineren Stichprobengrößen können die Daten visuell überprüft werden, um festzustellen, ob sie tatsächlich normalverteilt sind; wenn dies der Fall ist, sind die Ergebnisse des nicht gerankten t-Tests auch bei kleinen Stichproben gültig. In der Praxis kann diese Beurteilung schwierig sein, so dass Stats iQ bei kleinen Stichproben standardmäßig gerankte t-Tests empfiehlt.
- Bei größeren Stichproben ist es weniger wahrscheinlich, dass Ausreißer die Ergebnisse negativ beeinflussen. Stats iQ verwendet Tukeys „äußeren Zaun“, um Ausreißer als Punkte zu definieren, die mehr als das Dreifache des Intraquartilbereichs über dem 75. oder unter dem 25. Perzentilpunkt liegen.
- Daten wie „Höchstes abgeschlossenes Bildungsniveau“ oder „Rangfolge beim Marathon“ sind eindeutig ordinal. Obwohl Likert-Skalen (wie eine Skala von 1 bis 7, bei der 1 für „sehr unzufrieden“ und 7 für „sehr zufrieden“ steht) technisch gesehen ordinal sind, ist es in den Sozialwissenschaften üblich, sie so zu behandeln, als ob sie kontinuierlich wären (d.h.,
Lesen Sie mehr über zusätzliche statistische Analysetypen:
- Konjoint-Analyse
- T-Tests
- Kreuztabellenanalyse
- Clusteranalyse
- Faktorenanalyse