What is ANOVA (Analysis Of Variance) and what can I use it for?

What is ANOVA?

ANOVA to skrót od Analysis of Variance. Jest to test statystyczny, który został opracowany przez Ronalda Fishera w 1918 roku i od tego czasu jest w użyciu. Mówiąc prościej, ANOVA mówi, czy istnieją jakiekolwiek różnice statystyczne między średnimi trzech lub więcej niezależnych grup.

Jednokierunkowa ANOVA jest najbardziej podstawową formą. Istnieją inne odmiany, które mogą być używane w różnych sytuacjach, w tym:

  • Dwustronna ANOVA
  • Factorial ANOVA
  • Test F Welcha ANOVA
  • Ranked ANOVA
  • Test parami Games-Howell

Jak działa ANOVA?

Podobnie jak test t, ANOVA pomaga dowiedzieć się, czy różnice między grupami danych są statystycznie istotne. Działa ona poprzez analizę poziomów wariancji w obrębie grup za pomocą próbek pobranych z każdej z nich.

Jeśli istnieje duża wariancja (rozrzut danych od średniej) w obrębie grup danych, to istnieje większa szansa, że średnia z próbki wybranej z danych będzie inna z powodu przypadku.

As well as looking at variance within the data groups, ANOVA takes into account sample size (the larger the sample, the less chance there will be of picking outliers for the sample by chance) and the differences between sample means (if the means of the samples are far apart, it’s more likely that the means of the whole group will be too).

Wszystkie te elementy są łączone w wartość F, która może być następnie przeanalizowana, aby dać prawdopodobieństwo (p-vaue) tego, czy różnice między twoimi grupami są statystycznie istotne.

Jednokierunkowa ANOVA porównuje wpływ zmiennej niezależnej (czynnika, który wpływa na inne rzeczy) na wiele zmiennych zależnych. Dwukierunkowa ANOVA robi to samo, ale z więcej niż jedną zmienną niezależną, podczas gdy czynnikowa ANOVA rozszerza liczbę zmiennych niezależnych jeszcze bardziej.

Jak ANOVA może pomóc?

Jednokierunkowa ANOVA może pomóc Ci dowiedzieć się, czy istnieją znaczące różnice między średnimi Twoich zmiennych niezależnych.

Dlaczego jest to przydatne?

Ponieważ kiedy zrozumiesz, jak każda średnia zmiennej niezależnej różni się od innych, możesz zacząć rozumieć, które z nich mają związek z twoją zmienną zależną (taką jak kliknięcia na stronie docelowej) i zacząć się uczyć, co napędza to zachowanie.

Możesz również odwrócić rzeczy i zobaczyć, czy pojedyncza zmienna niezależna (taka jak temperatura) wpływa na wiele zmiennych zależnych (takich jak wskaźnik zakupu kremu do opalania, frekwencja w miejscach na świeżym powietrzu i prawdopodobieństwo zorganizowania cook-out), a jeśli tak, to które z nich.

Kiedy możesz użyć ANOVA?

Możesz użyć analizy wariancji (ANOVA) jako marketer, kiedy chcesz przetestować konkretną hipotezę. Użyłbyś ANOVA, aby pomóc Ci zrozumieć, jak reagują różne grupy, z hipotezą zerową dla testu, że środki różnych grup są równe. Jeśli wynik jest statystycznie istotny, oznacza to, że dwie populacje są nierówne (lub różne).

Przykłady użycia ANOVA

Możesz chcieć użyć ANOVA, aby pomóc odpowiedzieć na pytania takie jak to:

Czy wiek, płeć lub dochód mają wpływ na to, ile ktoś wydaje w twoim sklepie miesięcznie?

Aby odpowiedzieć na to pytanie, można użyć czynnikowej ANOVA, ponieważ masz trzy zmienne niezależne i jedną zmienną zależną. Trzeba będzie zebrać dane dla różnych grup wiekowych (takich jak 0-20, 21-40, 41-70, 71+), różnych przedziałów dochodów i wszystkich odpowiednich płci. Dwukierunkowa ANOVA może wtedy jednocześnie ocenić wpływ tych zmiennych na zmienną zależną (wydatki) i określić, czy robią one różnicę.

Czy stan cywilny (samotny, żonaty, rozwiedziony, owdowiały) wpływa na nastrój?

Aby odpowiedzieć na to pytanie, możesz użyć jednokierunkowej ANOVY, ponieważ masz jedną zmienną niezależną (stan cywilny). Będziesz miał 4 grupy danych, po jednej dla każdej z kategorii stanu cywilnego, i dla każdej z nich będziesz patrzył na wyniki nastroju, aby zobaczyć czy jest różnica między średnimi.

Kiedy zrozumiesz jak różnią się grupy w ramach zmiennej niezależnej (takie jak owdowiali lub samotni, nieżonaci lub rozwiedzeni), możesz zacząć rozumieć, która z nich ma związek z twoją zmienną zależną (nastrój).

Jednakże powinieneś zauważyć, że ANOVA powie ci tylko, że średnie wyniki nastroju we wszystkich grupach są takie same lub nie są takie same. Nie powie Ci, która z grup ma znacząco wyższy lub niższy średni wynik nastroju.

Zrozumienie założeń ANOVA

Podobnie jak inne rodzaje testów statystycznych, ANOVA porównuje średnie różnych grup i pokazuje, czy istnieją jakiekolwiek statystyczne różnice między średnimi. ANOVA jest klasyfikowana jako statystyka testowa omnibus. Oznacza to, że nie może powiedzieć, które konkretne grupy były statystycznie istotnie różne od siebie, tylko, że co najmniej dwie z grup były.

Ważne jest, aby pamiętać, że głównym pytaniem badawczym ANOVA jest to, czy środki próbki są z różnych populacji. Istnieją dwa założenia, na których opiera się ANOVA:

  1. Niezależnie od techniki zbierania danych, obserwacje w każdej próbkowanej populacji mają rozkład normalny.
  2. Populacja próbkowana ma wspólną wariancję s2.

Typy ANOVA

Od podstawowej jednokierunkowej ANOVA do wariantów dla specjalnych przypadków, takich jak ANOVA rangowa dla zmiennych niekategorycznych, istnieje wiele podejść do wykorzystania ANOVA do analizy danych. Oto wprowadzenie do niektórych z najbardziej powszechnych z nich.

Jaka jest różnica między jednokierunkowymi i dwukierunkowymi testami ANOVA?

Jest ona określona przez to, ile niezależnych zmiennych jest zawartych w teście ANOVA. Jednokierunkowa oznacza, że analiza wariancji ma jedną zmienną niezależną. Dwukierunkowa oznacza, że test ma dwie zmienne niezależne. Przykładem tego może być niezależna zmienna będąca marką napoju (jednokierunkowa), lub niezależne zmienne marki napoju i ile ma kalorii lub czy jest oryginalny czy dietetyczny.

Factorial ANOVA

Factorial ANOVA jest terminem parasolowym, który obejmuje testy ANOVA z dwoma lub więcej niezależnymi zmiennymi kategorycznymi. (Dwukierunkowa ANOVA jest właściwie rodzajem czynnikowej ANOVA). Kategoryczne oznacza, że zmienne są wyrażone w kategoriach niehierarchicznych (jak Mountain Dew vs Dr Pepper), a nie przy użyciu skali rangowej lub wartości liczbowej.

Test F Welcha ANOVA

Stats iQ zaleca test F Welcha bez rangi, jeśli kilka założeń dotyczących danych jest spełnionych:

  • Wielkość próby jest większa niż 10-krotność liczby grup w obliczeniach (grupy z tylko jedną wartością są wykluczone), a zatem Centralne Twierdzenie Graniczne spełnia wymóg normalnego rozkładu danych.
  • W danych ciągłych/dyskretnych występuje niewiele lub nie ma wartości odstających.

W przeciwieństwie do nieco bardziej powszechnego testu F dla równych wariancji, test F Welcha nie zakłada, że wariancje porównywanych grup są równe. Zakładanie równych wariancji prowadzi do mniej dokładnych wyników, gdy wariancje nie są w rzeczywistości równe, a jego wyniki są bardzo podobne, gdy wariancje są rzeczywiście równe.

Ranked ANOVA

Gdy założenia są naruszone, nieranked ANOVA może nie być już ważna. W takim przypadku Stats iQ zaleca ANOVA rangowa (zwana również „ANOVA na rangach”); Stats iQ przekształca dane (zastępuje wartości ich kolejnością rangową), a następnie przeprowadza tę samą ANOVA na przekształconych danych.

Rangowa ANOVA jest odporna na wartości odstające i dane o rozkładzie nienormalnym. Transformacja rang jest dobrze znaną metodą ochrony przed naruszeniem założeń (metoda „nieparametryczna”) i jest najczęściej widoczna w różnicy między korelacją Pearsona i Spearmana. Transformacja rangowa, po której następuje test F Welcha, jest podobna w działaniu do testu Kruskala-Wallisa.

Zauważ, że w Stats iQ rangowane i nierankingowane wielkości efektu ANOVA (f Cohena) są obliczane przy użyciu wartości F z testu F dla równych wariancji.

Test parami Games-Howell

Stats iQ przeprowadza testy Games-Howell niezależnie od wyniku testu ANOVA (zgodnie z Zimmermanem, 2010). Stats iQ pokazuje nierankingowe lub rankingowe testy parami Games-Howell w oparciu o te same kryteria, które są używane do rankingowych vs. nierankingowych ANOVA, więc jeśli widzisz „Ranked ANOVA” w zaawansowanych danych wyjściowych, testy parami również będą rankingowe.

Test Games-Howell jest zasadniczo testem t dla nierównych wariancji, który uwzględnia zwiększone prawdopodobieństwo znalezienia statystycznie istotnych wyników przez przypadek podczas wykonywania wielu testów parami. W przeciwieństwie do nieco bardziej powszechnego b-testu Tukeya, test Gamesa-Howella nie zakłada, że wariancje porównywanych grup są równe. Zakładanie równych wariancji prowadzi do mniej dokładnych wyników, gdy wariancje nie są w rzeczywistości równe, a jego wyniki są bardzo podobne, gdy wariancje są w rzeczywistości równe (Howell, 2012).

Zauważ, że podczas gdy nieuporządkowany test parami bada równość średnich dwóch grup, uszeregowany test parami nie testuje wyraźnie różnic między średnimi lub medianami grup. Raczej testuje ogólną tendencję jednej grupy do posiadania większych wartości niż druga.

Dodatkowo, podczas gdy Stats iQ nie pokazuje wyników testów parami dla jakiejkolwiek grupy z mniej niż czterema wartościami, grupy te są uwzględniane przy obliczaniu stopni swobody dla innych testów parami.

Jak przeprowadzić test ANOVA

Jak w przypadku wielu starszych testów statystycznych, możliwe jest przeprowadzenie ANOVA przy użyciu ręcznych obliczeń opartych na formułach. Można również przeprowadzić ANOVA przy użyciu dowolnego z popularnych pakietów oprogramowania statystycznego i systemów, takich jak R, SPSS lub Minitab. Nowością jest wykorzystanie zautomatyzowanych narzędzi, takich jak Stats iQ firmy Qualtrics, które sprawiają, że analiza statystyczna jest bardziej dostępna i prosta niż kiedykolwiek wcześniej.

Stats iQ i ANOVA

Stats iQ firmy Qualtrics może pomóc w przeprowadzeniu testu ANOVA. Po wybraniu jednej zmiennej kategorycznej z trzema lub więcej grupami i jednej zmiennej ciągłej lub dyskretnej, Stats iQ przeprowadza jednokierunkową ANOVA (test F Welcha) i serię testów parami „post hoc” (testy Gamesa-Howella).

Jednokierunkowa ANOVA testuje ogólny związek między dwiema zmiennymi, a testy parami testują każdą możliwą parę grup, aby sprawdzić, czy jedna grupa ma tendencję do posiadania wyższych wartości niż druga.

Jak przeprowadzić test ANOVA przez Stats iQ

Test średnich w Stats iQ działa jak ANOVA, testując związek między zmienną kategoryczną i numeryczną poprzez testowanie różnic między dwiema lub więcej średnimi. Ten test wytwarza wartość p, aby określić, czy związek jest znaczący, czy nie.

Aby uruchomić ANOVA w StatsiQ, wykonaj następujące kroki:

  • Wybierz zmienną z 3+ grupami i jedną z liczbami
  • Wybierz „Relate”
  • Wtedy otrzymasz ANOVA, powiązaną „wielkość efektu” oraz proste, łatwe do zrozumienia podsumowanie

Qualtrics Crosstabs and ANOVA

Test ANOVA możesz uruchomić również poprzez funkcję Qualtrics Crosstabs. Oto jak:

  • Upewnij się, że Twoja zmienna „banner” (kolumna) ma 3+ grup, a Twoja zmienna „stub” (wiersze) ma liczby (jak Wiek) lub rekody numeryczne (jak „Very Satisfied” = 7)
  • Wybierz „Overall stat test of averages”
  • Zobaczysz podstawową wartość p ANOVA

Jakie są ograniczenia ANOVA?

Pomimo, że ANOVA pomoże Ci przeanalizować różnicę w średnich między dwiema niezależnymi zmiennymi, nie powie Ci, które grupy statystyczne różniły się od siebie. Jeśli twój test zwraca znaczącą statystykę F (wartość, którą otrzymujesz po uruchomieniu testu ANOVA), możesz potrzebować uruchomić test ad hoc (jak test najmniejszej istotnej różnicy), aby powiedzieć ci dokładnie, które grupy miały różnicę w środkach.

Dodatkowe rozważania na temat ANOVA

  • Przy mniejszej liczebności próby, dane mogą być sprawdzone wizualnie, aby określić, czy są one w rzeczywistości normalnie rozłożone; jeśli tak jest, wyniki testu t-ranged są nadal ważne nawet dla małych prób. W praktyce taka ocena może być trudna do wykonania, dlatego Stats iQ zaleca domyślnie stosowanie testów t-ranged dla małych próbek.
  • Przy większych liczebnościach próby prawdopodobieństwo negatywnego wpływu na wyniki jest mniejsze. Stats iQ używa „zewnętrznego ogrodzenia” Tukeya, aby zdefiniować wartości odstające jako punkty ponad trzykrotnie przekraczające wewnątrzkwartylowy zakres powyżej 75. lub poniżej 25. punktu percentyla.
  • Dane takie jak „Najwyższy poziom ukończonej edukacji” lub „Kolejność na mecie w maratonie” są jednoznacznie porządkowe. Chociaż skale Likerta (takie jak skala od 1 do 7, gdzie 1 oznacza bardzo niezadowolony, a 7 bardzo zadowolony) są technicznie rzędowe, powszechną praktyką w naukach społecznych jest traktowanie ich tak, jakby były ciągłe (tj,

Czytaj więcej o dodatkowych typach analizy statystycznej:

  • Analiza współrzędnościowa
  • Testy
  • Analiza krzyżowa
  • Analiza skupień
  • Analiza czynnikowa

.