O que é ANOVA (Análise de Variância) e para que posso usá-la?

O que é ANOVA?

ANOVA significa Análise de Variância. É um teste estatístico que foi desenvolvido por Ronald Fisher em 1918 e está em uso desde então. Simplificando, a ANOVA diz-lhe se existem diferenças estatísticas entre as médias de três ou mais grupos independentes.

AnOVA de uma via é a forma mais básica. Existem outras variações que podem ser usadas em diferentes situações, incluindo:

  • AnOVA de duas vias
  • AnOVA fatorial
  • Teste F da Welch ANOVA
  • AnOVA com classificação
  • Teste de paridade de jogos

Como funciona a ANOVA?

Como no teste t, a ANOVA ajuda a descobrir se as diferenças entre os grupos de dados são estatisticamente significativas. Ela funciona analisando os níveis de variância dentro dos grupos através de amostras retiradas de cada um deles.

Se houver muita variância (dispersão de dados longe da média) dentro dos grupos de dados, então há mais chances de que a média de uma amostra selecionada dos dados seja diferente devido ao acaso.

As well as looking at variance within the data groups, ANOVA takes into account sample size (the larger the sample, the less chance there will be of picking outliers for the sample by chance) and the differences between sample means (if the means of the samples are far away apart, it’s more likely that the means of the whole group will be too).

Todos esses elementos são combinados em um valor F, que pode então ser analisado para dar uma probabilidade (p-vaue) de que as diferenças entre seus grupos sejam ou não estatisticamente significativas.

Uma ANOVA unidirecional compara os efeitos de uma variável independente (um fator que influencia outras coisas) em múltiplas variáveis dependentes. A ANOVA bidirecional faz a mesma coisa, mas com mais de uma variável independente, enquanto uma ANOVA fatorial amplia ainda mais o número de variáveis independentes.

Como a ANOVA pode ajudar?

A ANOVA unidirecional pode ajudá-lo a saber se há ou não diferenças significativas entre as médias de suas variáveis independentes.

Por que isso é útil?

Por que quando você entender como a média de cada variável independente é diferente das outras, você pode começar a entender qual delas tem uma conexão com sua variável dependente (como cliques de página de aterrissagem) e começar a aprender o que está conduzindo esse comportamento.

Você também pode inverter as coisas e ver se uma única variável independente (como a temperatura) afeta ou não múltiplas variáveis dependentes (como taxas de compra de protetor solar, presença em locais ao ar livre, e probabilidade de realizar um cook-out) e, se for o caso, quais delas.

Quando você pode usar ANOVA?

Você pode usar Análise de Variância (ANOVA) como um comerciante quando quiser testar uma hipótese em particular. Você poderia usar ANOVA para ajudá-lo a entender como seus diferentes grupos respondem, com uma hipótese nula para o teste de que as médias dos diferentes grupos são iguais. Se houver um resultado estatisticamente significativo, então significa que as duas populações são desiguais (ou diferentes).

Exemplos de uso de ANOVA

Você pode querer usar ANOVA para ajudá-lo a responder perguntas como esta:

A idade, sexo ou renda tem um efeito sobre quanto alguém gasta na sua loja por mês?

Para responder a esta pergunta, uma ANOVA factorial pode ser usada, já que você tem três variáveis independentes e uma variável dependente. Você precisará coletar dados para diferentes faixas etárias (como 0-20, 21-40, 41-70, 71+), diferentes faixas de renda, e todos os sexos relevantes. Uma ANOVA bidirecional pode então avaliar simultaneamente o efeito sobre essas variáveis em sua variável dependente (gastos) e determinar se elas fazem diferença.

O estado civil (solteiro, casado, divorciado, viúvo) afeta o humor?

Para responder a esta, você pode usar uma ANOVA unidirecional, já que você tem uma única variável independente (estado civil). Você terá 4 grupos de dados, um para cada uma das categorias de estado civil, e para cada um deles você estará olhando para as notas de humor para ver se há uma diferença entre as médias.

Quando você entender como os grupos dentro da variável independente diferem (como viúvo ou solteiro, não casado ou divorciado), você pode começar a entender qual deles tem uma conexão com sua variável dependente (humor).

No entanto, você deve observar que a ANOVA só lhe dirá que as médias de pontuação de humor em todos os grupos são as mesmas ou não são as mesmas. Ela não lhe diz qual deles tem uma pontuação média de humor significativamente maior ou menor.

Compreendendo as suposições da ANOVA

Como outros tipos de testes estatísticos, a ANOVA compara as médias dos diferentes grupos e mostra se há alguma diferença estatística entre as médias. A ANOVA é classificada como uma estatística de teste omnibus. Isto significa que ela não pode dizer quais grupos específicos foram estatisticamente diferentes entre si, apenas que pelo menos dois dos grupos foram.

É importante lembrar que a questão principal da pesquisa da ANOVA é se as médias da amostra são de populações diferentes. Há duas suposições sobre as quais se baseia a ANOVA:

  1. Seja qual for a técnica de coleta de dados, as observações dentro de cada população amostrada são normalmente distribuídas.
  2. A população amostrada tem uma variância comum de s2.

Tipos de ANOVA

Desde a ANOVA básica unidirecional até as variações para casos especiais, como a ANOVA classificada para variáveis não-categóricas, há uma variedade de abordagens para usar a ANOVA para sua análise de dados. Aqui está uma introdução a algumas das mais comuns.

Qual é a diferença entre os testes ANOVA unidirecional e bidirecional?

Isso é definido pelo número de variáveis independentes incluídas no teste ANOVA. Unidirecional significa que a análise de variância tem uma variável independente. Bidirecional significa que o teste tem duas variáveis independentes. Um exemplo disso pode ser a variável independente sendo uma marca de bebida (one-way), ou variáveis independentes de marca de bebida e quantas calorias ela tem ou se é original ou dieta.

AnOVA fatorial

AnOVA fatorial é um termo guarda-chuva que cobre os testes ANOVA com duas ou mais variáveis categóricas independentes. (Uma ANOVA bidirecional é na verdade uma espécie de ANOVA fatorial.) Categorizada significa que as variáveis são expressas em termos de categorias não hierárquicas (como Mountain Dew vs Dr Pepper) ao invés de usar uma escala classificada ou um valor numérico.

Teste F da Welch ANOVA

Stats iQ recomenda um teste F da Welch sem classificação se várias suposições sobre os dados se mantiverem:

  • O tamanho da amostra é maior que 10 vezes o número de grupos no cálculo (grupos com apenas um valor são excluídos), e portanto o Teorema do Limite Central satisfaz a exigência de dados normalmente distribuídos.
  • Existem poucos ou nenhum outliers nos dados contínuos/discretos.

Descomo o teste F ligeiramente mais comum para variâncias iguais, o teste F de Welch não assume que as variâncias dos grupos sendo comparados são iguais. Assumir variâncias iguais leva a resultados menos precisos quando as variâncias não são, de fato, iguais, e seus resultados são muito semelhantes quando as variâncias são realmente iguais.

AnOVA com classificação

Quando as suposições são violadas, a ANOVA sem classificação pode não ser mais válida. Nesse caso, Stats iQ recomenda a ANOVA classificada (também chamada “ANOVA on ranks”); Stats iQ rank-transforma os dados (substitui os valores com sua ordem de classificação) e então executa a mesma ANOVA sobre aqueles dados transformados.

A ANOVA classificada é robusta a dados não-normalmente distribuídos. A transformação de Rank é um método bem estabelecido para proteção contra violação de suposições (um método “não-paramétrico”) e é mais comumente vista na diferença entre a correlação de Pearson e Spearman. A transformação de Rank seguida pelo teste F de Welch é similar em efeito ao Teste Kruskal-Wallis.

Nota que os tamanhos de efeito ANOVA (Cohen’s f) são calculados usando o valor F do teste F para variâncias iguais.

Teste de Paridade de Jogo-Howell

Testes iQ de Estatística executa os testes Games-Howell independentemente do resultado do teste ANOVA (como por Zimmerman, 2010). Stats iQ mostra testes de pares Games-Howell não classificados ou classificados com base nos mesmos critérios usados para a ANOVA classificada vs. não classificada, então se você ver “Ranked ANOVA” na saída avançada, os testes de pares também serão classificados.

The Games-Howell é essencialmente um teste t para variâncias desiguais que explica a maior probabilidade de encontrar resultados estatisticamente significativos por acaso ao executar muitos testes de pares. Ao contrário do teste b ligeiramente mais comum de Tukey, o teste Games-Howell não assume que as variâncias dos grupos que estão sendo comparados são iguais. Assumindo variâncias iguais leva a resultados menos precisos quando as variâncias não são de fato iguais, e seus resultados são muito semelhantes quando as variâncias são realmente iguais (Howell, 2012).

Note que enquanto o teste não classificado em pares para a igualdade das médias dos dois grupos, o teste classificado em pares não testa explicitamente para diferenças entre as médias ou medianas dos grupos. Ao invés disso, ele testa para uma tendência geral de um grupo ter valores maiores que o outro.

Adicionalmente, enquanto o Stats iQ não mostra resultados de testes em pares para qualquer grupo com menos de quatro valores, esses grupos são incluídos no cálculo dos graus de liberdade para os outros testes em pares.

Como realizar um teste ANOVA

Como com muitos dos testes estatísticos mais antigos, é possível fazer ANOVA usando um cálculo manual baseado em fórmulas. Você também pode executar a ANOVA usando qualquer número de softwares e sistemas de estatística populares, tais como R, SPSS ou Minitab. Um desenvolvimento mais recente é usar ferramentas automatizadas como o Stats iQ da Qualtrics, que tornam a análise estatística mais acessível e direta do que nunca.

Stats iQ e ANOVA

Stats iQ da Qualtrics pode ajudá-lo a executar um teste ANOVA. Quando você seleciona uma variável categórica com três ou mais grupos e uma variável contínua ou discreta, o Stats iQ executa uma ANOVA unidirecional (teste F de Welch) e uma série de testes “pós-hoc” em pares (testes Games-Howell).

Os testes ANOVA unidirecionais para uma relação geral entre as duas variáveis, e os testes em pares testam cada possível par de grupos para ver se um grupo tende a ter valores mais altos do que o outro.

Como executar um teste ANOVA através de Stats iQ

O Teste Estatístico Geral de Médias em Stats iQ age como uma ANOVA, testando a relação entre uma variável categórica e uma numérica, testando as diferenças entre duas ou mais médias. Este teste produz um valor p para determinar se a relação é significativa ou não.

Para executar uma ANOVA no StatsiQ, execute as seguintes etapas:

  • Selecione uma variável com 3+ grupos e uma com números
  • Selecione “Relacionar”
  • Você obterá uma ANOVA, um “tamanho de efeito” relacionado, e um resumo simples e fácil de entender

Qualtrics Crosstabs e ANOVA

Você também pode executar um teste ANOVA através do recurso Qualtrics Crosstabs. Aqui está como:

  • Segure que sua variável “banner” (coluna) tem 3+ grupos e sua variável “stub” (linhas) tem números (como Idade) ou recodificação numérica (como “Very Satisfied” = 7)
  • Selecione “Overall stat test of averages”
  • Verá um valor p básico de ANOVA

Quais são as limitações de ANOVA?

A ANOVA irá ajudá-lo a analisar a diferença de médias entre duas variáveis independentes, não irá dizer quais os grupos estatísticos que eram diferentes entre si. Se o seu teste retorna uma estatística F significativa (o valor que você obtém quando executa um teste ANOVA), você pode precisar executar um teste ad hoc (como o teste da Diferença Menos Significativa) para lhe dizer exatamente quais grupos tinham uma diferença nas médias.

Considerações adicionais com ANOVA

  • Com tamanhos de amostra menores, os dados podem ser visualmente inspecionados para determinar se estão de fato distribuídos normalmente; se estiverem, os resultados do teste t não classificados ainda são válidos mesmo para amostras pequenas. Na prática, essa avaliação pode ser difícil de fazer, portanto o Stats iQ recomenda a classificação dos testes t por padrão para amostras pequenas.
  • Com tamanhos de amostra maiores, é menos provável que os valores aberrantes afetem negativamente os resultados. Stats iQ usa a “cerca externa” de Tukey para definir outliers como pontos mais de três vezes a faixa intraquartil acima do 75º ou abaixo do 25º ponto percentual.
  • Dados como “Nível mais alto de educação concluído” ou “Ordem de acabamento na maratona” são inequivocamente ordinais. Embora escalas de Likert (como uma escala de 1 a 7 onde 1 é Muito insatisfeito e 7 é Muito satisfeito) sejam tecnicamente ordinais, é prática comum nas ciências sociais tratá-las como se fossem contínuas (i.e, com um teste t não classificado).

Leia mais sobre tipos de análises estatísticas adicionais:

  • Análise Conjunta
  • T-Testes
  • Análise de Tabulação Cruzada
  • Análise de Cluster
  • Análise de Factor