¿Qué es el ANOVA (Análisis de la Varianza) y para qué puedo utilizarlo?

¿Qué es el ANOVA?

ANOVA significa Análisis de la Varianza. Es una prueba estadística que fue desarrollada por Ronald Fisher en 1918 y que se ha utilizado desde entonces. En pocas palabras, el ANOVA indica si hay diferencias estadísticas entre las medias de tres o más grupos independientes.

El ANOVA de una vía es la forma más básica. Hay otras variaciones que pueden utilizarse en diferentes situaciones, incluyendo:

  • AnOVA de dos vías
  • AnOVA factorial
  • Prueba F de Welch ANOVA
  • AnOVA por rangos
  • Prueba por pares de Games-Howell

¿Cómo funciona el ANOVA?

Al igual que la prueba t, el ANOVA ayuda a averiguar si las diferencias entre grupos de datos son estadísticamente significativas. Funciona analizando los niveles de varianza dentro de los grupos a través de muestras tomadas de cada uno de ellos.

Si hay mucha varianza (dispersión de los datos lejos de la media) dentro de los grupos de datos, entonces hay más posibilidades de que la media de una muestra seleccionada de los datos sea diferente debido al azar.

Además de observar la varianza dentro de los grupos de datos, el ANOVA tiene en cuenta el tamaño de la muestra (cuanto más grande sea la muestra, menos posibilidades habrá de elegir valores atípicos para la muestra por azar) y las diferencias entre las medias de las muestras (si las medias de las muestras están muy alejadas, es más probable que las medias de todo el grupo también lo estén).

Todos estos elementos se combinan en un valor F, que luego puede ser analizado para dar una probabilidad (valor p) de si las diferencias entre sus grupos son estadísticamente significativas o no.

Un ANOVA de una vía compara los efectos de una variable independiente (un factor que influye en otras cosas) en múltiples variables dependientes. El ANOVA de dos vías hace lo mismo, pero con más de una variable independiente, mientras que el ANOVA factorial amplía aún más el número de variables independientes.

¿Cómo puede ayudar el ANOVA?

El ANOVA de una vía puede ayudarle a saber si hay o no diferencias significativas entre las medias de sus variables independientes.

¿Por qué es útil?

Porque cuando usted entiende cómo la media de cada variable independiente es diferente de las otras, puede comenzar a entender cuál de ellas tiene una conexión con su variable dependiente (como los clics en la página de destino) y comenzar a aprender lo que está impulsando ese comportamiento.

También podría dar la vuelta a las cosas y ver si una sola variable independiente (como la temperatura) afecta a múltiples variables dependientes (como las tasas de compra de crema solar, la asistencia a lugares al aire libre y la probabilidad de celebrar una comida al aire libre) y, en caso afirmativo, cuáles son.

¿Cuándo podría utilizar el ANOVA?

Podría utilizar el análisis de la varianza (ANOVA) como vendedor cuando quiera probar una hipótesis particular. Utilizaría el ANOVA para ayudarle a entender cómo responden sus diferentes grupos, con una hipótesis nula para la prueba de que las medias de los diferentes grupos son iguales. Si hay un resultado estadísticamente significativo, entonces significa que las dos poblaciones son desiguales (o diferentes).

Ejemplos de uso de ANOVA

Es posible que desee utilizar ANOVA para ayudarle a responder a preguntas como esta:

¿La edad, el sexo o los ingresos tienen un efecto sobre cuánto gasta alguien en su tienda al mes?

Para responder a esta pregunta, se puede utilizar un ANOVA factorial, ya que tiene tres variables independientes y una variable dependiente. Tendrá que recoger datos para diferentes grupos de edad (como 0-20, 21-40, 41-70, 71+), diferentes tramos de ingresos y todos los sexos relevantes. Un ANOVA de dos vías puede entonces evaluar simultáneamente el efecto de estas variables sobre su variable dependiente (gasto) y determinar si hacen una diferencia.

¿Afecta el estado civil (soltero, casado, divorciado, viudo) al estado de ánimo?

Para responder a esta pregunta, puede utilizar un ANOVA de una vía, ya que tiene una sola variable independiente (estado civil). Tendrás 4 grupos de datos, uno para cada categoría de estado civil, y para cada uno de ellos observarás las puntuaciones del estado de ánimo para ver si hay una diferencia entre las medias.

Cuando entienda cómo difieren los grupos dentro de la variable independiente (como viudo o soltero, no casado o divorciado), podrá empezar a entender cuál de ellos tiene una conexión con su variable dependiente (estado de ánimo).

Sin embargo, debe tener en cuenta que el ANOVA sólo le dirá que las puntuaciones medias del estado de ánimo en todos los grupos son iguales o no son iguales. No le dirá cuál tiene una puntuación media de estado de ánimo significativamente más alta o más baja.

Entendiendo los supuestos del ANOVA

Al igual que otros tipos de pruebas estadísticas, el ANOVA compara las medias de diferentes grupos y le muestra si hay alguna diferencia estadística entre las medias. El ANOVA se clasifica como una prueba estadística ómnibus. Esto significa que no puede decir qué grupos específicos fueron estadísticamente significativos entre sí, sólo que al menos dos de los grupos lo fueron.

Es importante recordar que la principal pregunta de investigación del ANOVA es si las medias de las muestras son de poblaciones diferentes. Hay dos supuestos en los que se basa el ANOVA:

  1. Sea cual sea la técnica de recogida de datos, las observaciones dentro de cada población muestreada se distribuyen normalmente.
  2. La población muestreada tiene una varianza común de s2.

Tipos de ANOVA

Desde el ANOVA básico de una vía hasta las variaciones para casos especiales, como el ANOVA clasificado para variables no categóricas, hay una variedad de enfoques para utilizar el ANOVA para su análisis de datos. Aquí hay una introducción a algunos de los más comunes.

¿Cuál es la diferencia entre las pruebas de ANOVA de una y dos vías?

Se define por el número de variables independientes que se incluyen en la prueba de ANOVA. Una vía significa que el análisis de la varianza tiene una variable independiente. Dos vías significa que la prueba tiene dos variables independientes. Un ejemplo de esto puede ser que la variable independiente sea la marca de la bebida (una vía), o las variables independientes de la marca de la bebida y cuántas calorías tiene o si es original o de dieta.

AnOVA factorial

AnOVA factorial es un término general que cubre las pruebas de ANOVA con dos o más variables categóricas independientes. (Un ANOVA de dos vías es en realidad un tipo de ANOVA factorial). Categórico significa que las variables se expresan en términos de categorías no jerárquicas (como Mountain Dew frente a Dr Pepper) en lugar de utilizar una escala clasificada o un valor numérico.

Prueba F de Welch ANOVA

Stats iQ recomienda una prueba F de Welch no jerarquizada si se cumplen varios supuestos sobre los datos:

  • El tamaño de la muestra es mayor que 10 veces el número de grupos en el cálculo (se excluyen los grupos con un solo valor) y, por lo tanto, el Teorema del Límite Central satisface el requisito de datos normalmente distribuidos.
  • Hay pocos o ningún valor atípico en los datos continuos/discretos.

A diferencia de la prueba F ligeramente más común para varianzas iguales, la prueba F de Welch no asume que las varianzas de los grupos que se comparan son iguales. Asumir varianzas iguales conduce a resultados menos precisos cuando las varianzas no son, de hecho, iguales, y sus resultados son muy similares cuando las varianzas son realmente iguales.

AnOVA clasificado

Cuando se violan los supuestos, el ANOVA no clasificado puede dejar de ser válido. En ese caso, Stats iQ recomienda el ANOVA clasificado (también llamado «ANOVA en rangos»); Stats iQ transforma los datos en rangos (reemplaza los valores con su ordenamiento en rangos) y luego ejecuta el mismo ANOVA en esos datos transformados.

El ANOVA clasificado es robusto a los valores atípicos y a los datos no distribuidos normalmente. La transformación de rango es un método bien establecido para proteger contra la violación de los supuestos (un método «no paramétrico») y se ve más comúnmente en la diferencia entre la correlación de Pearson y Spearman. La transformación de rangos seguida de la prueba F de Welch tiene un efecto similar al de la prueba Kruskal-Wallis.

Nótese que los tamaños del efecto de ANOVA clasificados y no clasificados (f de Cohen) de Stats iQ se calculan utilizando el valor F de la prueba F para varianzas iguales.

Prueba de Juegos-Howell por pares

Stats iQ ejecuta pruebas de Juegos-Howell independientemente del resultado de la prueba ANOVA (según Zimmerman, 2010). Stats iQ muestra pruebas por pares de Games-Howell sin clasificar o clasificadas basándose en los mismos criterios que los utilizados para el ANOVA clasificado frente al no clasificado, por lo que si ve «ANOVA clasificado» en la salida avanzada, las pruebas por pares también estarán clasificadas.

El Games-Howell es esencialmente una prueba t para varianzas desiguales que da cuenta de la mayor probabilidad de encontrar resultados estadísticamente significativos por casualidad cuando se ejecutan muchas pruebas por pares. A diferencia de la prueba b de Tukey, un poco más común, la prueba de Games-Howell no asume que las varianzas de los grupos que se comparan son iguales. Asumir que las varianzas son iguales conduce a resultados menos precisos cuando las varianzas no son realmente iguales, y sus resultados son muy similares cuando las varianzas son realmente iguales (Howell, 2012).

Nótese que mientras que la prueba por pares no clasificada comprueba la igualdad de las medias de los dos grupos, la prueba por pares clasificada no comprueba explícitamente las diferencias entre las medias o medianas de los grupos. Más bien, prueba una tendencia general de un grupo a tener valores más grandes que el otro.

Además, mientras Stats iQ no muestra los resultados de las pruebas por pares para cualquier grupo con menos de cuatro valores, esos grupos se incluyen en el cálculo de los grados de libertad para las otras pruebas por pares.

Cómo realizar una prueba ANOVA

Como con muchas de las pruebas estadísticas más antiguas, es posible hacer ANOVA usando un cálculo manual basado en fórmulas. También se puede ejecutar el ANOVA utilizando cualquier número de paquetes y sistemas de software estadístico populares, como R, SPSS o Minitab. Un desarrollo más reciente es el uso de herramientas automatizadas como Stats iQ de Qualtrics, que hacen que el análisis estadístico sea más accesible y sencillo que nunca.

Stats iQ y ANOVA

Stats iQ de Qualtrics puede ayudarle a ejecutar una prueba ANOVA. Cuando se selecciona una variable categórica con tres o más grupos y una variable continua o discreta, Stats iQ ejecuta un ANOVA unidireccional (prueba F de Welch) y una serie de pruebas «post hoc» por pares (pruebas de Games-Howell).

El ANOVA unidireccional prueba una relación general entre las dos variables, y las pruebas por pares prueban cada posible par de grupos para ver si un grupo tiende a tener valores más altos que el otro.

Cómo ejecutar una prueba ANOVA a través de Stats iQ

La prueba de promedios de Overall Stat en Stats iQ actúa como un ANOVA, probando la relación entre una variable categórica y una numérica probando las diferencias entre dos o más medias. Esta prueba produce un valor p para determinar si la relación es significativa o no.

Para ejecutar un ANOVA en StatsiQ, siga los siguientes pasos:

  • Seleccione una variable con 3+ grupos y una con números
  • Seleccione «Relacionar»
  • Entonces obtendrá un ANOVA, un «tamaño del efecto» relacionado y un resumen simple y fácil de entender

Qualtrics Crosstabs y ANOVA

También puede ejecutar una prueba ANOVA a través de la función Qualtrics Crosstabs. He aquí cómo:

  • Asegúrese de que su variable «banner» (columna) tiene 3+ grupos y su variable «stub» (filas) tiene números (como la Edad) o recodos numéricos (como «Muy satisfecho» = 7)
  • Seleccione «Prueba estadística global de promedios»
  • Verá un valor p básico de ANOVA

¿Cuáles son las limitaciones de ANOVA?

Si bien el ANOVA le ayudará a analizar la diferencia de medias entre dos variables independientes, no le dirá qué grupos estadísticos fueron diferentes entre sí. Si su prueba devuelve un estadístico F significativo (el valor que se obtiene cuando se ejecuta una prueba ANOVA), es posible que tenga que ejecutar una prueba ad hoc (como la prueba de la mínima diferencia significativa) para decirle exactamente qué grupos tenían una diferencia en las medias.

Consideraciones adicionales con ANOVA

  • Con tamaños de muestra más pequeños, los datos pueden ser inspeccionados visualmente para determinar si de hecho se distribuyen normalmente; si es así, los resultados de la prueba t sin clasificación siguen siendo válidos incluso para muestras pequeñas. En la práctica, esta evaluación puede ser difícil de hacer, por lo que Stats iQ recomienda pruebas t clasificadas por defecto para muestras pequeñas.
  • Con tamaños de muestra más grandes, es menos probable que los valores atípicos afecten negativamente a los resultados. Stats iQ utiliza la «valla exterior» de Tukey para definir los valores atípicos como puntos más de tres veces el rango intracuartil por encima del punto 75 o por debajo del punto 25 del percentil.
  • Datos como «Nivel más alto de educación completado» o «Orden de llegada en el maratón» son inequívocamente ordinales. Aunque las escalas de Likert (como una escala de 1 a 7 en la que 1 es Muy insatisfecho y 7 es Muy satisfecho) son técnicamente ordinales, es una práctica común en las ciencias sociales tratarlas como si fueran continuas (es decir, con una prueba t no jerarquizada).

Lea más sobre tipos de análisis estadísticos adicionales:

  • Análisis conjunto
  • T-Tests
  • Análisis cruzado
  • Análisis de conglomerados
  • Análisis de factores