El muestreo es el proceso estadístico de selección de un subconjunto (llamado «muestra») de una población de interés con el fin de realizar observaciones e inferencias estadísticas sobre dicha población. La investigación en ciencias sociales consiste generalmente en inferir patrones de comportamiento dentro de poblaciones específicas. No podemos estudiar poblaciones enteras debido a limitaciones de viabilidad y coste, por lo que debemos seleccionar una muestra representativa de la población de interés para su observación y análisis. Es extremadamente importante elegir una muestra que sea realmente representativa de la población para que las inferencias derivadas de la muestra puedan generalizarse a la población de interés. Un muestreo inadecuado y sesgado es la razón principal de las inferencias a menudo divergentes y erróneas de las que informan las encuestas de opinión y los sondeos a pie de urna realizados por diferentes grupos de sondeo, como CNN/Gallup Poll, ABC y CBS, antes de cada elección presidencial en Estados Unidos.
El proceso de muestreo
Figura 8.1. El proceso de muestreo
El proceso de muestreo consta de varias etapas. La primera etapa consiste en definir la población objetivo. Una población puede definirse como todas las personas o elementos («unidad de análisis») con las características que se desea estudiar. La unidad de análisis puede ser una persona, un grupo, una organización, un país, un objeto o cualquier otra entidad sobre la que se quieran hacer inferencias científicas. A veces la población es obvia. Por ejemplo, si un fabricante quiere determinar si los productos acabados fabricados en una línea de producción cumplen ciertos requisitos de calidad o deben ser desechados y reelaborados, entonces la población está formada por todo el conjunto de productos acabados fabricados en esa instalación de producción. En otras ocasiones, la población objetivo puede ser un poco más difícil de entender. Si desea identificar los principales impulsores del aprendizaje académico entre los estudiantes de secundaria, ¿cuál es su población objetivo: los estudiantes de secundaria, sus profesores, los directores de las escuelas o los padres? La respuesta correcta en este caso es los estudiantes de secundaria, porque usted está interesado en su rendimiento, no en el rendimiento de sus profesores, padres o escuelas. Del mismo modo, si desea analizar el comportamiento de las ruletas para identificar las ruedas sesgadas, su población de interés no son las diferentes observaciones de una única ruleta, sino las diferentes ruletas (es decir, su comportamiento a lo largo de un conjunto infinito de ruedas).
El segundo paso en el proceso de muestreo es elegir un marco de muestreo . Se trata de una sección accesible de la población objetivo (normalmente una lista con información de contacto) de la que se puede extraer una muestra. Si su población objetivo son los empleados profesionales en el trabajo, como no puede acceder a todos los empleados profesionales del mundo, un marco de muestreo más realista serán las listas de empleados de una o dos empresas locales que estén dispuestas a participar en su estudio. Si su población objetivo son las organizaciones, entonces la lista de empresas Fortune 500 o la lista Standard &Poor’s (S&P) de empresas registradas en la Bolsa de Valores de Nueva York pueden ser marcos de muestreo aceptables.
Tenga en cuenta que los marcos de muestreo pueden no ser totalmente representativos de la población en general, y si es así, las inferencias derivadas de dicha muestra pueden no ser generalizables a la población. Por ejemplo, si su población objetivo son los empleados de las organizaciones en general (por ejemplo, desea estudiar la autoestima de los empleados en esta población) y su marco de muestreo son los empleados de las empresas automotrices del Medio Oeste de Estados Unidos, los hallazgos de dichos grupos pueden no ser siquiera generalizables a la fuerza laboral estadounidense en general, y mucho menos al lugar de trabajo global. Esto se debe a que la industria automovilística estadounidense ha estado sometida a fuertes presiones competitivas durante los últimos 50 años y ha sido testigo de numerosos episodios de reorganización y reducción de personal, lo que posiblemente ha provocado una baja moral y autoestima de los empleados. Además, la mayor parte de la mano de obra estadounidense está empleada en industrias de servicios o en pequeñas empresas, y no en la industria del automóvil. Por lo tanto, una muestra de empleados de la industria automovilística estadounidense no es especialmente representativa de la mano de obra estadounidense. Asimismo, la lista Fortune 500 incluye las 500 mayores empresas estadounidenses, lo que no es representativo de todas las empresas estadounidenses en general, la mayoría de las cuales son medianas y pequeñas empresas en lugar de grandes empresas, y es, por tanto, un marco de muestreo sesgado. Por el contrario, la lista S&P le permitirá seleccionar empresas grandes, medianas y/o pequeñas, dependiendo de si utiliza las listas S&P de gran capitalización, mediana capitalización o pequeña capitalización, pero incluye empresas que cotizan en bolsa (y no empresas privadas) y, por tanto, sigue siendo sesgada. También hay que tener en cuenta que la población de la que se extrae una muestra puede no ser necesariamente la misma que la población sobre la que realmente queremos información. Por ejemplo, si un investigador quiere conocer la tasa de éxito de un nuevo programa para dejar de fumar, la población objetivo es el universo de fumadores que tuvieron acceso a este programa, que puede ser una población desconocida. Por lo tanto, el investigador puede tomar una muestra de los pacientes que llegan a un centro médico local para recibir tratamiento para dejar de fumar, algunos de los cuales pueden no haber estado expuestos a este programa concreto para «dejar de fumar», en cuyo caso, el marco de muestreo no se corresponde con la población de interés.
El último paso del muestreo consiste en elegir una muestra del marco de muestreo utilizando una técnica de muestreo bien definida. Las técnicas de muestreo pueden agruparse en dos grandes categorías: muestreo probabilístico (aleatorio) y muestreo no probabilístico. El muestreo probabilístico es ideal si la generalización de los resultados es importante para su estudio, pero puede haber circunstancias únicas en las que el muestreo no probabilístico también puede estar justificado. Estas técnicas se analizan en las dos secciones siguientes.
Muestreo probabilístico
El muestreo probabilístico es una técnica en la que cada unidad de la población tiene una posibilidad (probabilidad no nula) de ser seleccionada en la muestra, y esta posibilidad puede determinarse con precisión. Los estadísticos de la muestra producidos de este modo, como la media de la muestra o la desviación estándar, son estimaciones no sesgadas de los parámetros de la población, siempre que las unidades muestreadas se ponderen de acuerdo con su probabilidad de selección. Todos los muestreos probabilísticos tienen dos atributos en común: (1) cada unidad de la población tiene una probabilidad conocida y distinta de cero de ser muestreada, y (2) el procedimiento de muestreo implica una selección aleatoria en algún momento. Los diferentes tipos de técnicas de muestreo probabilístico incluyen:
Muestreo aleatorio simple. En esta técnica, todos los posibles subconjuntos de una población (más exactamente, de un marco de muestreo) tienen la misma probabilidad de ser seleccionados. La probabilidad de seleccionar cualquier conjunto de n unidades de un total de N unidades en un marco de muestreo es N C n . Por lo tanto, las estadísticas muestrales son estimaciones insesgadas de los parámetros de la población, sin ninguna ponderación. El muestreo aleatorio simple consiste en seleccionar aleatoriamente a los encuestados de un marco de muestreo, pero en el caso de los marcos de muestreo grandes, se suele utilizar una tabla de números aleatorios o un generador de números aleatorios informatizado. Por ejemplo, si se desea seleccionar 200 empresas para encuestar de una lista de 1000 empresas, si esta lista se introduce en una hoja de cálculo como Excel, se puede utilizar la función RAND() de Excel para generar números aleatorios para cada uno de los 1000 clientes de esa lista. A continuación, se ordena la lista por orden creciente de su correspondiente número aleatorio y se seleccionan los 200 primeros clientes de esa lista ordenada. Esta es la más simple de todas las técnicas de muestreo probabilístico; sin embargo, la simplicidad es también el punto fuerte de esta técnica. Dado que el marco de muestreo no está subdividido ni dividido, la muestra es insesgada y las inferencias son las más generalizables entre todas las técnicas de muestreo probabilístico.
Muestreo sistemático. En esta técnica, el marco de muestreo se ordena según algunos criterios y los elementos se seleccionan a intervalos regulares a través de esa lista ordenada. El muestreo sistemático implica un comienzo aleatorio y luego procede a la selección de cada k elementos a partir de ese punto, donde k = N / n , donde k es la relación entre el tamaño del marco de muestreo N y el tamaño de la muestra deseada n , y se denomina formalmente relación de muestreo . Es importante que el punto de partida no sea automáticamente el primero de la lista, sino que se elija al azar entre los primeros k elementos de la lista. En nuestro ejemplo anterior de selección de 200 empresas de una lista de 1.000 empresas, puede ordenar las 1.000 empresas en orden creciente (o decreciente) de su tamaño (es decir, recuento de empleados o ingresos anuales), seleccionar al azar una de las cinco primeras empresas de la lista ordenada y, a continuación, seleccionar una de cada cinco empresas de la lista. Este proceso garantizará que no haya una representación excesiva de empresas grandes o pequeñas en su muestra, sino que las empresas de todos los tamaños estén en general representadas de manera uniforme, al igual que en su marco de muestreo. En otras palabras, la muestra es representativa de la población, al menos sobre la base del criterio de clasificación.
Muestreo estratificado. En el muestreo estratificado, el marco de muestreo se divide en subgrupos homogéneos y no superpuestos (llamados «estratos»), y se extrae una muestra aleatoria simple dentro de cada subgrupo. En el ejemplo anterior de selección de 200 empresas de una lista de 1.000 empresas, puede empezar por clasificar las empresas en función de su tamaño como grandes (más de 500 empleados), medianas (entre 50 y 500 empleados) y pequeñas (menos de 50 empleados). A continuación, puede seleccionar al azar 67 empresas de cada subgrupo para constituir su muestra de 200 empresas. Sin embargo, dado que en un marco de muestreo hay muchas más empresas pequeñas que grandes, el hecho de tener un número igual de empresas pequeñas, medianas y grandes hará que la muestra sea menos representativa de la población (es decir, estará sesgada a favor de las grandes empresas que son menos numerosas en la población objetivo). Esto se denomina muestreo estratificado no proporcional porque la proporción de la muestra dentro de cada subgrupo no refleja las proporciones del marco de muestreo (o de la población de interés), y el subgrupo más pequeño (empresas grandes) está sobremuestreado. Una técnica alternativa será seleccionar muestras de subgrupos en proporción a su tamaño en la población. Por ejemplo, si hay 100 empresas grandes, 300 medianas y 600 pequeñas, se pueden muestrear 20 empresas del grupo «grande», 60 del grupo «mediano» y 120 del grupo «pequeño». En este caso, la distribución proporcional de las empresas de la población se mantiene en la muestra, por lo que esta técnica se denomina muestreo estratificado proporcional. Tenga en cuenta que el enfoque no proporcional es especialmente eficaz para representar a subgrupos pequeños, como las empresas de gran tamaño, y no es necesariamente menos representativo de la población en comparación con el enfoque proporcional, siempre que los resultados del enfoque no proporcional se ponderen de acuerdo con la proporción de un subgrupo en la población total.
Muestreo por conglomerados. Si tiene una población dispersa en una amplia región geográfica, puede no ser factible realizar un muestreo aleatorio simple de toda la población. En tal caso, puede ser razonable dividir la población en «clusters» (normalmente a lo largo de los límites geográficos), muestrear aleatoriamente algunos clusters y medir todas las unidades dentro de ese cluster. Por ejemplo, si desea tomar una muestra de gobiernos municipales en el estado de Nueva York, en lugar de viajar por todo el estado para entrevistar a los principales funcionarios municipales (como tendría que hacer con una muestra aleatoria simple), puede agrupar estos gobiernos en función de sus condados, seleccionar aleatoriamente un conjunto de tres condados y, a continuación, entrevistar a los funcionarios de cada uno de esos condados. Sin embargo, dependiendo de las diferencias entre conglomerados, la variabilidad de las estimaciones de la muestra en una muestra de conglomerados será generalmente mayor que la de una muestra aleatoria simple y, por lo tanto, los resultados son menos generalizables a la población que los obtenidos a partir de muestras aleatorias simples.
Muestreo por pares. A veces, los investigadores pueden querer comparar dos subgrupos dentro de una población basándose en un criterio específico. Por ejemplo, ¿por qué algunas empresas son sistemáticamente más rentables que otras? Para llevar a cabo un estudio de este tipo, habría que clasificar un marco de muestreo de empresas en empresas «muy rentables» y «poco rentables» en función de los márgenes brutos, los beneficios por acción o alguna otra medida de rentabilidad. A continuación, se seleccionaría una muestra aleatoria simple de empresas de un subgrupo y se emparejaría cada empresa de este grupo con una empresa del segundo subgrupo, en función de su tamaño, segmento industrial y/u otros criterios de emparejamiento. Ahora tiene dos muestras emparejadas de empresas de alta y baja rentabilidad que puede estudiar con más detalle. Esta técnica de muestreo por pares emparejados suele ser una forma ideal de comprender las diferencias bipolares entre los distintos subgrupos de una población determinada.
Muestreo por etapas. Las técnicas de muestreo probabilístico descritas anteriormente son todos ejemplos de técnicas de muestreo de una etapa. Dependiendo de sus necesidades de muestreo, usted puede combinar estas técnicas de una sola etapa para realizar un muestreo multietapa. Por ejemplo, puede estratificar una lista de empresas en función del tamaño de la empresa y, a continuación, realizar un muestreo sistemático dentro de cada estrato. Se trata de una combinación en dos etapas de muestreo estratificado y sistemático. Del mismo modo, puede comenzar con un grupo de distritos escolares en el estado de Nueva York y, dentro de cada grupo, seleccionar una muestra aleatoria simple de escuelas; dentro de cada escuela, seleccionar una muestra aleatoria simple de niveles de grado; y dentro de cada nivel de grado, seleccionar una muestra aleatoria simple de estudiantes para el estudio. En este caso, se tiene un proceso de muestreo de cuatro etapas que consiste en un muestreo por conglomerados y un muestreo aleatorio simple.
Muestreo no probabilístico
El muestreo no probabilístico es una técnica de muestreo en la que algunas unidades de la población tienen cero posibilidades de ser seleccionadas o en la que la probabilidad de selección no puede determinarse con precisión. Normalmente, las unidades se seleccionan basándose en ciertos criterios no aleatorios, como la cuota o la conveniencia. Dado que la selección no es aleatoria, el muestreo no probabilístico no permite estimar los errores de muestreo y puede estar sujeto a un sesgo de muestreo. Por lo tanto, la información de una muestra no puede generalizarse a la población. Los tipos de técnicas de muestreo no probabilístico incluyen:
Muestreo de conveniencia. También llamado muestreo accidental o de oportunidad, es una técnica en la que se extrae una muestra de la parte de la población que está cerca, fácilmente disponible o conveniente. Por ejemplo, si se coloca en la puerta de un centro comercial y reparte encuestas con cuestionarios a las personas o las entrevista mientras entran, la muestra de encuestados que obtendrá será una muestra de conveniencia. Se trata de una muestra no probabilística porque se excluye sistemáticamente a todas las personas que compran en otros centros comerciales. Las opiniones que obtendrá de la muestra elegida pueden reflejar las características únicas de este centro comercial, como la naturaleza de sus tiendas (por ejemplo, las tiendas de gama alta atraerán a un grupo demográfico más acomodado), el perfil demográfico de sus clientes o su ubicación (por ejemplo, un centro comercial cercano a una universidad atraerá principalmente a estudiantes universitarios con hábitos de compra únicos) y, por tanto, pueden no ser representativas de las opiniones de la población de compradores en general. De ahí que la generalización científica de estas observaciones sea muy limitada. Otros ejemplos de muestreo de conveniencia son el muestreo de estudiantes matriculados en una determinada clase o el muestreo de pacientes que llegan a una determinada clínica médica. Este tipo de muestreo es más útil para las pruebas piloto, en las que el objetivo es la comprobación de instrumentos o la validación de mediciones más que la obtención de inferencias generalizables.
Muestreo por cuotas. En esta técnica, la población se segmenta en subgrupos mutuamente excluyentes (al igual que en el muestreo estratificado) y, a continuación, se elige un conjunto no aleatorio de observaciones de cada subgrupo para cumplir una cuota predefinida. En el muestreo por cuotas proporcionales, la proporción de encuestados de cada subgrupo debe coincidir con la de la población. Por ejemplo, si la población estadounidense está formada por un 70% de caucásicos, un 15% de hispanoamericanos y un 13% de afroamericanos, y desea conocer sus preferencias de voto en una muestra de 98 personas, puede situarse en la puerta de un centro comercial y preguntar a la gente sus preferencias de voto. Pero tendrá que dejar de preguntar a las personas de aspecto hispano cuando tenga 15 respuestas de ese subgrupo (o a los afroamericanos cuando tenga 13 respuestas), aunque siga tomando muestras de otros grupos étnicos, para que la composición étnica de su muestra coincida con la de la población estadounidense general. El muestreo por cuotas no proporcional es menos restrictivo en el sentido de que no tiene que lograr una representación proporcional, pero tal vez cumpla con un tamaño mínimo en cada subgrupo. En este caso, puede decidir tener 50 encuestados de cada uno de los tres subgrupos étnicos (caucásicos, hispanoamericanos y afroamericanos) y detenerse cuando se alcance la cuota de cada subgrupo. Ninguno de los dos tipos de muestreo por cuotas será representativo de la población estadounidense, ya que dependiendo de si su estudio se realizó en un centro comercial de Nueva York o de Kansas, sus resultados pueden ser totalmente diferentes. La técnica no proporcional es aún menos representativa de la población, pero puede ser útil porque permite captar las opiniones de grupos pequeños e infrarrepresentados mediante un sobremuestreo.
Muestreo de expertos. Se trata de una técnica en la que los encuestados se eligen de forma no aleatoria en función de sus conocimientos sobre el fenómeno estudiado. Por ejemplo, para comprender las repercusiones de una nueva política gubernamental, como la Ley Sarbanes-Oxley, se puede tomar una muestra de un grupo de contables de empresas que estén familiarizados con esta ley. La ventaja de este enfoque es que, dado que los expertos tienden a estar más familiarizados con el tema que los no expertos, las opiniones de una muestra de expertos son más creíbles que las de una muestra que incluya tanto a expertos como a no expertos, aunque los resultados siguen sin ser generalizables a la población en general.
Muestreo de bola de nieve. En el muestreo de bola de nieve, se empieza identificando a unos cuantos encuestados que cumplen los criterios de inclusión en el estudio y luego se les pide que recomienden a otros que conocen y que también cumplen los criterios de selección. Por ejemplo, si desea encuestar a administradores de redes informáticas y sólo conoce a una o dos personas de este tipo, puede empezar por ellos y pedirles que le recomienden a otros que también se dediquen a la administración de redes. Aunque este método difícilmente conduce a muestras representativas, a veces puede ser la única manera de llegar a poblaciones de difícil acceso o cuando no se dispone de un marco de muestreo.
Estadística del muestreo
En las secciones anteriores, hemos introducido términos como parámetro de la población, estadística de la muestra y sesgo de muestreo. En esta sección, trataremos de entender qué significan estos términos y cómo se relacionan entre sí.
Cuando se mide una determinada observación de una unidad dada, como la respuesta de una persona a un ítem con escala Likert, esa observación se llama respuesta (véase la figura 8.2). En otras palabras, una respuesta es un valor de medición proporcionado por una unidad muestreada. Cada encuestado dará respuestas diferentes a los distintos ítems de un instrumento. Las respuestas de diferentes encuestados al mismo ítem u observación pueden graficarse en una distribución de frecuencia basada en su frecuencia de ocurrencia. Para un gran número de respuestas en una muestra, esta distribución de frecuencias tiende a parecerse a una curva en forma de campana llamada distribución normal , que puede utilizarse para estimar las características generales de toda la muestra, como la media de la muestra (promedio de todas las observaciones en una muestra) o la desviación estándar (variabilidad o dispersión de las observaciones en una muestra). Estas estimaciones muestrales se denominan estadísticas muestrales (una «estadística» es un valor que se estima a partir de los datos observados). Las poblaciones también tienen medias y desviaciones típicas que podrían obtenerse si pudiéramos tomar una muestra de toda la población. Sin embargo, como nunca se puede muestrear a toda la población, las características de la población son siempre desconocidas y se denominan parámetros poblacionales (y no «estadísticos» porque no se estiman estadísticamente a partir de los datos). Los estadísticos de la muestra pueden diferir de los parámetros poblacionales si la muestra no es perfectamente representativa de la población; la diferencia entre ambos se denomina error de muestreo . Teóricamente, si pudiéramos aumentar gradualmente el tamaño de la muestra para que ésta se acercara cada vez más a la población, el error de muestreo disminuiría y un estadístico muestral se aproximaría cada vez más al parámetro poblacional correspondiente.
Si una muestra es realmente representativa de la población, entonces los estadísticos muestrales estimados deberían ser idénticos a los parámetros poblacionales teóricos correspondientes. ¿Cómo sabemos si los estadísticos de la muestra se aproximan al menos razonablemente a los parámetros de la población? Para ello, debemos entender el concepto de distribución muestral. Imagínese que toma tres muestras aleatorias diferentes de una población determinada, como se muestra en la figura 8.3, y que para cada muestra obtiene estadísticas muestrales como la media muestral y la desviación estándar. Si cada muestra aleatoria fuera realmente representativa de la población, entonces sus tres medias muestrales de las tres muestras aleatorias serían idénticas (e iguales al parámetro poblacional), y la variabilidad de las medias muestrales sería cero. Pero esto es extremadamente improbable, dado que cada muestra aleatoria constituirá probablemente un subconjunto diferente de la población y, por tanto, sus medias pueden ser ligeramente diferentes entre sí. Sin embargo, puede tomar estas tres medias muestrales y trazar un histograma de frecuencias de las medias muestrales. Si el número de estas muestras aumenta de tres a 10 y a 100, el histograma de frecuencias se convierte en una distribución de muestreo. Por lo tanto, una distribución de muestreo es una distribución de frecuencias de una estadística muestral (como la media muestral) de un conjunto de muestras, mientras que la distribución de frecuencias comúnmente referenciada es la distribución de una respuesta (observación) de una sola muestra. Al igual que una distribución de frecuencias, la distribución de muestreo también tenderá a tener más estadísticas muestrales agrupadas alrededor de la media (que presumiblemente es una estimación de un parámetro de la población), con menos valores dispersos alrededor de la media. Con un número infinitamente grande de muestras, esta distribución se aproximará a una distribución normal. La variabilidad o dispersión de una estadística muestral en una distribución de muestreo (es decir, la desviación estándar de una estadística muestral) se denomina error estándar. En cambio, el término desviación estándar se reserva para la variabilidad de una respuesta observada a partir de una sola muestra.
Figura 8.2. Estadística muestral.
Se supone que el valor medio de una estadística muestral en una distribución muestral es una estimación del parámetro poblacional desconocido. A partir de la dispersión de esta distribución de muestreo (es decir, basada en el error estándar), también es posible estimar intervalos de confianza para ese parámetro poblacional de predicción. El intervalo de confianza es la probabilidad estimada de que un parámetro poblacional se encuentre dentro de un intervalo específico de valores estadísticos de la muestra. Todas las distribuciones normales tienden a seguir la regla del 68-95-99% (véase la figura 8.4), que dice que más del 68% de los casos de la distribución se encuentran dentro de una desviación estándar del valor medio (µ + 1σ), más del 95% de los casos de la distribución se encuentran dentro de dos desviaciones estándar de la media (µ + 2σ) y más del 99% de los casos de la distribución se encuentran dentro de tres desviaciones estándar del valor medio (µ + 3σ). Dado que una distribución de muestreo con un número infinito de muestras se aproximará a una distribución normal, se aplica la misma regla del 68-95-99, y puede decirse que:
- (Estadística de la muestra + un error estándar) representa un intervalo de confianza del 68% para el parámetro poblacional.
- (Estadística muestral + dos errores estándar) representa un intervalo de confianza del 95% para el parámetro poblacional.
- (Estadística muestral + tres errores estándar) representa un intervalo de confianza del 99% para el parámetro poblacional.
Figura 8.3. La distribución de muestreo.
Una muestra está «sesgada» (es decir, no es representativa de la población) si su distribución de muestreo no puede estimarse o si la distribución de muestreo viola la regla del 68-95-99%. Como nota al margen, observe que en la mayoría de los análisis de regresión en los que examinamos la importancia de los coeficientes de regresión con p<0,05, estamos intentando ver si la estadística de muestreo (coeficiente de regresión) predice el parámetro poblacional correspondiente (tamaño del efecto verdadero) con un intervalo de confianza del 95%. Curiosamente, la norma «seis sigma» intenta identificar los defectos de fabricación fuera del intervalo de confianza del 99% o seis desviaciones estándar (la desviación estándar se representa con la letra griega sigma), lo que representa una prueba de significación a p<0,01.
Figura 8.4. La regla del 68-95-99 por ciento para el intervalo de confianza.