Amostragem é o processo estatístico de seleção de um subconjunto (chamado de “amostra”) de uma população de interesse para fins de fazer observações e inferências estatísticas sobre essa população. A pesquisa em Ciências Sociais é geralmente sobre a inferência de padrões de comportamento dentro de populações específicas. Não podemos estudar populações inteiras devido à viabilidade e restrições de custos e, portanto, devemos selecionar uma amostra representativa da população de interesse para observação e análise. É extremamente importante escolher uma amostra que seja verdadeiramente representativa da população para que as inferências derivadas da amostra possam ser generalizadas de volta à população de interesse. A amostragem inadequada e tendenciosa é a principal razão para inferências muitas vezes divergentes e errôneas relatadas em pesquisas de opinião e pesquisas de saída realizadas por diferentes grupos de pesquisa, como CNN/Gallup Poll, ABC e CBS, antes de cada eleição presidencial nos EUA.
O processo de amostragem
Figure 8.1. O processo de amostragem
O processo de amostragem compreende várias etapas. A primeira etapa é a definição da população alvo. Uma população pode ser definida como todas as pessoas ou itens (unidade de análise) com as características que se deseja estudar. A unidade de análise pode ser uma pessoa, grupo, organização, país, objeto ou qualquer outra entidade sobre a qual se deseje fazer inferências científicas. Às vezes a população é óbvia. Por exemplo, se um fabricante deseja determinar se os produtos acabados fabricados em uma linha de produção satisfazem certos requisitos de qualidade ou se devem ser sucateados e retrabalhados, então a população consiste em todo o conjunto de produtos acabados fabricados naquela unidade de produção. Em outros momentos, a população alvo pode ser um pouco mais difícil de entender. Se você deseja identificar os motores primários do aprendizado acadêmico entre alunos do ensino médio, então qual é a sua população alvo: alunos do ensino médio, seus professores, diretores de escola, ou pais? A resposta certa neste caso é estudantes do ensino médio, porque você está interessado no desempenho deles, não no desempenho de seus professores, pais ou escolas. Da mesma forma, se você deseja analisar o comportamento das rodas da roleta para identificar rodas tendenciosas, sua população de interesse não é diferente das observações de uma única roleta, mas diferentes rodas da roleta (ou seja, seu comportamento sobre um conjunto infinito de rodas).
O segundo passo no processo de amostragem é escolher um quadro de amostragem . Esta é uma seção acessível da população alvo (geralmente uma lista com informações de contato) de onde uma amostra pode ser retirada. Se a população alvo for de empregados profissionais no trabalho, porque não é possível acessar todos os empregados profissionais ao redor do mundo, uma base de amostragem mais realista será a lista de empregados de uma ou duas empresas locais que estão dispostas a participar do seu estudo. Se a sua população alvo são organizações, então a lista de empresas da Fortune 500 ou a lista Standard & Poor’s (S&P) de empresas registradas na Bolsa de Valores de Nova York pode ser uma base de amostragem aceitável.
Note que as bases de amostragem podem não ser inteiramente representativas da população em geral e, se assim for, as inferências derivadas por tal amostra podem não ser generalizáveis para a população. Por exemplo, se a sua população alvo são funcionários organizacionais em geral (por exemplo, você deseja estudar a auto-estima dos funcionários nessa população) e a sua base de amostragem são funcionários de empresas automotivas no meio-oeste americano, os resultados de tais grupos podem nem mesmo ser generalizáveis para a força de trabalho americana em geral, muito menos para o local de trabalho global. Isto porque a indústria automobilística americana tem estado sob forte pressão competitiva nos últimos 50 anos e tem visto numerosos episódios de reorganização e downsizing, possivelmente resultando em baixa moral e auto-estima dos funcionários. Além disso, a maioria da força de trabalho americana está empregada em indústrias de serviços ou em pequenas empresas, e não na indústria automotiva. Portanto, uma amostra de funcionários da indústria automotiva americana não é particularmente representativa da força de trabalho americana. Da mesma forma, a lista Fortune 500 inclui as 500 maiores empresas americanas, que não são representativas de todas as empresas americanas em geral, a maioria das quais são empresas de médio e pequeno porte em vez de grandes empresas, e é, portanto, uma estrutura de amostragem tendenciosa. Em contraste, a lista S&P permitirá que você selecione empresas grandes, médias e/ou pequenas, dependendo se você usa a lista S&P large-cap, mid-cap, ou small-cap, mas inclui empresas negociadas publicamente (e não empresas privadas) e, portanto, ainda tendenciosas. Observe também que a população da qual uma amostra é retirada pode não ser necessariamente a mesma que a população sobre a qual realmente queremos informações. Por exemplo, se um pesquisador quer a taxa de sucesso de um novo programa “pare de fumar”, então a população alvo é o universo de fumantes que tiveram acesso a esse programa, que pode ser uma população desconhecida. Portanto, o pesquisador pode amostrar pacientes que chegam a uma instituição médica local para tratamento de cessação do fumo, alguns dos quais podem não ter tido exposição a esse programa particular de “parar de fumar”, caso em que o quadro de amostragem não corresponde à população de interesse.
O último passo na amostragem é escolher uma amostra do quadro de amostragem usando uma técnica de amostragem bem definida. As técnicas de amostragem podem ser agrupadas em duas categorias amplas: amostragem de probabilidade (aleatória) e amostragem não probabilística. A amostragem probabilística é ideal se a generalização dos resultados for importante para o seu estudo, mas pode haver circunstâncias únicas em que a amostragem não-probabilística também pode ser justificada. Essas técnicas são discutidas nas próximas duas seções.
Amostragem de Probabilidade
Amostras de Probabilidade é uma técnica em que cada unidade da população tem uma chance (probabilidade não zero) de ser selecionada na amostra, e essa chance pode ser determinada com precisão. As estatísticas de amostra assim produzidas, como média amostral ou desvio padrão, são estimativas imparciais dos parâmetros da população, desde que as unidades amostradas sejam ponderadas de acordo com sua probabilidade de seleção. Todas as amostras de probabilidade têm dois atributos em comum: (1) cada unidade da população tem uma probabilidade conhecida não nula de ser amostrada e (2) o procedimento de amostragem envolve seleção aleatória em algum momento. Os diferentes tipos de técnicas de amostragem probabilística incluem:
Simples amostragem aleatória. Nesta técnica, todos os subconjuntos possíveis de uma população (mais precisamente, de um quadro de amostragem) recebem uma probabilidade igual de serem selecionados. A probabilidade de selecionar qualquer conjunto de n unidades de um total de N unidades em uma base de amostragem é N C n . Assim, as estatísticas da amostra são estimativas imparciais dos parâmetros da população, sem qualquer ponderação. A amostragem aleatória simples envolve a seleção aleatória de respondentes a partir de uma base de amostragem, mas com grandes bases de amostragem, geralmente é usada uma tabela de números aleatórios ou um gerador de números aleatórios computadorizado. Por exemplo, se desejar selecionar 200 empresas para pesquisar a partir de uma lista de 1000 empresas, se essa lista for inserida em uma planilha como o Excel, você pode usar a função RAND() do Excel para gerar números aleatórios para cada um dos 1000 clientes dessa lista. Em seguida, ordene a lista por ordem crescente do número aleatório correspondente e selecione os 200 primeiros clientes dessa lista ordenada. Esta é a mais simples de todas as técnicas de amostragem de probabilidade; contudo, a simplicidade é também a força desta técnica. Como a estrutura de amostragem não é subdividida ou dividida, a amostra é imparcial e as inferências são mais generalizáveis entre todas as técnicas de amostragem de probabilidade.
Amostras sistemáticas. Nesta técnica, a base de amostragem é ordenada de acordo com alguns critérios e os elementos são selecionados em intervalos regulares através dessa lista ordenada. A amostragem sistemática envolve um início aleatório e, em seguida, procede com a seleção de cada k elemento a partir desse ponto, onde k = N / n , onde k é a razão do tamanho da moldura de amostragem N e o tamanho de amostra desejado n , e é formalmente chamada de razão de amostragem . É importante que o ponto de partida não seja automaticamente o primeiro da lista, mas que seja escolhido aleatoriamente a partir dos primeiros k elementos da lista. Em nosso exemplo anterior de seleção de 200 empresas de uma lista de 1000 empresas, você pode ordenar as 1000 empresas em ordem crescente (ou decrescente) de seu tamanho (ou seja, contagem de empregados ou receitas anuais), selecionar aleatoriamente uma das cinco primeiras empresas da lista ordenada e, em seguida, selecionar a cada quinta empresa da lista. Este processo assegurará que não haja representação excessiva de empresas grandes ou pequenas na sua amostra, mas sim que as empresas de todos os tamanhos sejam geralmente representadas de forma uniforme, como está na sua estrutura de amostragem. Em outras palavras, a amostra é representativa da população, pelo menos com base no critério de ordenação.
Amostragem estratificada. Na amostragem estratificada, a base de amostragem é dividida em subgrupos homogêneos e não sobrepostos (chamados de “estratos”), e uma amostra aleatória simples é retirada dentro de cada subgrupo. No exemplo anterior de seleção de 200 empresas de uma lista de 1000 empresas, é possível começar classificando as empresas com base em seu tamanho como grandes (mais de 500 empregados), médias (entre 50 e 500 empregados), e pequenas (menos de 50 empregados). Em seguida, o usuário pode selecionar aleatoriamente 67 empresas de cada subgrupo para compor a amostra de 200 empresas. Entretanto, como há muito mais empresas pequenas em um quadro de amostragem do que empresas grandes, ter um número igual de empresas pequenas, médias e grandes tornará a amostra menos representativa da população (ou seja, enviesada em favor de empresas grandes que são menos em número na população alvo). Isso é chamado de amostragem estratificada não proporcional porque a proporção da amostra dentro de cada subgrupo não reflete as proporções no quadro amostral (ou a população de interesse), e o subgrupo menor (empresas de grande porte) é super amostrado. Uma técnica alternativa será selecionar amostras de subgrupos em proporção ao seu tamanho na população. Por exemplo, se houver 100 empresas grandes, 300 empresas médias e 600 empresas pequenas, é possível amostrar 20 empresas do grupo “grande”, 60 do grupo “médio” e 120 do grupo “pequeno”. Nesse caso, a distribuição proporcional de firmas na população é mantida na amostra e, portanto, essa técnica é chamada de amostragem estratificada proporcional. Observe que a abordagem não proporcional é particularmente eficaz na representação de subgrupos pequenos, como empresas de grande porte, e não é necessariamente menos representativa da população em comparação com a abordagem proporcional, desde que os resultados da abordagem não proporcional sejam ponderados de acordo com a proporção de um subgrupo na população total.
Amostragem de cluster. Se houver uma população dispersa por uma ampla região geográfica, pode não ser viável conduzir uma amostragem aleatória simples de toda a população. Nesse caso, pode ser razoável dividir a população em “clusters” (geralmente ao longo dos limites geográficos), amostrar aleatoriamente alguns clusters e medir todas as unidades dentro desse cluster. Por exemplo, se você deseja amostrar governos municipais no estado de Nova York, ao invés de viajar por todo o estado para entrevistar funcionários-chave da cidade (como você pode ter a ver com uma simples amostra aleatória), você pode agrupar esses governos com base em seus condados, selecionar aleatoriamente um conjunto de três condados, e então entrevistar funcionários de cada funcionário desses condados. No entanto, dependendo das diferenças entre clusters, a variabilidade das estimativas de amostra em uma amostra de cluster será geralmente maior do que a de uma amostra aleatória simples e, portanto, os resultados são menos generalizáveis para a população do que aqueles obtidos com amostras aleatórias simples.
Amostragem de pares de pares de pares de pares de pares. Algumas vezes, os pesquisadores podem querer comparar dois subgrupos dentro de uma população, com base em um critério específico. Por exemplo, por que algumas empresas são consistentemente mais lucrativas do que outras empresas? Para realizar tal estudo, você teria que classificar uma amostragem de empresas em “empresas de alta rentabilidade” e “empresas de baixa rentabilidade” com base em margens brutas, lucros por ação, ou alguma outra medida de rentabilidade. Você selecionaria então uma amostra aleatória simples de empresas em um subgrupo e compararia cada empresa desse grupo com uma empresa do segundo subgrupo, com base em seu tamanho, segmento industrial e/ou outros critérios de comparação. Agora, você tem duas amostras combinadas de firmas de alta e baixa rentabilidade que você pode estudar com mais detalhes. Essa técnica de amostragem de pares combinados é frequentemente uma forma ideal de entender as diferenças bipolares entre diferentes subgrupos dentro de uma determinada população.
Amostragem em múltiplos estágios. As técnicas de amostragem de probabilidade descritas anteriormente são todas exemplos de técnicas de amostragem em um único estágio. Dependendo das suas necessidades de amostragem, você pode combinar essas técnicas de estágio único para conduzir a amostragem em múltiplos estágios. Por exemplo, é possível estratificar uma lista de negócios com base no tamanho da empresa e, em seguida, conduzir uma amostragem sistemática dentro de cada estrato. Esta é uma combinação de dois estágios de amostragem estratificada e sistemática. Da mesma forma, você pode começar com um agrupamento de distritos escolares no estado de Nova Iorque e, dentro de cada agrupamento, selecionar uma amostra aleatória simples de escolas; dentro de cada escola, selecionar uma amostra aleatória simples de níveis de série; e dentro de cada nível de série, selecionar uma amostra aleatória simples de alunos para estudo. Neste caso, você tem um processo de amostragem em quatro etapas que consiste em amostragem de cluster e amostragem aleatória simples.
Amostras de Não Probabilidade
Amostras de Não Probabilidade é uma técnica de amostragem na qual algumas unidades da população têm zero chance de seleção ou onde a probabilidade de seleção não pode ser determinada com precisão. Normalmente, as unidades são selecionadas com base em certos critérios não aleatórios, como quota ou conveniência. Como a seleção é não aleatória, a amostragem não probabilística não permite a estimativa de erros de amostragem, e pode estar sujeita a um viés de amostragem. Portanto, as informações de uma amostra não podem ser generalizadas de volta à população. Os tipos de técnicas de amostragem não probabilística incluem:
Amostras de conveniência. Também chamada de amostragem acidental ou de oportunidade, esta é uma técnica em que uma amostra é retirada da parte da população que está próxima, prontamente disponível, ou conveniente. Por exemplo, se você estiver do lado de fora de um shopping center e distribuir questionários às pessoas ou entrevistá-las enquanto elas entram, a amostra de entrevistados que você obterá será uma amostra de conveniência. Esta é uma amostra não-probabilidade porque você está excluindo sistematicamente todas as pessoas que fazem compras em outros centros comerciais. As opiniões que você obteria da sua amostra escolhida podem refletir as características únicas deste shopping center, como a natureza de suas lojas (por exemplo, lojas de alto padrão atrairão uma população mais abastada), o perfil demográfico de seus clientes, ou sua localização (por exemplo, um shopping perto de uma universidade atrairá principalmente estudantes universitários com hábitos de compra únicos) e, portanto, pode não ser representativo das opiniões da população de compradores em geral. Portanto, a generalização científica de tais observações será muito limitada. Outros exemplos de amostragem de conveniência são a amostragem de estudantes registrados em uma determinada classe ou a amostragem de pacientes que chegam a uma determinada clínica médica. Este tipo de amostragem é mais útil para testes piloto, onde o objetivo é testar instrumentos ou validação de medidas em vez de obter inferências generalizáveis.
Amostras de cotas. Nesta técnica, a população é segmentada em subgrupos mutuamente exclusivos (tal como na amostragem estratificada), e então um conjunto não aleatório de observações é escolhido de cada subgrupo para atender a uma cota pré-definida. Na amostragem por quotas proporcionais , a proporção de respondentes em cada subgrupo deve corresponder à da população. Por exemplo, se a população americana consiste em 70% de caucasianos, 15% de hispano-americanos e 13% de afro-americanos, e você deseja entender suas preferências de voto em uma amostra de 98 pessoas, você pode ficar do lado de fora de um shopping center e perguntar às pessoas suas preferências de voto. Mas você terá que parar de perguntar às pessoas de aparência hispânica quando você tiver 15 respostas desse subgrupo (ou afro-americanos quando você tiver 13 respostas), mesmo que você continue sampleando outros grupos étnicos, para que a composição étnica da sua amostra seja igual à da população geral americana. A amostragem não-proporcional de cotas é menos restritiva na medida em que você não precisa atingir uma representação proporcional, mas talvez atingir um tamanho mínimo em cada subgrupo. Neste caso, você pode decidir ter 50 respondentes de cada um dos três subgrupos étnicos (caucasianos, hispano-americanos e afro-americanos), e parar quando sua cota para cada subgrupo for atingida. Nenhum dos dois tipos de cotas será representativo da população americana, pois dependendo se seu estudo foi realizado em um shopping center em Nova York ou no Kansas, seus resultados podem ser totalmente diferentes. A técnica não proporcional é ainda menos representativa da população, mas pode ser útil na medida em que permite capturar as opiniões de grupos pequenos e subrepresentados através de sobreamostragem.
Amostragem de especialistas. Esta é uma técnica em que os respondentes são escolhidos de forma não aleatória com base no seu conhecimento sobre o fenómeno em estudo. Por exemplo, para entender os impactos de uma nova política governamental, como a Lei Sarbanes-Oxley, você pode amostrar um grupo de contadores corporativos que estão familiarizados com esta lei. A vantagem desta abordagem é que como os especialistas tendem a estar mais familiarizados com o assunto do que os não especialistas, as opiniões de uma amostra de especialistas são mais credíveis do que uma amostra que inclui tanto especialistas como não especialistas, embora os resultados ainda não sejam generalizáveis para a população em geral.
Amostras de Bola de Neve. Na amostragem com bola de neve, comece identificando alguns poucos respondentes que correspondam aos critérios para inclusão no estudo e, em seguida, peça-lhes que recomendem outros que eles conheçam e que também atendam aos critérios de seleção. Por exemplo, se desejar pesquisar administradores de rede de computadores e conhecer apenas uma ou duas dessas pessoas, pode começar com eles e pedir-lhes que recomendem outras pessoas que também façam administração de rede. Embora este método dificilmente conduza a amostras representativas, às vezes pode ser a única maneira de alcançar populações de difícil acesso ou quando não há uma estrutura de amostragem disponível.
Estatisticas de Amostragem
Nas seções anteriores, introduzimos termos como parâmetro de população, estatística de amostra e viés de amostragem. Nesta seção, vamos tentar entender o que esses termos significam e como eles estão relacionados entre si.
Quando você mede uma determinada observação de uma determinada unidade, como a resposta de uma pessoa a um item em escala de Liker, essa observação é chamada de resposta (veja Figura 8.2). Em outras palavras, uma resposta é um valor de medida fornecido por uma unidade amostrada. Cada respondente irá dar respostas diferentes a diferentes itens de um instrumento. As respostas de diferentes respondentes a um mesmo item ou observação podem ser agrupadas em uma distribuição de freqüência com base em sua freqüência de ocorrências. Para um grande número de respostas em uma amostra, essa distribuição de freqüência tende a se assemelhar a uma curva em forma de sino chamada distribuição normal , que pode ser usada para estimar características gerais de toda a amostra, tais como média amostral (média de todas as observações em uma amostra) ou desvio padrão (variabilidade ou dispersão das observações em uma amostra). Estas estimativas amostrais são chamadas estatísticas amostrais (uma “estatística” é um valor que é estimado a partir dos dados observados). As populações também têm médias e desvios-padrão que poderiam ser obtidos se pudéssemos amostrar toda a população. Entretanto, como a população inteira nunca pode ser amostrada, as características da população são sempre desconhecidas, e são chamadas de parâmetros populacionais (e não de “estatística” porque não são estimados estatisticamente a partir dos dados). A estatística da amostra pode diferir dos parâmetros da população se a amostra não for perfeitamente representativa da população; a diferença entre os dois é chamada de erro de amostragem . Teoricamente, se pudéssemos aumentar gradualmente o tamanho da amostra para que esta se aproxime cada vez mais da população, então o erro de amostragem diminuirá e uma estatística de amostra se aproximará cada vez mais do parâmetro populacional correspondente.
Se uma amostra for verdadeiramente representativa da população, então a estatística de amostra estimada deve ser idêntica aos parâmetros populacionais teóricos correspondentes. Como sabemos se as estatísticas amostrais estão, pelo menos, razoavelmente próximas dos parâmetros da população? Aqui, precisamos entender o conceito de uma distribuição de amostras. Imagine que você pegou três amostras aleatórias diferentes de uma determinada população, como mostrado na Figura 8.3, e para cada amostra, você derivou estatísticas amostrais tais como média amostral e desvio padrão. Se cada amostra aleatória foi verdadeiramente representativa da população, então a média das três amostras aleatórias será idêntica (e igual ao parâmetro da população), e a variabilidade da média da amostra será zero. Mas isto é extremamente improvável, dado que cada amostra aleatória constituirá provavelmente um subconjunto diferente da população e, portanto, as suas médias podem ser ligeiramente diferentes umas das outras. No entanto, você pode pegar esses três meios de amostra e traçar um histograma de freqüência dos meios de amostra. Se o número de tais amostras aumentar de três para 10 para 100, o histograma de frequência torna-se uma distribuição de amostras. Assim, uma distribuição de amostras é uma distribuição de freqüência de uma estatística de amostra (como média de amostra) de um conjunto de amostras , enquanto a distribuição de freqüência comumente referenciada é a distribuição de uma resposta (observação) de uma única amostra . Assim como uma distribuição de freqüência, a distribuição amostral também tenderá a ter mais estatísticas amostrais agrupadas em torno da média (que presumivelmente é uma estimativa de um parâmetro populacional), com menos valores dispersos em torno da média. Com um número infinitamente grande de amostras, esta distribuição aproximar-se-á de uma distribuição normal. A variabilidade ou dispersão de uma estatística amostral em uma distribuição amostral (ou seja, o desvio padrão de uma estatística amostral) é chamada de seu erro padrão . Em contraste, o termo desvio padrão é reservado para variabilidade de uma resposta observada de uma única amostra.
Figure 8.2. Estatística da amostra.
O valor médio de uma estatística da amostra em uma distribuição amostral é presumido como uma estimativa do parâmetro de população desconhecida. Com base na dispersão dessa distribuição de amostras (ou seja, com base no erro padrão), também é possível estimar intervalos de confiança para esse parâmetro de população de previsão. O intervalo de confiança é a probabilidade estimada de que um parâmetro da população esteja dentro de um intervalo específico de valores estatísticos da amostra. Todas as distribuições normais tendem a seguir uma regra de 68-95-99% (ver Figura 8.4), que diz que mais de 68% dos casos na distribuição estão dentro de um desvio padrão do valor médio (µ + 1σ), mais de 95% dos casos na distribuição estão dentro de dois desvios padrão da média (µ + 2σ), e mais de 99% dos casos na distribuição estão dentro de três desvios padrão do valor médio (µ + 3σ). Como uma distribuição por amostragem com um número infinito de amostras se aproximará de uma distribuição normal, a mesma regra 68-95-99 se aplica, e pode-se dizer que:
- (estatística da amostra + um erro padrão) representa um intervalo de confiança de 68% para o parâmetro população.
- (Estatística de amostra + dois erros padrão) representa um intervalo de confiança de 95% para o parâmetro de população.
- (Estatística de amostra + três erros padrão) representa um intervalo de confiança de 99% para o parâmetro de população.
Figure 8.3. A distribuição de amostras.
Uma amostra é “enviesada” (ou seja, não representativa da população) se sua distribuição de amostras não puder ser estimada ou se a distribuição de amostras violar a regra dos 68-95-99%. Como um aparte, note que na maioria das análises de regressão onde examinamos a significância dos coeficientes de regressão com p<0,05, estamos tentando ver se a estatística amostral (coeficiente de regressão) prevê o parâmetro populacional correspondente (tamanho do efeito real) com um intervalo de confiança de 95%. Curiosamente, o padrão “seis sigma” tenta identificar defeitos de fabricação fora do intervalo de confiança de 99% ou seis desvios padrão (desvio padrão é representado usando a letra grega sigma), representando testes de significância em p<0,01.
Figure 8,4. A regra 68-95-99 por cento para intervalo de confiança.