Samhällsvetenskapliga forskningsmetoder

Sampling är en statistisk process där man väljer ut en delmängd (ett s.k. urval) av en population av intresse för att göra observationer och statistiska slutsatser om denna population. Samhällsvetenskaplig forskning handlar i allmänhet om att dra slutsatser om beteendemönster inom specifika populationer. Vi kan inte studera hela populationer på grund av genomförbarhets- och kostnadsbegränsningar, och därför måste vi välja ut ett representativt urval från den berörda populationen för observation och analys. Det är ytterst viktigt att välja ett urval som verkligen är representativt för populationen så att de slutsatser som dras från urvalet kan generaliseras tillbaka till den berörda populationen. Ett felaktigt och snedvridet urval är den främsta orsaken till de ofta avvikande och felaktiga slutsatser som rapporteras i opinionsundersökningar och exit polls som genomförs av olika opinionsundersökningsgrupper, t.ex. CNN/Gallup Poll, ABC och CBS, inför varje amerikanskt presidentval.

Samplingsprocessen

Figur 8.1. Urvalsprocessen

Utvalsprocessen består av flera steg. Det första steget är att definiera målpopulationen. En population kan definieras som alla människor eller föremål ( analysenhet ) med de egenskaper som man vill studera. Analysenheten kan vara en person, en grupp, en organisation, ett land, ett objekt eller någon annan enhet som man vill dra vetenskapliga slutsatser om. Ibland är populationen uppenbar. Om en tillverkare till exempel vill avgöra om färdiga varor som tillverkas vid en produktionslinje uppfyller vissa kvalitetskrav eller om de måste skrotas och omarbetas, består populationen av alla färdiga varor som tillverkas vid den produktionsanläggningen. Vid andra tillfällen kan målpopulationen vara lite svårare att förstå. Om du vill identifiera de främsta drivkrafterna för akademiskt lärande bland gymnasieelever, vilken är då din målgrupp: gymnasieelever, deras lärare, rektorer eller föräldrar? Det rätta svaret i det här fallet är gymnasieelever, eftersom du är intresserad av deras prestationer, inte av deras lärares, föräldrars eller skolors prestationer. På samma sätt, om du vill analysera roulettehjulens beteende för att identifiera snedvridna hjul, är din målpopulation inte olika observationer från ett enda roulettehjul, utan olika roulettehjul (dvs. deras beteende över en oändlig uppsättning hjul).

Det andra steget i provtagningsprocessen är att välja en provtagningsram . Detta är en tillgänglig del av målpopulationen (vanligtvis en lista med kontaktuppgifter) från vilken ett urval kan dras. Om din målpopulation är yrkesverksamma anställda på jobbet, eftersom du inte kan få tillgång till alla yrkesverksamma anställda runt om i världen, kommer en mer realistisk urvalsram att vara anställningslistor från ett eller två lokala företag som är villiga att delta i din studie. Om din målgrupp är organisationer kan Fortune 500-listan över företag eller Standard & Poor’s (S&P) lista över företag som är registrerade på New York-börsen vara acceptabla urvalsramar.

Notera att urvalsramar kanske inte helt och hållet är representativa för populationen i stort, och om så är fallet är det möjligt att slutsatser som härleds från ett sådant urval inte kan generaliseras till populationen. Om din målpopulation till exempel är organisationsanställda i stort (t.ex. om du vill studera anställdas självkänsla i denna population) och din urvalsram består av anställda på bilföretag i den amerikanska mellanvästern, kan det hända att resultaten från sådana grupper inte ens kan generaliseras till den amerikanska arbetskraften i stort, för att inte tala om den globala arbetsplatsen. Detta beror på att den amerikanska bilindustrin har varit utsatt för ett hårt konkurrenstryck under de senaste 50 åren och har upplevt många omorganisationer och nedskärningar, vilket kan ha resulterat i låg arbetsmoral och självkänsla bland de anställda. Dessutom är majoriteten av den amerikanska arbetskraften anställd inom tjänstesektorn eller i småföretag, och inte inom bilindustrin. Ett urval av anställda inom den amerikanska bilindustrin är därför inte särskilt representativt för den amerikanska arbetskraften. På samma sätt omfattar Fortune 500-listan de 500 största amerikanska företagen, vilket inte är representativt för alla amerikanska företag i allmänhet, varav de flesta är medelstora och små företag snarare än stora företag, och är därför en snedvriden urvalsram. Däremot gör S&P-listan det möjligt att välja stora, medelstora och/eller små företag, beroende på om man använder S&P-listorna över stora, medelstora eller små företag, men den omfattar offentligt handlade företag (och inte privata företag) och är därför fortfarande snedvriden. Observera också att den population från vilken ett urval dras inte nödvändigtvis är densamma som den population som vi faktiskt vill ha information om. Om en forskare t.ex. vill veta hur framgångsrik ett nytt rökavvänjningsprogram är, är målpopulationen alla rökare som har tillgång till programmet, vilket kan vara en okänd population. Därför kan forskaren ta ett urval av patienter som kommer till en lokal sjukvårdsinrättning för behandling för rökavvänjning, av vilka en del kanske inte har fått ta del av just detta program för rökavvänjning, och i så fall motsvarar inte urvalsramen den berörda populationen.

Det sista steget i urvalet är att välja ut ett urval från urvalsramen med hjälp av en väldefinierad urvalsmetod. Provtagningstekniker kan delas in i två breda kategorier: sannolikhetsurval (slumpmässigt) och icke-sannolikhetsurval. Sannolikhetsurval är idealiskt om det är viktigt att resultaten kan generaliseras i din undersökning, men det kan finnas unika omständigheter där icke-sannolikhetsurval också kan vara motiverat. Dessa tekniker diskuteras i de två följande avsnitten.

Sannolikhetsurval

Sannolikhetsurval är en teknik där varje enhet i populationen har en chans (sannolikhet som inte är noll) att väljas ut i urvalet, och denna chans kan bestämmas exakt. Urvalsstatistik som framställs på detta sätt, t.ex. urvalets medelvärde eller standardavvikelse, är opartiska skattningar av populationsparametrar, så länge som de enheter som ingår i urvalet viktas i enlighet med deras sannolikhet att väljas ut. Alla sannolikhetsurval har två egenskaper gemensamt: 1) varje enhet i populationen har en känd sannolikhet som inte är noll för att ingå i urvalet, och 2) urvalsförfarandet inbegriper ett slumpmässigt urval vid någon tidpunkt. De olika typerna av sannolikhetsurvalstekniker omfattar:

Simpelt slumpmässigt urval. I denna teknik ges alla möjliga delmängder av en population (mer exakt, av en provtagningsram) lika stor sannolikhet att väljas ut. Sannolikheten för att välja en uppsättning n enheter av totalt N enheter i en urvalsram är N C n . Urvalsstatistik är därför opartiska skattningar av populationsparametrar, utan någon viktning. Enkelt slumpmässigt urval innebär att man slumpmässigt väljer ut respondenter från en urvalsram, men när det gäller stora urvalsramar används vanligen en tabell med slumpmässiga nummer eller en datoriserad slumpgenerator. Om du till exempel vill välja ut 200 företag att undersöka från en lista med 1 000 företag kan du, om denna lista förs in i ett kalkylblad som Excel, använda Excels funktion RAND() för att generera slumptal för var och en av de 1 000 kunderna på listan. Därefter sorterar du listan i stigande ordning efter motsvarande slumptal och väljer de 200 första klienterna på den sorterade listan. Detta är den enklaste av alla tekniker för sannolikhetsurval, men enkelheten är också teknikens styrka. Eftersom urvalsramen inte är indelad eller uppdelad är urvalet opartiskt och slutsatserna är mest generaliserbara bland alla sannolikhetsurvalstekniker.

Systematiskt urval. I denna teknik är urvalsramen ordnad enligt vissa kriterier och element väljs ut med regelbundna intervaller genom den ordnade listan. Systematisk provtagning innebär att man börjar med en slumpmässig start och sedan väljer var k:e element från och med den punkten, där k = N / n , där k är förhållandet mellan provtagningsramens storlek N och den önskade urvalsstorleken n , och formellt kallas provtagningsförhållandet . Det är viktigt att startpunkten inte automatiskt är den första i listan, utan att den i stället väljs slumpmässigt bland de första k elementen i listan. I vårt tidigare exempel med att välja ut 200 företag från en lista med 1 000 företag kan man sortera de 1 000 företagen i ökande (eller minskande) ordning efter storlek (dvs. antal anställda eller årsintäkter), slumpmässigt välja ut ett av de fem första företagen på den sorterade listan och sedan välja ut vart femte företag på listan. Denna process säkerställer att det inte finns någon överrepresentation av stora eller små företag i ditt urval, utan snarare att företag av alla storlekar generellt sett är enhetligt representerade, precis som i din urvalsram. Med andra ord är urvalet representativt för populationen, åtminstone på grundval av sorteringskriteriet.

Stratifierat urval. Vid stratifierad provtagning delas urvalsramen in i homogena och icke överlappande undergrupper (kallade ”strata”) och ett enkelt slumpmässigt urval dras inom varje undergrupp. I det tidigare exemplet med att välja ut 200 företag från en lista med 1 000 företag kan du börja med att kategorisera företagen utifrån deras storlek som stora (mer än 500 anställda), medelstora (mellan 50 och 500 anställda) och små (mindre än 50 anställda). Du kan sedan slumpmässigt välja ut 67 företag från varje undergrupp för att få ett urval på 200 företag. Eftersom det finns många fler små företag än stora företag i en urvalsram kommer ett lika stort antal små, medelstora och stora företag att göra urvalet mindre representativt för populationen (dvs. det kommer att vara snedvridet till förmån för stora företag som är färre i målpopulationen). Detta kallas icke-proportionellt stratifierat urval eftersom andelen av urvalet inom varje undergrupp inte återspeglar proportionerna i urvalsramen (eller den berörda populationen), och den mindre undergruppen (stora företag) är överrepresenterad. En alternativ teknik är att välja ut undergrupper i proportion till deras storlek i populationen. Om det till exempel finns 100 stora företag, 300 medelstora företag och 600 små företag, kan man ta ut 20 företag från den ”stora” gruppen, 60 från den ”medelstora” gruppen och 120 från den ”lilla” gruppen. I detta fall behålls den proportionella fördelningen av företagen i populationen i urvalet, och därför kallas denna teknik för proportionellt stratifierat urval. Observera att det icke-proportionella tillvägagångssättet är särskilt effektivt när det gäller att representera små undergrupper, t.ex. stora företag, och att det inte nödvändigtvis är mindre representativt för populationen än det proportionella tillvägagångssättet, så länge resultaten av det icke-proportionella tillvägagångssättet viktas i enlighet med en undergrupps andel av den totala populationen.

Cluster sampling. Om du har en population som är spridd över ett stort geografiskt område är det kanske inte möjligt att genomföra ett enkelt slumpmässigt urval av hela populationen. I sådana fall kan det vara rimligt att dela in populationen i ”kluster” (vanligtvis längs geografiska gränser), ta ett slumpmässigt urval av några kluster och mäta alla enheter inom det klustret. Om du till exempel vill göra ett urval av stadsförvaltningar i delstaten New York, kan du i stället för att resa runt i hela delstaten för att intervjua de viktigaste tjänstemännen i staden (vilket du kanske måste göra med ett enkelt slumpmässigt urval), gruppera dessa förvaltningar på grundval av deras län, slumpmässigt välja ut tre län och sedan intervjua tjänstemän från varje tjänsteman i dessa län. Beroende på skillnaderna mellan kluster kommer dock variabiliteten i urvalsuppskattningarna i ett klusterurval i allmänhet att vara högre än i ett enkelt slumpmässigt urval, och därmed är resultaten mindre generaliserbara till populationen än de som erhålls från enkla slumpmässiga urval.

Matched-pairs sampling. Ibland kan forskare vilja jämföra två undergrupper inom en population utifrån ett specifikt kriterium. Varför är till exempel vissa företag konsekvent mer lönsamma än andra företag? För att genomföra en sådan undersökning måste man kategorisera en urvalsram av företag i ”företag med hög lönsamhet” och ”företag med låg lönsamhet” på grundval av bruttomarginaler, vinst per aktie eller något annat lönsamhetsmått. Du skulle sedan välja ut ett enkelt slumpmässigt urval av företag i den ena undergruppen och matcha varje företag i denna grupp med ett företag i den andra undergruppen på grundval av storlek, branschsegment och/eller andra matchningskriterier. Nu har du två matchade urval av företag med hög respektive låg lönsamhet som du kan studera närmare. En sådan matchad provtagningsteknik är ofta ett idealiskt sätt att förstå bipolära skillnader mellan olika undergrupper inom en viss population.

Multi-stage sampling. De sannolikhetsurvalstekniker som beskrivits tidigare är alla exempel på enstegsurvalstekniker. Beroende på dina provtagningsbehov kan du kombinera dessa enstegstekniker för att genomföra ett flerstegsurval. Du kan till exempel stratifiera en lista över företag utifrån företagets storlek och sedan göra ett systematiskt urval inom varje stratum. Detta är en tvåstegskombination av stratifierad och systematisk provtagning. På samma sätt kan man börja med ett kluster av skoldistrikt i delstaten New York och inom varje kluster välja ut ett enkelt slumpmässigt urval av skolor, inom varje skola välja ut ett enkelt slumpmässigt urval av årskursnivåer och inom varje årskursnivå välja ut ett enkelt slumpmässigt urval av elever för undersökning. I det här fallet har du en provtagningsprocess i fyra steg som består av kluster- och enkelt slumpmässigt urval.

Nonprobability Sampling

Nonprobability sampling är en provtagningsteknik där vissa enheter i populationen har noll chans att väljas ut eller där sannolikheten för urvalet inte kan bestämmas med exakthet. Typiskt sett väljs enheterna ut på grundval av vissa icke slumpmässiga kriterier, t.ex. kvotering eller bekvämlighet. Eftersom urvalet inte är slumpmässigt kan man vid icke-sannolikhetsurval inte uppskatta urvalsfel, och urvalet kan vara snedvridet. Därför kan information från ett urval inte generaliseras till populationen. Typer av icke-sannolikhetsurvalstekniker inkluderar:

Bekvämlighetsurval. Detta är en teknik där ett urval görs från den del av populationen som är nära till hands, lättillgänglig eller bekväm. Om du till exempel står utanför ett köpcentrum och delar ut frågeformulär till människor eller intervjuar dem när de går in, kommer det urval av respondenter du får att vara ett bekvämlighetsurval. Detta är ett icke-probability sample eftersom du systematiskt utesluter alla människor som handlar i andra köpcentrum. De åsikter som du skulle få från det valda urvalet kan återspegla de unika egenskaperna hos det här köpcentret, t.ex. butikernas karaktär (t.ex. kommer butiker med hög kvalitet att locka till sig en mer välbärgad befolkningsgrupp), den demografiska profilen hos kunderna eller dess läge (t.ex. kommer ett köpcenter nära ett universitet främst att locka till sig universitetsstuderande med unika inköpsvanor), och är därför inte nödvändigtvis representativa för åsikterna hos den shoppande befolkningen i stort. Den vetenskapliga generaliserbarheten av sådana observationer kommer därför att vara mycket begränsad. Andra exempel på bekvämlighetsurval är provtagning av elever som är registrerade i en viss klass eller provtagning av patienter som kommer till en viss medicinsk klinik. Denna typ av provtagning är mest användbar för pilottestning, där målet är att testa instrument eller validera mätningar snarare än att få generaliserbara slutsatser.

Kvotprovtagning. I denna teknik segmenteras populationen i ömsesidigt uteslutande undergrupper (precis som i stratifierat urval), och sedan väljs en icke slumpmässig uppsättning observationer från varje undergrupp för att uppfylla en fördefinierad kvot. Vid proportionellt kvoturval ska andelen respondenter i varje undergrupp motsvara andelen i populationen. Om den amerikanska befolkningen till exempel består av 70 % kaukasier, 15 % latinamerikaner och 13 % afroamerikaner, och du vill förstå deras röstpreferenser i ett urval av 98 personer, kan du stå utanför ett köpcentrum och fråga folk om deras röstpreferenser. Men du måste sluta fråga personer med spanskt utseende när du får 15 svar från den undergruppen (eller afroamerikaner när du får 13 svar), även om du fortsätter att ta prover från andra etniska grupper, så att den etniska sammansättningen i ditt urval stämmer överens med den i den allmänna amerikanska befolkningen. Icke-proportionell kvotprovtagning är mindre restriktiv i det avseendet att du inte behöver uppnå en proportionell representation, men kanske uppnå en minimistorlek i varje undergrupp. I det här fallet kan du bestämma dig för att ha 50 respondenter från var och en av de tre etniska undergrupperna (vita, latinamerikaner och afroamerikaner) och sluta när din kvot för varje undergrupp är uppnådd. Ingendera typen av kvotprovtagning kommer att vara representativ för den amerikanska befolkningen, eftersom resultaten kan bli helt annorlunda beroende på om din undersökning genomfördes i ett köpcentrum i New York eller Kansas. Den icke-proportionella tekniken är ännu mindre representativ för befolkningen, men kan vara användbar eftersom den gör det möjligt att fånga upp åsikter från små och underrepresenterade grupper genom överprovtagning.

Expertprovtagning. Detta är en teknik där respondenterna väljs ut på ett icke slumpmässigt sätt baserat på deras expertis om det fenomen som studeras. För att till exempel förstå effekterna av en ny statlig policy som Sarbanes-Oxley-lagen kan man göra ett urval av en grupp företagsrevisorer som är bekanta med denna lag. Fördelen med detta tillvägagångssätt är att eftersom experter tenderar att vara mer bekanta med ämnet än icke-experter, är åsikter från ett urval av experter mer trovärdiga än ett urval som omfattar både experter och icke-experter, även om resultaten fortfarande inte kan generaliseras till den totala populationen i stort.

Snowball sampling. Vid snöbollsurval börjar du med att identifiera några få respondenter som uppfyller kriterierna för att ingå i din undersökning och ber dem sedan att rekommendera andra som de känner och som också uppfyller urvalskriterierna. Om du till exempel vill undersöka nätverksadministratörer och bara känner till en eller två sådana personer kan du börja med dem och be dem rekommendera andra som också sysslar med nätverksadministration. Även om denna metod knappast leder till representativa urval kan den ibland vara det enda sättet att nå ut till populationer som är svåra att nå eller när det inte finns någon urvalsram att tillgå.

Stickprovstatistik

I de föregående avsnitten har vi introducerat termer som populationsparameter, stickprovsstatistik och stickprovsbias. I det här avsnittet ska vi försöka förstå vad dessa termer betyder och hur de är relaterade till varandra.

När du mäter en viss observation från en given enhet, t.ex. en persons svar på ett objekt med Likert-skalor, kallas den observationen för ett svar (se figur 8.2). Med andra ord är ett svar ett mätvärde som tillhandahålls av en provtagen enhet. Varje respondent kommer att ge dig olika svar på olika punkter i ett instrument. Svaren från olika respondenter på samma objekt eller observation kan grafiskt visas i en frekvensfördelning baserat på hur ofta de förekommer. För ett stort antal svar i ett urval tenderar denna frekvensfördelning att likna en klockformad kurva som kallas normalfördelning , som kan användas för att uppskatta övergripande egenskaper för hela urvalet, t.ex. urvalets medelvärde (genomsnittet av alla observationer i ett urval) eller standardavvikelse (variabiliteten eller spridningen av observationer i ett urval). Dessa uppskattningar av urvalet kallas urvalsstatistik (en ”statistik” är ett värde som uppskattas från observerade data). Populationer har också medelvärden och standardavvikelser som skulle kunna erhållas om vi kunde göra ett urval av hela populationen. Men eftersom hela populationen aldrig kan provtas är populationens egenskaper alltid okända och kallas populationsparametrar (och inte ”statistik” eftersom de inte är statistiskt uppskattade från data). Urvalsstatistiken kan skilja sig från populationsparametrarna om urvalet inte är helt representativt för populationen; skillnaden mellan de två kallas för urvalsfel . Teoretiskt sett, om vi gradvis kan öka stickprovsstorleken så att stickprovet närmar sig populationen allt mer, kommer stickprovsfelet att minska och en stickprovsstatistik kommer i allt högre grad att närma sig motsvarande populationsparameter.

Om ett stickprov verkligen är representativt för populationen, bör den uppskattade stickprovsstatistiken vara identisk med motsvarande teoretiska populationsparametrar. Hur vet vi om urvalsstatistiken åtminstone ligger någorlunda nära populationsparametrarna? Här måste vi förstå begreppet provtagningsfördelning . Föreställ dig att du har tagit tre olika slumpmässiga urval från en given population, enligt figur 8.3, och för varje urval har du tagit fram urvalsstatistik som t.ex. urvalsmedelvärde och standardavvikelse. Om varje slumpmässigt urval verkligen var representativt för populationen kommer dina tre urvalsmedelvärden från de tre slumpmässiga urvalen att vara identiska (och lika med populationsparametern), och variationen i urvalsmedelvärdena kommer att vara noll. Men detta är ytterst osannolikt, eftersom varje slumpmässigt urval sannolikt kommer att utgöra en annan delmängd av populationen, och därför kan deras medelvärden skilja sig något från varandra. Du kan dock ta dessa tre urvalsmedelvärden och rita upp ett frekvenshistogram över urvalsmedelvärdena. Om antalet sådana stickprov ökar från tre till 10 eller 100 blir frekvenshistogrammet en stickprovsfördelning. En provtagningsfördelning är alltså en frekvensfördelning av en provstatistik (t.ex. provmedelvärde) från en uppsättning prov, medan den vanliga frekvensfördelningen är fördelningen av ett svar (en observation) från ett enskilt prov . Precis som en frekvensfördelning kommer provtagningsfördelningen också att ha en tendens att ha mer provstatistik som är grupperad kring medelvärdet (som förmodligen är en uppskattning av en populationsparameter), med färre värden som är utspridda kring medelvärdet. Med ett oändligt stort antal stickprov kommer denna fördelning att närma sig en normalfördelning. Variabiliteten eller spridningen av en provtagningsstatistik i en provtagningsfördelning (dvs. standardavvikelsen för en provtagningsstatistik) kallas dess standardfel . Däremot är termen standardavvikelse reserverad för variabiliteten hos ett observerat svar från ett enskilt prov.

Figur 8.2. Provstatistik.

Medelvärdet av en provstatistik i en provfördelning antas vara en uppskattning av den okända populationsparametern. Baserat på spridningen av denna provtagningsfördelning (dvs. baserat på standardfelet) är det också möjligt att skatta konfidensintervall för den förutsägbara populationsparametern. Konfidensintervallet är den uppskattade sannolikheten för att en populationsparameter ligger inom ett visst intervall av statistiska värden för urvalet. Alla normalfördelningar tenderar att följa regeln 68-95-99 procent (se figur 8.4), som säger att över 68 % av fallen i fördelningen ligger inom en standardavvikelse från medelvärdet (µ + 1σ), över 95 % av fallen i fördelningen ligger inom två standardavvikelser från medelvärdet (µ + 2σ) och över 99 % av fallen i fördelningen ligger inom tre standardavvikelser från medelvärdet (µ + 3σ). Eftersom en provtagningsfördelning med ett oändligt antal provtagningar kommer att närma sig en normalfördelning gäller samma 68-95-99-regel, och man kan säga att:

  • (provtagningsstatistik + ett standardfel) representerar ett konfidensintervall på 68 % för populationsparametern.
  • (Provstatistik + två standardfel) representerar ett 95-procentigt konfidensintervall för populationsparametern.
  • (Provstatistik + tre standardfel) representerar ett 99-procentigt konfidensintervall för populationsparametern.

Figur 8.3. Urvalsfördelningen.

Ett urval är ”snedvridet” (dvs. inte representativt för populationen) om dess urvalsfördelning inte kan uppskattas eller om urvalsfördelningen bryter mot regeln 68-95-99 procent. Som ett tillägg kan man notera att i de flesta regressionsanalyser där vi undersöker betydelsen av regressionskoefficienter med p<0,05, försöker vi se om provtagningsstatistiken (regressionskoefficienten) förutsäger motsvarande populationsparameter (sann effektstorlek) med ett 95-procentigt konfidensintervall. Intressant nog försöker man med ”sex sigma”-standarden identifiera tillverkningsfel utanför 99 % konfidensintervallet eller sex standardavvikelser (standardavvikelsen representeras av den grekiska bokstaven sigma), vilket motsvarar signifikanstestning vid p<0,01.

Figur 8.4. 68-95-99-procentsregeln för konfidensintervall.