Forschungsmethoden für die Sozialwissenschaften

Stichprobenziehung ist der statistische Prozess der Auswahl einer Teilmenge (genannt „Stichprobe“) einer interessierenden Population, um Beobachtungen und statistische Schlüsse über diese Population zu ziehen. In der sozialwissenschaftlichen Forschung geht es im Allgemeinen darum, Verhaltensmuster innerhalb bestimmter Populationen zu erkennen. Aus Gründen der Durchführbarkeit und der Kosten können wir nicht die gesamte Bevölkerung untersuchen und müssen daher eine repräsentative Stichprobe aus der interessierenden Population für die Beobachtung und Analyse auswählen. Es ist äußerst wichtig, eine Stichprobe auszuwählen, die wirklich repräsentativ für die Population ist, damit die aus der Stichprobe abgeleiteten Schlussfolgerungen auf die interessierende Population zurückverallgemeinert werden können. Unsachgemäße und voreingenommene Stichproben sind der Hauptgrund für häufig abweichende und fehlerhafte Schlussfolgerungen in Meinungsumfragen und Exit Polls, die von verschiedenen Meinungsforschungsinstituten wie CNN/Gallup Poll, ABC und CBS vor jeder Präsidentschaftswahl in den USA durchgeführt werden.

Der Stichprobenprozess

Abbildung 8.1. Das Stichprobenverfahren

Das Stichprobenverfahren besteht aus mehreren Stufen. Die erste Stufe ist die Definition der Zielpopulation. Eine Grundgesamtheit kann definiert werden als alle Personen oder Gegenstände (Analyseeinheit) mit den Merkmalen, die man untersuchen möchte. Die Analyseeinheit kann eine Person, eine Gruppe, eine Organisation, ein Land, ein Objekt oder eine andere Einheit sein, über die man wissenschaftliche Schlüsse ziehen möchte. Manchmal ist die Grundgesamtheit offensichtlich. Wenn beispielsweise ein Hersteller feststellen möchte, ob die an einer Produktionslinie hergestellten Fertigerzeugnisse bestimmte Qualitätsanforderungen erfüllen oder ob sie verschrottet und überarbeitet werden müssen, dann besteht die Grundgesamtheit aus allen in dieser Produktionsstätte hergestellten Fertigerzeugnissen. In anderen Fällen ist die Zielpopulation vielleicht etwas schwieriger zu verstehen. Wenn Sie die wichtigsten Faktoren für das akademische Lernen von Gymnasiasten ermitteln möchten, was ist dann Ihre Zielgruppe: Gymnasiasten, ihre Lehrer, Schulleiter oder Eltern? Die richtige Antwort lautet in diesem Fall: Schüler, denn Sie sind an ihren Leistungen interessiert, nicht an denen ihrer Lehrer, Eltern oder Schulen. Wenn Sie das Verhalten von Roulettekesseln analysieren wollen, um verzerrte Kessel zu identifizieren, ist Ihre interessierende Population nicht die verschiedenen Beobachtungen eines einzigen Roulettekessels, sondern verschiedene Roulettekessel (d. h. ihr Verhalten über eine unendliche Anzahl von Kesseln).

Der zweite Schritt im Stichprobenverfahren ist die Auswahl eines Stichprobenrahmens. Dabei handelt es sich um einen zugänglichen Teil der Zielpopulation (in der Regel eine Liste mit Kontaktinformationen), aus dem eine Stichprobe gezogen werden kann. Wenn es sich bei Ihrer Zielgruppe um berufstätige Angestellte handelt und Sie keinen Zugang zu allen berufstätigen Angestellten auf der ganzen Welt haben, ist ein realistischerer Stichprobenrahmen die Mitarbeiterliste von ein oder zwei lokalen Unternehmen, die bereit sind, an Ihrer Studie teilzunehmen. Handelt es sich bei Ihrer Zielpopulation um Unternehmen, dann können die Fortune 500-Liste oder die Standard & Poor’s (S&P)-Liste der an der New Yorker Börse registrierten Unternehmen akzeptable Stichprobenrahmen sein.

Bitte beachten Sie, dass Stichprobenrahmen möglicherweise nicht vollständig repräsentativ für die Grundgesamtheit sind, und wenn dies der Fall ist, sind die aus einer solchen Stichprobe abgeleiteten Schlussfolgerungen möglicherweise nicht auf die Grundgesamtheit verallgemeinerbar. Wenn Ihre Zielpopulation z. B. die Mitarbeiter eines Unternehmens sind (z. B. wenn Sie das Selbstwertgefühl der Mitarbeiter in dieser Population untersuchen wollen) und Ihr Stichprobenrahmen aus Mitarbeitern von Automobilunternehmen im Mittleren Westen der USA besteht, sind die Ergebnisse aus solchen Gruppen möglicherweise nicht einmal auf die amerikanische Belegschaft insgesamt verallgemeinerbar, geschweige denn auf die weltweite Arbeitswelt. Dies liegt daran, dass die amerikanische Automobilindustrie in den letzten 50 Jahren unter starkem Wettbewerbsdruck stand und zahlreiche Umstrukturierungen und Personalabbau erlebt hat, was möglicherweise zu einer niedrigen Arbeitsmoral und einem geringen Selbstwertgefühl der Mitarbeiter geführt hat. Darüber hinaus ist die Mehrheit der amerikanischen Arbeitskräfte im Dienstleistungssektor oder in kleinen Unternehmen beschäftigt und nicht in der Automobilindustrie. Daher ist eine Stichprobe von Beschäftigten in der amerikanischen Automobilindustrie nicht besonders repräsentativ für die amerikanische Erwerbsbevölkerung. Ebenso umfasst die Fortune 500-Liste die 500 größten amerikanischen Unternehmen, was nicht repräsentativ für alle amerikanischen Unternehmen im Allgemeinen ist, von denen die meisten eher mittlere und kleine als große Unternehmen sind, und daher ein verzerrter Stichprobenrahmen ist. Im Gegensatz dazu ermöglicht die S&P-Liste die Auswahl großer, mittlerer und/oder kleiner Unternehmen, je nachdem, ob Sie die S&P-Listen für Großunternehmen, mittelgroße Unternehmen oder kleine Unternehmen verwenden, enthält jedoch börsennotierte Unternehmen (und keine Privatunternehmen) und ist daher immer noch verzerrt. Beachten Sie auch, dass die Grundgesamtheit, aus der eine Stichprobe gezogen wird, nicht unbedingt mit der Grundgesamtheit übereinstimmen muss, über die wir eigentlich Informationen wünschen. Möchte ein Forscher beispielsweise die Erfolgsquote eines neuen Programms zur Raucherentwöhnung ermitteln, dann ist die Zielpopulation die Gesamtheit der Raucher, die Zugang zu diesem Programm hatten, was eine unbekannte Population sein kann. Daher kann der Forscher eine Stichprobe von Patienten nehmen, die in einer örtlichen medizinischen Einrichtung eine Behandlung zur Raucherentwöhnung erhalten, von denen einige möglicherweise noch nicht mit diesem speziellen Programm zur Raucherentwöhnung in Berührung gekommen sind; in diesem Fall entspricht der Stichprobenrahmen nicht der interessierenden Population.

Der letzte Schritt bei der Stichprobenziehung ist die Auswahl einer Stichprobe aus dem Stichprobenrahmen unter Verwendung eines genau definierten Stichprobenverfahrens. Stichprobenverfahren können in zwei große Kategorien eingeteilt werden: Wahrscheinlichkeitsstichproben (Zufallsstichproben) und Nicht-Wahrscheinlichkeitsstichproben. Wahrscheinlichkeitsstichproben sind ideal, wenn die Verallgemeinerbarkeit der Ergebnisse für Ihre Studie wichtig ist, aber es kann einzigartige Umstände geben, unter denen auch Nicht-Wahrscheinlichkeitsstichproben gerechtfertigt sein können. Diese Techniken werden in den nächsten beiden Abschnitten erörtert.

Wahrscheinlichkeitsstichproben

Wahrscheinlichkeitsstichproben sind Techniken, bei denen jede Einheit der Grundgesamtheit eine Chance (eine Wahrscheinlichkeit ungleich Null) hat, in die Stichprobe aufgenommen zu werden, und diese Chance genau bestimmt werden kann. Die auf diese Weise erstellten Stichprobenstatistiken, wie z. B. der Stichprobenmittelwert oder die Standardabweichung, sind unverzerrte Schätzungen der Populationsparameter, sofern die Stichprobeneinheiten entsprechend ihrer Auswahlwahrscheinlichkeit gewichtet werden. Alle Wahrscheinlichkeitsstichproben haben zwei Eigenschaften gemeinsam: (1) jede Einheit in der Grundgesamtheit hat eine bekannte Wahrscheinlichkeit ungleich Null, in die Stichprobe aufgenommen zu werden, und (2) das Stichprobenverfahren beinhaltet eine Zufallsauswahl an einem bestimmten Punkt. Zu den verschiedenen Arten von Wahrscheinlichkeitsstichprobenverfahren gehören:

Einfache Zufallsstichprobe. Bei diesem Verfahren haben alle möglichen Teilmengen einer Grundgesamtheit (genauer: eines Stichprobenrahmens) die gleiche Wahrscheinlichkeit, ausgewählt zu werden. Die Wahrscheinlichkeit, eine beliebige Menge von n Einheiten aus einer Gesamtzahl von N Einheiten in einem Stichprobenrahmen auszuwählen, ist N C n . Daher sind Stichprobenstatistiken unverzerrte Schätzungen von Populationsparametern, ohne jegliche Gewichtung. Bei einfachen Zufallsstichproben werden die Befragten nach dem Zufallsprinzip aus einem Stichprobenrahmen ausgewählt, bei großen Stichprobenrahmen wird jedoch in der Regel eine Tabelle mit Zufallszahlen oder ein computergestützter Zufallszahlengenerator verwendet. Wenn Sie beispielsweise aus einer Liste von 1000 Firmen 200 Firmen für die Befragung auswählen möchten, können Sie, wenn Sie diese Liste in eine Tabellenkalkulation wie Excel eingeben, die Funktion RAND() von Excel verwenden, um Zufallszahlen für jeden der 1000 Kunden auf dieser Liste zu erzeugen. Anschließend sortieren Sie die Liste in aufsteigender Reihenfolge der entsprechenden Zufallszahlen und wählen die ersten 200 Kunden auf dieser sortierten Liste aus. Dies ist die einfachste aller Wahrscheinlichkeitsstichprobentechniken; in der Einfachheit liegt jedoch auch die Stärke dieser Technik. Da der Stichprobenrahmen nicht unterteilt oder partitioniert ist, ist die Stichprobe unverzerrt und die Schlussfolgerungen sind unter allen Wahrscheinlichkeitsstichprobenverfahren am verallgemeinerbarsten.

Systematische Stichproben. Bei dieser Technik wird der Stichprobenrahmen nach bestimmten Kriterien geordnet und die Elemente werden in regelmäßigen Abständen aus dieser geordneten Liste ausgewählt. Die systematische Stichprobe beginnt mit einem Zufallsstart und wählt dann von diesem Punkt an jedes k-te Element aus, wobei k = N / n , wobei k das Verhältnis zwischen dem Stichprobenumfang N und dem gewünschten Stichprobenumfang n ist und formell als Stichprobenverhältnis bezeichnet wird. Es ist wichtig, dass der Ausgangspunkt nicht automatisch der erste in der Liste ist, sondern zufällig aus den ersten k Elementen der Liste ausgewählt wird. In unserem vorherigen Beispiel der Auswahl von 200 Firmen aus einer Liste von 1000 Firmen können Sie die 1000 Firmen in aufsteigender (oder absteigender) Reihenfolge ihrer Größe (d. h. Mitarbeiterzahl oder Jahresumsatz) sortieren, eine der ersten fünf Firmen auf der sortierten Liste zufällig auswählen und dann jede fünfte Firma auf der Liste auswählen. Auf diese Weise wird sichergestellt, dass weder große noch kleine Unternehmen in Ihrer Stichprobe überrepräsentiert sind, sondern dass Unternehmen aller Größenordnungen im Allgemeinen gleichmäßig vertreten sind, wie es auch in Ihrem Stichprobenrahmen der Fall ist. Mit anderen Worten, die Stichprobe ist repräsentativ für die Grundgesamtheit, zumindest auf der Grundlage des Sortierkriteriums.

Geschichtete Stichproben. Bei der geschichteten Stichprobe wird der Stichprobenrahmen in homogene und sich nicht überschneidende Untergruppen (sogenannte „Schichten“) unterteilt, und innerhalb jeder Untergruppe wird eine einfache Zufallsstichprobe gezogen. Im vorangegangenen Beispiel der Auswahl von 200 Unternehmen aus einer Liste von 1000 Unternehmen können Sie die Unternehmen zunächst nach ihrer Größe in große (mehr als 500 Beschäftigte), mittlere (zwischen 50 und 500 Beschäftigte) und kleine (weniger als 50 Beschäftigte) einteilen. Dann können Sie aus jeder Untergruppe 67 Unternehmen nach dem Zufallsprinzip auswählen, um Ihre Stichprobe von 200 Unternehmen zu bilden. Da es in einem Stichprobenrahmen jedoch viel mehr kleine Unternehmen als große Unternehmen gibt, ist die Stichprobe bei einer gleichen Anzahl kleiner, mittlerer und großer Unternehmen weniger repräsentativ für die Grundgesamtheit (d. h. sie ist zugunsten der großen Unternehmen verzerrt, die in der Zielpopulation zahlenmäßig weniger vertreten sind). Dies wird als nichtproportionale geschichtete Stichprobe bezeichnet, da der Anteil der Stichprobe innerhalb jeder Untergruppe nicht den Anteil in der Stichprobenauswahl (oder der interessierenden Grundgesamtheit) widerspiegelt und die kleinere Untergruppe (große Unternehmen) überrepräsentiert ist. Eine alternative Technik besteht darin, die Stichproben der Untergruppen im Verhältnis zu ihrer Größe in der Grundgesamtheit auszuwählen. Wenn es beispielsweise 100 große, 300 mittlere und 600 kleine Unternehmen gibt, können Sie 20 Unternehmen aus der „großen“ Gruppe, 60 aus der „mittleren“ Gruppe und 120 aus der „kleinen“ Gruppe in die Stichprobe aufnehmen. In diesem Fall wird die proportionale Verteilung der Unternehmen in der Grundgesamtheit in der Stichprobe beibehalten, und daher wird diese Technik als proportionale geschichtete Stichprobe bezeichnet. Es ist zu beachten, dass der nichtproportionale Ansatz besonders gut geeignet ist, um kleine Untergruppen, wie z. B. große Unternehmen, zu repräsentieren, und im Vergleich zum proportionalen Ansatz nicht unbedingt weniger repräsentativ für die Grundgesamtheit ist, solange die Ergebnisse des nichtproportionalen Ansatzes entsprechend dem Anteil einer Untergruppe an der Grundgesamtheit gewichtet werden.

Cluster-Stichproben. Bei einer über eine große geografische Region verstreuten Grundgesamtheit ist es unter Umständen nicht möglich, eine einfache Zufallsstichprobe der gesamten Grundgesamtheit durchzuführen. In einem solchen Fall kann es sinnvoll sein, die Grundgesamtheit in „Cluster“ (in der Regel entlang geografischer Grenzen) zu unterteilen, eine Zufallsstichprobe aus einigen Clustern zu ziehen und alle Einheiten innerhalb dieses Clusters zu messen. Wenn Sie beispielsweise eine Stichprobe von Stadtverwaltungen im Bundesstaat New York durchführen möchten, müssen Sie nicht durch den ganzen Bundesstaat reisen, um die wichtigsten Stadtbeamten zu befragen (wie es bei einer einfachen Zufallsstichprobe der Fall wäre), sondern Sie können diese Verwaltungen auf der Grundlage ihrer Bezirke gruppieren, nach dem Zufallsprinzip drei Bezirke auswählen und dann alle Beamten in diesen Bezirken befragen. Je nach den Unterschieden zwischen den Clustern ist die Variabilität der Stichprobenschätzungen bei einer Cluster-Stichprobe jedoch im Allgemeinen höher als bei einer einfachen Zufallsstichprobe, so dass die Ergebnisse weniger auf die Grundgesamtheit verallgemeinerbar sind als bei einfachen Zufallsstichproben.

Matched-Pairs-Stichproben. Manchmal möchten Forscher zwei Untergruppen innerhalb einer Grundgesamtheit anhand eines bestimmten Kriteriums vergleichen. Warum sind zum Beispiel einige Unternehmen durchweg profitabler als andere Unternehmen? Um eine solche Studie durchzuführen, müsste man einen Stichprobenrahmen von Unternehmen auf der Grundlage von Bruttomargen, Gewinn pro Aktie oder einem anderen Rentabilitätsmaß in „hochprofitable“ und „niedrig profitable“ Unternehmen einteilen. Sie würden dann eine einfache Zufallsstichprobe von Unternehmen einer Untergruppe auswählen und jedes Unternehmen dieser Gruppe mit einem Unternehmen der zweiten Untergruppe auf der Grundlage seiner Größe, seines Industriesegments und/oder anderer Übereinstimmungskriterien abgleichen. Nun haben Sie zwei angepasste Stichproben von Unternehmen mit hoher und niedriger Rentabilität, die Sie genauer untersuchen können. Diese Art der Stichprobenziehung ist oft eine ideale Methode, um bipolare Unterschiede zwischen verschiedenen Untergruppen innerhalb einer bestimmten Population zu verstehen.

Mehrstufige Stichprobenziehung. Die zuvor beschriebenen Wahrscheinlichkeitsstichprobenverfahren sind allesamt Beispiele für einstufige Stichprobenverfahren. Je nach den Erfordernissen Ihrer Stichprobenziehung können Sie diese einstufigen Verfahren kombinieren, um eine mehrstufige Stichprobenziehung durchzuführen. Sie können zum Beispiel eine Liste von Unternehmen nach Unternehmensgröße schichten und dann innerhalb jeder Schicht eine systematische Stichprobe durchführen. Dies ist eine zweistufige Kombination aus geschichteter und systematischer Stichprobe. Ebenso kann man mit einem Cluster von Schulbezirken im Bundesstaat New York beginnen und innerhalb jedes Clusters eine einfache Zufallsstichprobe von Schulen auswählen; innerhalb jeder Schule eine einfache Zufallsstichprobe von Klassenstufen auswählen; und innerhalb jeder Klassenstufe eine einfache Zufallsstichprobe von Schülern für die Untersuchung auswählen. In diesem Fall handelt es sich um ein vierstufiges Stichprobenverfahren, das aus Cluster- und einfachen Zufallsstichproben besteht.

Nichtwahrscheinlichkeitsstichproben

Nichtwahrscheinlichkeitsstichproben sind ein Stichprobenverfahren, bei dem einige Einheiten der Grundgesamtheit keine Chance haben, ausgewählt zu werden, oder bei dem die Wahrscheinlichkeit der Auswahl nicht genau bestimmt werden kann. In der Regel werden die Einheiten nach bestimmten, nicht zufälligen Kriterien ausgewählt, z. B. nach der Quote oder der Zweckmäßigkeit. Da die Auswahl nicht zufällig erfolgt, lassen sich bei Nichtwahrscheinlichkeitsstichproben keine Stichprobenfehler schätzen, und es kann zu einer Verzerrung der Stichprobe kommen. Daher können die Informationen aus einer Stichprobe nicht auf die Grundgesamtheit zurückverallgemeinert werden. Zu den Arten von Nichtwahrscheinlichkeitsstichprobenverfahren gehören:

Gelegenheitsstichproben. Bei dieser auch als Zufallsstichproben oder Gelegenheitsstichproben bezeichneten Technik wird eine Stichprobe aus dem Teil der Grundgesamtheit gezogen, der sich in unmittelbarer Nähe befindet, leicht zugänglich oder günstig ist. Wenn Sie beispielsweise vor einem Einkaufszentrum stehen und Fragebögen an die Leute verteilen oder sie befragen, während sie hineingehen, handelt es sich bei der Stichprobe der Befragten um eine Zufallsstichprobe. Dies ist eine Nicht-Wahrscheinlichkeitsstichprobe, da Sie systematisch alle Personen ausschließen, die in anderen Einkaufszentren einkaufen. Die Meinungen, die Sie von der von Ihnen gewählten Stichprobe erhalten würden, können die einzigartigen Merkmale dieses Einkaufszentrums widerspiegeln, wie z. B. die Art der Geschäfte (z. B. ziehen High-End-Geschäfte eine wohlhabendere Bevölkerungsgruppe an), das demografische Profil der Kunden oder den Standort (z. B. zieht ein Einkaufszentrum in der Nähe einer Universität vor allem Studenten mit besonderen Kaufgewohnheiten an), und sind daher möglicherweise nicht repräsentativ für die Meinungen der gesamten Käuferschaft. Die wissenschaftliche Verallgemeinerbarkeit solcher Beobachtungen wird daher sehr begrenzt sein. Andere Beispiele für Zufallsstichproben sind Studenten, die in einer bestimmten Klasse eingeschrieben sind, oder Patienten, die in eine bestimmte medizinische Klinik kommen. Diese Art von Stichproben eignet sich am besten für Pilotversuche, bei denen es eher um die Prüfung von Instrumenten oder die Validierung von Messungen als um verallgemeinerbare Schlussfolgerungen geht.

Quotenstichproben. Bei dieser Technik wird die Grundgesamtheit in sich gegenseitig ausschließende Untergruppen unterteilt (genau wie bei der geschichteten Stichprobe), und dann wird aus jeder Untergruppe eine nicht zufällige Menge von Beobachtungen ausgewählt, um eine vordefinierte Quote zu erfüllen. Bei einer proportionalen Quotenstichprobe sollte der Anteil der Befragten in jeder Untergruppe dem der Grundgesamtheit entsprechen. Wenn beispielsweise die amerikanische Bevölkerung zu 70 % aus Kaukasiern, zu 15 % aus Hispanoamerikanern und zu 13 % aus Afroamerikanern besteht und Sie in einer Stichprobe von 98 Personen deren Wahlpräferenzen ermitteln möchten, können Sie sich vor ein Einkaufszentrum stellen und die Leute nach ihren Wahlpräferenzen fragen. Sie müssen jedoch aufhören, hispanisch aussehende Personen zu befragen, wenn Sie 15 Antworten aus dieser Untergruppe erhalten haben (oder Afroamerikaner, wenn Sie 13 Antworten erhalten haben), auch wenn Sie weiterhin Stichproben aus anderen ethnischen Gruppen nehmen, damit die ethnische Zusammensetzung Ihrer Stichprobe mit der der allgemeinen amerikanischen Bevölkerung übereinstimmt. Nichtproportionale Quotenstichproben sind insofern weniger restriktiv, als Sie keine proportionale Repräsentation erreichen müssen, sondern vielleicht eine Mindestgröße in jeder Untergruppe einhalten. In diesem Fall könnten Sie sich für 50 Befragte aus jeder der drei ethnischen Untergruppen (Weiße, Hispanoamerikaner und Afroamerikaner) entscheiden und aufhören, wenn Ihre Quote für jede Untergruppe erreicht ist. Keine der beiden Arten von Quotenstichproben ist repräsentativ für die amerikanische Bevölkerung, denn je nachdem, ob Ihre Studie in einem Einkaufszentrum in New York oder in Kansas durchgeführt wurde, können Ihre Ergebnisse völlig unterschiedlich ausfallen. Die nicht-proportionale Technik ist sogar noch weniger repräsentativ für die Bevölkerung, kann aber insofern nützlich sein, als sie es ermöglicht, die Meinungen kleiner und unterrepräsentierter Gruppen durch Überstichproben zu erfassen.

Expertenstichproben. Hierbei handelt es sich um eine Technik, bei der die Befragten nicht zufällig auf der Grundlage ihres Fachwissens über das untersuchte Phänomen ausgewählt werden. Um beispielsweise die Auswirkungen einer neuen staatlichen Maßnahme wie dem Sarbanes-Oxley Act zu verstehen, kann man eine Gruppe von Wirtschaftsprüfern auswählen, die mit diesem Gesetz vertraut sind. Der Vorteil dieses Ansatzes besteht darin, dass Experten in der Regel besser mit dem Thema vertraut sind als Nichtexperten, so dass die Meinungen einer Stichprobe von Experten glaubwürdiger sind als eine Stichprobe, die sowohl Experten als auch Nichtexperten umfasst, obwohl die Ergebnisse immer noch nicht auf die Gesamtbevölkerung verallgemeinert werden können.

Schneeballsampling. Beim Schneeballsystem werden zunächst einige Befragte ermittelt, die die Kriterien für die Aufnahme in die Studie erfüllen, und diese dann gebeten, andere Personen zu empfehlen, die sie kennen und die ebenfalls die Auswahlkriterien erfüllen. Wenn Sie zum Beispiel Netzwerkadministratoren befragen möchten und nur ein oder zwei dieser Personen kennen, können Sie mit ihnen beginnen und sie bitten, andere zu empfehlen, die ebenfalls in der Netzwerkadministration tätig sind. Obwohl diese Methode kaum zu repräsentativen Stichproben führt, kann sie manchmal die einzige Möglichkeit sein, schwer erreichbare Bevölkerungsgruppen zu erreichen oder wenn kein Stichprobenrahmen zur Verfügung steht.

Statistik der Stichprobenziehung

In den vorangegangenen Abschnitten haben wir Begriffe wie Bevölkerungsparameter, Stichprobenstatistik und Stichprobenverzerrung eingeführt. In diesem Abschnitt werden wir versuchen zu verstehen, was diese Begriffe bedeuten und wie sie miteinander zusammenhängen.

Wenn man eine bestimmte Beobachtung von einer bestimmten Einheit aus misst, z. B. die Antwort einer Person auf ein Item mit Likert-Skala, wird diese Beobachtung als Antwort bezeichnet (siehe Abbildung 8.2). Mit anderen Worten: Eine Antwort ist ein Messwert, der von einer Stichprobeneinheit geliefert wird. Jeder Befragte gibt unterschiedliche Antworten auf verschiedene Items in einem Instrument. Die Antworten verschiedener Befragter auf ein und dasselbe Item oder dieselbe Beobachtung können auf der Grundlage ihrer Häufigkeit in einer Häufigkeitsverteilung grafisch dargestellt werden. Bei einer großen Anzahl von Antworten in einer Stichprobe ähnelt diese Häufigkeitsverteilung einer glockenförmigen Kurve, die als Normalverteilung bezeichnet wird und zur Schätzung der Gesamtmerkmale der gesamten Stichprobe verwendet werden kann, z. B. Stichprobenmittelwert (Durchschnitt aller Beobachtungen in einer Stichprobe) oder Standardabweichung (Variabilität oder Streuung der Beobachtungen in einer Stichprobe). Diese Stichprobenschätzungen werden als Stichprobenstatistiken bezeichnet (eine „Statistik“ ist ein Wert, der anhand von Beobachtungsdaten geschätzt wird). Auch für Populationen gibt es Mittelwerte und Standardabweichungen, die man erhalten könnte, wenn man eine Stichprobe der gesamten Population nehmen könnte. Da jedoch nie die gesamte Population beprobt werden kann, sind die Populationsmerkmale immer unbekannt und werden als Populationsparameter bezeichnet (und nicht als „Statistik“, da sie nicht anhand von Daten statistisch geschätzt werden). Stichprobenstatistiken können von den Populationsparametern abweichen, wenn die Stichprobe nicht vollkommen repräsentativ für die Population ist; die Differenz zwischen den beiden wird als Stichprobenfehler bezeichnet. Theoretisch könnte man den Stichprobenumfang allmählich erhöhen, so dass sich die Stichprobe der Grundgesamtheit immer mehr annähert. Dann würde der Stichprobenfehler abnehmen und eine Stichprobenstatistik würde sich dem entsprechenden Grundgesamtheitsparameter immer mehr annähern.

Wenn eine Stichprobe wirklich repräsentativ für die Grundgesamtheit ist, sollten die geschätzten Stichprobenstatistiken mit den entsprechenden theoretischen Grundgesamtheitsparametern identisch sein. Woher wissen wir, ob die Stichprobenstatistiken den Populationsparametern zumindest einigermaßen nahe kommen? Dazu müssen wir das Konzept der Stichprobenverteilung verstehen. Stellen Sie sich vor, Sie hätten drei verschiedene Zufallsstichproben aus einer gegebenen Grundgesamtheit entnommen (siehe Abbildung 8.3) und für jede Stichprobe eine Stichprobenstatistik wie z. B. den Stichprobenmittelwert und die Standardabweichung ermittelt. Wenn jede Zufallsstichprobe wirklich repräsentativ für die Grundgesamtheit wäre, dann wären die drei Stichprobenmittelwerte aus den drei Zufallsstichproben identisch (und gleich dem Parameter der Grundgesamtheit), und die Variabilität der Stichprobenmittelwerte wäre gleich Null. Dies ist jedoch äußerst unwahrscheinlich, da jede Zufallsstichprobe wahrscheinlich eine andere Teilmenge der Grundgesamtheit darstellt und ihre Mittelwerte daher leicht voneinander abweichen können. Sie können jedoch diese drei Stichprobenmittelwerte nehmen und ein Häufigkeitshistogramm der Stichprobenmittelwerte erstellen. Erhöht sich die Anzahl dieser Stichproben von drei auf 10 bis 100, wird das Häufigkeitshistogramm zu einer Stichprobenverteilung. Eine Stichprobenverteilung ist also eine Häufigkeitsverteilung einer Stichprobenstatistik (wie z. B. des Stichprobenmittelwerts) aus einer Reihe von Stichproben, während die übliche Häufigkeitsverteilung die Verteilung einer Antwort (Beobachtung) aus einer einzigen Stichprobe ist. Wie bei einer Häufigkeitsverteilung sind auch bei der Stichprobenverteilung mehr Stichprobenstatistiken um den Mittelwert herum gruppiert (bei dem es sich vermutlich um eine Schätzung eines Populationsparameters handelt), während weniger Werte um den Mittelwert herum verstreut sind. Bei einer unendlich großen Anzahl von Stichproben nähert sich diese Verteilung einer Normalverteilung an. Die Variabilität oder Streuung einer Stichprobenstatistik in einer Stichprobenverteilung (d. h. die Standardabweichung einer Stichprobenstatistik) wird als ihr Standardfehler bezeichnet. Im Gegensatz dazu ist der Begriff Standardabweichung für die Variabilität einer beobachteten Antwort aus einer einzelnen Stichprobe reserviert.

Abbildung 8.2. Stichprobenstatistik.

Der Mittelwert einer Stichprobenstatistik in einer Stichprobenverteilung wird als Schätzwert des unbekannten Populationsparameters angenommen. Auf der Grundlage der Streuung dieser Stichprobenverteilung (d. h. auf der Grundlage des Standardfehlers) ist es auch möglich, Konfidenzintervalle für diesen vorausgesagten Populationsparameter zu schätzen. Das Konfidenzintervall ist die geschätzte Wahrscheinlichkeit, dass ein Populationsparameter innerhalb eines bestimmten Intervalls von statistischen Stichprobenwerten liegt. Alle Normalverteilungen neigen dazu, der 68-95-99-Prozent-Regel zu folgen (siehe Abbildung 8.4), die besagt, dass über 68 % der Fälle in der Verteilung innerhalb einer Standardabweichung des Mittelwerts (µ + 1σ) liegen, über 95 % der Fälle in der Verteilung innerhalb von zwei Standardabweichungen des Mittelwerts (µ + 2σ) und über 99 % der Fälle in der Verteilung innerhalb von drei Standardabweichungen des Mittelwerts (µ + 3σ) liegen. Da eine Stichprobenverteilung mit einer unendlichen Anzahl von Stichproben sich einer Normalverteilung annähert, gilt dieselbe 68-95-99-Regel, und es kann gesagt werden, dass:

  • (Stichprobenstatistik + ein Standardfehler) ein 68%iges Konfidenzintervall für den Populationsparameter darstellt.
  • (Statistik der Stichprobe + zwei Standardfehler) stellt ein 95%-Konfidenzintervall für den Populationsparameter dar.
  • (Statistik der Stichprobe + drei Standardfehler) stellt ein 99%-Konfidenzintervall für den Populationsparameter dar.

Abbildung 8.3. Die Stichprobenverteilung.

Eine Stichprobe ist „verzerrt“ (d. h. nicht repräsentativ für die Grundgesamtheit), wenn ihre Stichprobenverteilung nicht geschätzt werden kann oder wenn die Stichprobenverteilung gegen die 68-95-99-Prozent-Regel verstößt. Nebenbei bemerkt: Bei den meisten Regressionsanalysen, bei denen wir die Signifikanz von Regressionskoeffizienten mit p<0,05 untersuchen, versuchen wir festzustellen, ob die Stichprobenstatistik (Regressionskoeffizient) den entsprechenden Populationsparameter (wahre Effektgröße) mit einem 95 %-Konfidenzintervall vorhersagt. Interessanterweise versucht der „Sechs-Sigma“-Standard, Herstellungsfehler außerhalb des 99%igen Konfidenzintervalls oder sechs Standardabweichungen zu identifizieren (die Standardabweichung wird mit dem griechischen Buchstaben Sigma dargestellt), was einer Signifikanzprüfung bei p<0,01 entspricht.

Abbildung 8.4. Die 68-95-99 Prozent Regel für Konfidenzintervalle.