サンプリングとは、関心のある母集団の部分集合(「サンプル」と呼ぶ)を、その集団について観察し統計的推論を行う目的で選択する統計プロセスである。 社会科学の研究は一般的に、特定の集団内の行動パターンを推論することです。 実現可能性やコストの制約から、母集団全体を調査することはできません。したがって、観察および分析のために、対象となる母集団から代表的なサンプルを選択する必要があります。 サンプルから得られる推論を対象集団に一般化できるように、集団を本当に代表するサンプルを選択することが極めて重要です。 CNN/Gallup Poll、ABC、CBSなどの異なる世論調査グループがアメリカ大統領選挙の前に行う世論調査や出口調査において、不適切で偏ったサンプリングが、しばしば乖離した誤った推論を報告する主な理由となっています。 サンプリングプロセス
サンプリングプロセスはいくつかの段階から構成されている。 第1段階は対象母集団の定義である。 母集団とは、研究したい特性を持つすべての人または項目(分析単位)と定義できる。 分析単位は、人、グループ、組織、国、物体、あるいは科学的推論を行いたいその他の実体であってもよい。 母集団が明らかな場合もある。 例えば、ある製造業者が、生産ラインで製造された完成品が一定の品質要求を満たしているか、それとも廃棄して作り直さなければならないかを判断したい場合、母集団はその生産施設で製造された完成品の全集合から構成されます。 また、対象母集団がもう少しわかりにくい場合もあります。 高校生の学業学習の主な推進要因を特定したい場合、対象者は高校生、その教師、学校長、あるいは保護者でしょうか。 この場合、教師、保護者、学校の成績ではなく、高校生の成績に興味があるのですから、正解は「高校生」です。 同様に、偏ったホイールを識別するためにルーレットのホイールの動作を分析したい場合、関心のある集団は、単一のルーレットホイールからの異なる観測ではなく、異なるルーレットホイール(すなわち、ホイールの無限のセットにわたってそれらの動作)である
サンプリングプロセスの第二段階は、サンプリングフレームを選択します。 これは、サンプルを抽出することができるターゲット集団のアクセス可能なセクション(通常は連絡先情報を持つリスト)です。 対象集団が職場の専門職社員である場合、世界中の専門職社員すべてにアクセスすることはできないので、より現実的なサンプリングフレームは、研究に参加する意思のある1つか2つの現地企業の社員リストとなるでしょう。 対象集団が組織であれば、フォーチュン500の企業リストやニューヨーク証券取引所に登録されているスタンダード&プアーズ(S&P)の企業リストが許容できるサンプリング・フレームかもしれません。
サンプリング・フレームが完全に集団全体を代表していない場合もあり、その場合はそのサンプルで得られた推論は集団に一般化できない可能性があることに注意してください。 たとえば、対象集団が組織全体の従業員で(たとえば、この集団における従業員の自尊心を研究したい)、サンプリング・フレームがアメリカ中西部の自動車会社の従業員の場合、そうしたグループからの知見は、世界の職場はおろか、アメリカの職場全体に対して一般化できない可能性さえあります。 なぜなら、アメリカの自動車産業は過去50年間、厳しい競争圧力の下にあり、何度も再編成や縮小が繰り返され、その結果、従業員のモラルや自尊心が低くなっている可能性があるからです。 さらに、アメリカの労働力の大部分はサービス業や中小企業に従事しており、自動車産業には従事していない。 したがって、アメリカの自動車産業の従業員のサンプルは、アメリカの労働力を特に代表するものではありません。 同様に,フォーチュン500のリストにはアメリカの大企業500社が含まれているが,これはアメリカ企業全般を代表するものではなく,そのほとんどは大企業ではなく中堅・中小企業であり,したがって,偏ったサンプリングフレームといえる。 一方、S&Pのリストは、S&P large-cap, mid-cap, small-cap のいずれのリストを使うかによって、大企業、中企業、小企業を選択できるが、(未公開企業ではなく)公開企業を含んでおり、やはりバイアスがかかっている。 また、サンプルを抽出する母集団は、必ずしも実際に情報を得たい母集団と同じとは限らないことに注意してください。 例えば、ある研究者が新しい「禁煙」プログラムの成功率を知りたい場合、対象集団はこのプログラムを利用した喫煙者の集団であり、これは未知の集団かもしれません。 したがって、研究者は禁煙治療のために地元の医療施設に到着した患者をサンプリングするかもしれませんが、その中にはこの特定の「禁煙」プログラムに触れたことがない人もいるかもしれず、この場合、サンプリングフレームは対象集団に対応していません。 サンプリング技法は、確率(ランダム)サンプリングと非確率サンプリングの2つに大別される。 結果の一般化可能性が重要な場合は、確率的サンプリングが理想的ですが、非確率的サンプリングが正当化される特殊な状況もあるでしょう。 これらのテクニックは次の2つのセクションで説明します。
確率サンプリング
確率サンプリングは、集団内のすべてのユニットがサンプルに選択されるチャンス(ゼロ以外の確率)があり、このチャンスを正確に決定することができる手法である。 このようにして得られた標本平均や標準偏差などの標本統計は、標本化された単位がその選択確率に従って重み付けされている限り、母集団のパラメーターの不偏推定値となります。 すべての確率的サンプリングには2つの共通点があります。1つは、母集団のすべての単位がサンプリングされる確率が0でないことが分かっていること、もう1つは、サンプリングの手順で、ある時点から無作為に選択されていることです。 確率的サンプリングの種類には、
Simple random samplingがあります。 この手法では、母集団(正確にはサンプリング・フレーム)のすべての可能な部分集合は、選択される確率が等しいとされます。 サンプリング・フレーム内の全N個のうち、任意のn個の集合を選択する確率はN C n です。 したがって、標本統計は母集団のパラメーターの不偏推定値であり、重み付けは一切ありません。 単純無作為抽出では、サンプリングフレームから回答者を無作為に選択しますが、大規模なサンプリングフレームでは、通常、乱数表やコンピュータによる乱数発生器が使用されます。 例えば、1000社のリストから200社を選んで調査したい場合、このリストがExcelなどのスプレッドシートに入力されていれば、ExcelのRAND()関数を使って、そのリスト上の1000社の顧客それぞれに乱数を発生させることができます。 次に、そのリストを乱数の大きい順に並べ替え、その並べ替えられたリストの中から最初の200人の顧客を選択するのです。 これは、確率的サンプリングの手法の中で最も単純なものであるが、単純であることがこの手法の長所でもある。 サンプリング・フレームが細分化されたり分割されたりしないので、サンプルは偏りがなく、推論はすべての確率的サンプリング技法の中で最も一般化できる。 この技法では、サンプリング・フレームはいくつかの基準に従って順序付けられ、その順序付けられたリストを通して一定の間隔で要素が選択される。 ここでk = N / n 、kはサンプリングフレームサイズNと希望するサンプルサイズnの比であり、正式にはサンプリング比と呼ばれます。 重要なのは,開始点が自動的にリストの最初のものになるのではなく,リストの最初のk個の要素の中からランダムに選ばれることである. 先ほどの 1000 社のリストから 200 社を選ぶ例では,1000 社を規模(従業員数または年間売上高)の大きい順(または小さい順)に並べ替え,並べ替えられたリストの最初の 5 社をランダムに選び,次にリスト上の 5 社すべてを選択することができる. このプロセスにより、サンプルに大企業や中小企業が過剰に含まれることなく、サンプリング・フレームと同様に、あらゆる規模の企業が概ね一様に含まれることが確認されます。 言い換えれば、サンプルは、少なくとも選別基準に基づいて、母集団を代表している。
Stratified sampling. 層別サンプリングでは、サンプリング・フレームを均質で重複しないサブグループ(「層」と呼ぶ)に分割し、各サブグループ内で単純無作為標本を抽出する。 先ほどの1000社から200社を抽出する例では,まず企業の規模を大(従業員500人以上),中(従業員50~500人),小(従業員50人以下)に分類することができる。 そして、各サブグループから無作為に67社を選び出し、200社のサンプルを構成する。 しかし,サンプリング・フレームには大企業よりも小企業の方が多いので,小・中・大企業を同数にすると,サンプルを母集団からあまり代表できない(つまり,対象集団の中で数の少ない大企業に偏る)ことになる。 これは、各サブグループ内のサンプルの割合がサンプリングフレーム(または対象母集団)の割合を反映せず、小さいサブグループ(大企業)が過剰にサンプリングされるため、非比例層別サンプリングと呼ばれています。 代替的な手法としては、母集団におけるサイズに比例してサブグループのサンプルを選択することである。 例えば、大企業が100社、中堅企業が300社、小企業が600社あるとすると、「大」グループから20社、「中」グループから60社、「小」グループから120社をサンプリングすることができる。 この場合,母集団における企業の比例分布がそのままサンプルに反映されるので,この手法は比例層別サンプリングと呼ばれる。 なお、非比例的アプローチは、大企業のような小さなサブグループを代表する場合に特に有効であり、非比例的アプローチの知見が母集団全体におけるサブグループの割合に応じて重み付けされている限り、比例的アプローチと比較して必ずしも母集団の代表性が劣るとはいえない
クラスター・サンプリング。 母集団が広い地理的地域に分散している場合、母集団全体から単純な無作為抽出を行うことは実行不可能な場合があります。 このような場合、母集団を(通常は地理的な境界に沿って)「クラスター」に分割し、いくつかのクラスターを無作為に抽出し、そのクラスター内のすべてのユニットを測定することが妥当である場合があります。 例えば、ニューヨーク州の市政府をサンプリングする場合、(単純な無作為抽出のように)州内を回って主要な市職員にインタビューをするのではなく、郡に基づいてこれらの政府をクラスター化し、ランダムに3つの郡を選び、それらの郡内のすべての職員からインタビューをすることができます。 しかし,クラスター間の差にもよるが,クラスター標本の標本推定値の変動は一般に単純無作為標本のそれよりも大きく,したがって,その結果は単純無作為標本から得られたものよりも集団に対する一般化可能性が低くなる。 研究者が特定の基準に基づいて、1つの母集団内の2つのサブグループを比較したいことがある。 たとえば、なぜある企業は他の企業よりも一貫して収益性が高いのか。 このような研究を行うには、企業のサンプリング・フレームを、粗利益率、一株当たり利益、または収益性の他の指標に基づいて、「高収益企業」と「低収益企業」に分類する必要がある。 その後、1つのサブグループの企業の単純無作為抽出し、そのサイズ、産業セグメント、および/または他のマッチング基準に基づいて、第二のサブグループの企業とこのグループの各企業を一致させるだろう。 これで、高収益企業と低収益企業の2つのマッチド・サンプルができ、より詳細に調査することができる。 このようなマッチドペア・サンプリング技法は、与えられた集団内の異なるサブグループ間の両極の違いを理解するのに理想的な方法であることが多い
Multi-stage sampling. 先に述べた確率的サンプリング技法は、すべて1段階サンプリング技法の例である。 サンプリングの必要性に応じて、これらの単段階の技法を組み合わせて多段階のサンプリングを行うことができる。 たとえば、企業規模に基づいて企業リストを層別し、各層で系統的なサンプリングを行うことができます。 これは、層別サンプリングとシステマティック・サンプリングの2段の組み合わせです。 同様に、ニューヨーク州の学区のクラスターから始めて、各クラスター内で、学校の単純無作為標本を選択し、各学校内で、学年の単純無作為標本を選択し、各学年内で、調査のために生徒の単純無作為標本を選択することができます。 この場合、クラスターサンプリングと単純無作為抽出からなる4段階のサンプリングプロセスがあります。
Non-Probability Sampling
Non-probability samplingは、母集団のいくつかの単位が選択のチャンスがゼロか、選択の確率が正確に決定できないサンプリング手法である。 典型的には、割当や便宜など、ある種の非ランダムな基準に基づいて単位が選択される。 選択が非ランダムであるため、非確率サンプリングではサンプリング誤差を推定することができず、サンプリングバイアスがかかる可能性があります。 したがって、サンプルからの情報を母集団に一般化することはできません。 非確率サンプリング手法の種類には、次のようなものがある:
コンベンシーサンプリング。 偶然のサンプリング、機会サンプリングとも呼ばれ、手近にある、すぐに利用できる、あるいは便利な集団の一部からサンプルを抽出する手法です。 例えば、ショッピングセンターの外に立って、人々にアンケート調査を配ったり、入ってきた人にインタビューしたりすると、得られる回答者のサンプルはコンビニエンス・サンプルとなります。 これは、他のショッピングセンターで買い物をする人をすべて除外しているため、非確率的なサンプルとなります。 あなたが選んだサンプルから得られる意見は、店舗の性質(例えば、高級店はより裕福な層を引き付ける)、利用者の人口統計学的プロファイル、またはその場所(例えば、大学の近くにあるショッピングセンターは、ユニークな購買習慣を持つ大学生を主に引き付ける)など、このショッピングセンター独自の特性を反映しているかもしれないし、したがって、買い物客の集団全体の意見を代表していないかもしれないのである。 したがって、このような観察の科学的な一般化可能性は非常に限られたものとなる。 他のコンビニエンス・サンプリングの例としては、特定のクラスに登録された学生をサンプリングしたり、特定の医療クリニックに到着した患者をサンプリングしたりすることです。 このタイプのサンプリングは、一般化できる推論を得るよりも、機器のテストや測定の検証を目的とするパイロットテストに最も有用です
Quota sampling. この手法では,母集団を(層別サンプリングと同様に)相互に排他的なサブグループに区分し,次にオブザベーションの非ランダム・セットを各サブグループから選択して,あらかじめ定義された割当を満たすようにする。 比例配分サンプリングでは、各サブグループの回答者の割合は、母集団の割合と一致する必要があります。 例えば、アメリカの人口が70%の白人、15%のヒスパニック系アメリカ人、13%のアフリカ系アメリカ人で構成されていて、98人のサンプルで彼らの投票選好を理解したい場合、ショッピングセンターの外に立って人々に彼らの投票選好を聞くことができます。 しかし、サンプルの民族構成が一般的なアメリカ人集団と一致するように、他の民族のサンプリングを続けながら、そのサブグループからの回答が15件になったら(あるいは13件になったら)、ヒスパニック系の人に尋ねるのをやめなければならないのです。 非比例クオータサンプリングは、比例代表制を達成する必要がない分、制約が少ないですが、おそらく各サブグループの最小人数を満たすことができます。 この場合、3つの民族のサブグループ(白人、ヒスパニック系アメリカ人、アフリカ系アメリカ人)からそれぞれ50人の回答者を集め、各サブグループの定員に達した時点で終了するように決めることができます。 どちらのタイプのクォータサンプリングも、アメリカの人口を代表するものにはなりません。なぜなら、調査がニューヨークのショッピングセンターで行われたか、カンザスで行われたかによって、結果はまったく異なるものになるからです。 非比例法は母集団を代表するものではありませんが、オーバーサンプリングによって小規模で代表性の低いグループの意見を取り入れることができるという点で有用な場合があります。 これは、調査対象の現象に関する専門知識に基づいて、回答者を非ランダムに選択する手法である。 たとえば、サーベンス・オクスリー法のような新しい政府政策の影響を理解するために、この法律に精通している企業会計士のグループをサンプリングすることができます。 この方法の利点は、専門家は非専門家よりも対象物に精通している傾向があるため、専門家と非専門家の両方を含むサンプルよりも、専門家のサンプルからの意見の方が信頼性が高いことですが、それでも調査結果は全体の集団に一般化できるものではありません。 雪だるま式サンプリングでは、まず研究に含める基準に合致する数人の回答者を特定し、次に彼らに、選択基準に合致する知り合いを推薦するよう頼みます。 例えば、コンピュータのネットワーク管理者を調査したい場合、そのような人が1人か2人しかいなければ、その人から始めて、ネットワーク管理をしている他の人を推薦してもらうように依頼することができます。 この方法では代表的なサンプルは得られませんが,到達困難な集団に到達するため,あるいはサンプリングフレームが利用できない場合には,これが唯一の方法となることがあります。
サンプリングの統計
前のセクションでは,母数パラメータ,サンプル統計,サンプリングバイアスなどの用語を紹介しました。 この項では、これらの用語の意味と相互の関係を理解することにします。
ある単位からある観測値、例えばリッカート尺度による項目に対する人の反応を測定するとき、その観測値をレスポンスと呼びます(図8.2参照)。 つまり、応答とはサンプリングされた単位が提供する測定値である。 各回答者は、測定器の異なる項目に対して異なる回答を与えることになる。 同じ項目または観察に対する異なる回答者からの回答は、その出現頻度に基づき、度数分布にグラフ化することができます。 標本内の多数の回答について、この度数分布は、正規分布と呼ばれるベル型の曲線に類似する傾向があり、標本平均(標本内のすべてのオブザベーションの平均)または標準偏差(標本内のオブザベーションの変動または広がり)など、標本全体の特性を推定するために使用することができます。 これらの標本の推定値は、標本統計量と呼ばれます(「統計量」とは、観測データから推定される値のことです)。 母集団にも平均値や標準偏差があり、母集団全体を標本化できれば、その値を得ることができます。 しかし、母集団全体をサンプリングすることはできないので、母集団の特性は常に未知であり、母集団パラメータと呼ばれます(データから統計的に推定されないので「統計量」ではない)。 標本が母集団を完全に代表していない場合、標本の統計量は母集団パラメータと異なることがあり、その差を標本誤差といいます 。 理論的には、標本が母集団に近づくように標本サイズを徐々に大きくしていけば、標本誤差は減少し、標本統計量は対応する母集団パラメータにどんどん近づいていくはずです。 標本の統計量が母集団のパラメータに少なくとも適度に近いかどうかは、どうすれば分かるのでしょうか。 ここで、標本分布の概念を理解する必要があります。 図8.3に示すように、ある母集団から3つの異なる無作為標本を採取し、それぞれの標本について標本平均や標準偏差などの標本統計量を導き出したとします。 それぞれの無作為標本が母集団を本当に代表していれば、3つの無作為標本の標本平均は同一(母集団のパラメータに等しい)で、標本平均の変動はゼロとなります。 しかし,各ランダム標本が母集団の異なる部分集合を構成する可能性が高く,したがって,それらの平均は互いにわずかに異なる可能性があることを考えると,これは極めて低いことです。 しかし、これら3つの標本平均を取り出し、標本平均の頻度ヒストグラムをプロットすることができます。 このようなサンプルの数が3個、10個、100個と増えていくと、度数ヒストグラムは標本分布になります。 したがって,標本分布とは,標本の集合から得られる標本統計量(標本平均など)の度数分布であり,一般に参照される度数分布は,1つの標本からの応答(観測)の分布である. 頻度分布と同様に,標本分布も平均値(母数の推定値)の周りに多くの標本統計量が集まり,平均値の周りに散在する値は少なくなる傾向があります。 サンプル数が無限に多い場合、この分布は正規分布に近づきます。 サンプリング分布における標本統計量のばらつきや広がり(標本統計量の標準偏差)は、その標準誤差と呼ばれます 。 これに対して、標準偏差という用語は、単一の標本から観測された応答の変動性に対して予約されています
図8.2. 標本統計量.
標本分布における標本統計量の平均値は、未知の母数パラメーターの推定値であると推定されます。 この標本分布の広がりから(つまり標準誤差から)、その予測母集団パラメーターの信頼区間を推定することも可能である。 信頼区間とは、母集団パラメータが標本統計値の特定の区間内にある推定確率のことである。 すべての正規分布は68-95-99%の法則に従う傾向があり(図8.4参照)、これは分布内の事例の68%以上が平均値の1標準偏差以内にあり(μ+1σ)、分布内の事例の95%以上が平均値の2標準偏差以内にあり(μ+2σ)、分布内の事例の99%以上が平均値の3標準偏差以内にある(μ+3σ)ことを表しています。 サンプル数が無限のサンプリング分布は正規分布に近づくので、同じ68-95-99の法則が適用され、次のように言えます:
- (サンプル統計量+1標準誤差)は母数パラメーターの68%信頼区間を表します。
- (Sample statistic + two standard errors)は母集団のパラメータに対する95%信頼区間を表す。
- (Sample statistic + three standard errors) は母集団のパラメータに対して99%信頼区間を表す。 サンプリング分布。
サンプリング分布が推定できない場合、またはサンプリング分布が68-95-99%規則に違反している場合、サンプルは「偏っている」(すなわち、集団を代表していない)ことになります。 余談ですが、p<0.05の回帰係数の有意性を調べるほとんどの回帰分析では、サンプリング統計量(回帰係数)が95%の信頼区間で対応する母数パラメータ(真の効果量)を予測するかどうかを見ようとすることに注意してください。 興味深いことに、「シックスシグマ」規格では、99%信頼区間または6つの標準偏差(標準偏差はギリシャ文字のシグマで表される)の外側にある製造不良を特定しようとし、p<0.01で有意差検定を表しています
図8.4。 信頼区間の68-95-99%ルール
。