Výzkumné metody pro společenské vědy

Výběr vzorku je statistický proces výběru podmnožiny (tzv. „vzorku“) zájmové populace pro účely pozorování a statistických závěrů o této populaci. Ve společenskovědním výzkumu jde obecně o odvozování vzorců chování v rámci určitých populací. Z důvodu omezení proveditelnosti a nákladů nemůžeme studovat celé populace, a proto musíme ze zájmové populace vybrat reprezentativní vzorek pro pozorování a analýzu. Je nesmírně důležité vybrat vzorek, který je skutečně reprezentativní pro populaci, aby závěry získané ze vzorku bylo možné zobecnit na populaci, která je předmětem zájmu. Nesprávný a neobjektivní výběr vzorku je hlavní příčinou často rozdílných a chybných závěrů uváděných v průzkumech veřejného mínění a exit pollech prováděných různými průzkumnými skupinami, jako jsou CNN/Gallup Poll, ABC a CBS, před každými prezidentskými volbami v USA.

Proces výběru vzorku

Obrázek 8.1: Výběr vzorku. Proces výběru vzorků

Proces výběru vzorků se skládá z několika fází. První fází je vymezení cílové populace. Soubor lze definovat jako všechny osoby nebo předměty ( jednotky analýzy ) s charakteristikami, které chceme zkoumat. Jednotkou analýzy může být osoba, skupina, organizace, země, objekt nebo jakákoli jiná entita, o které chcete vyvodit vědecké závěry. Někdy je populace zřejmá. Například pokud chce výrobce zjistit, zda hotové výrobky vyrobené na výrobní lince splňují určité požadavky na kvalitu, nebo musí být vyřazeny a přepracovány, pak populaci tvoří celý soubor hotových výrobků vyrobených v tomto výrobním závodě. Jindy může být pochopení cílové populace poněkud obtížnější. Pokud chcete zjistit hlavní faktory ovlivňující akademické učení středoškolských studentů, pak jaká je vaše cílová populace: středoškolští studenti, jejich učitelé, ředitelé škol nebo rodiče? Správnou odpovědí jsou v tomto případě středoškolští studenti, protože vás zajímá jejich výkon, nikoli výkon jejich učitelů, rodičů nebo školy. Stejně tak, pokud chcete analyzovat chování kol rulety, abyste identifikovali neobjektivní kola, vaší zájmovou populací nejsou různá pozorování z jednoho kola rulety, ale různá kola rulety (tj. jejich chování v nekonečném souboru kol).

Druhým krokem v procesu výběru vzorku je výběr výběrového souboru . Jedná se o dostupnou část cílové populace (obvykle seznam s kontaktními údaji), z níž lze vybrat vzorek. Pokud jsou vaší cílovou populací profesionální zaměstnanci v zaměstnání, protože nemáte přístup ke všem profesionálním zaměstnancům na celém světě, budou realističtějším výběrovým rámcem seznamy zaměstnanců jedné nebo dvou místních společností, které jsou ochotny se vaší studie zúčastnit. Pokud jsou vaší cílovou populací organizace, pak přijatelným výběrovým rámcem může být seznam firem z žebříčku Fortune 500 nebo seznam firem registrovaných na newyorské burze Standard & Poor’s (S&P).

Upozorňujeme, že výběrové rámce nemusí být zcela reprezentativní pro celou populaci, a pokud ano, závěry získané na základě takového vzorku nemusí být zobecnitelné na celou populaci. Například pokud jsou vaší cílovou populací zaměstnanci organizace jako celek (např. chcete studovat sebehodnocení zaměstnanců v této populaci) a vaším výběrovým rámcem jsou zaměstnanci automobilových společností na americkém Středozápadě, nemusí být závěry z takových skupin zobecnitelné ani na americké zaměstnance jako celek, natož na celosvětové pracoviště. Je tomu tak proto, že americký automobilový průmysl byl v posledních 50 letech pod silným konkurenčním tlakem a zažil četné epizody reorganizace a snižování počtu zaměstnanců, což pravděpodobně vedlo k nízké morálce a sebeúctě zaměstnanců. Většina americké pracovní síly je navíc zaměstnána v odvětvích služeb nebo v malých podnicích, a nikoli v automobilovém průmyslu. Proto vzorek zaměstnanců amerického automobilového průmyslu není příliš reprezentativní pro americkou pracovní sílu. Stejně tak seznam Fortune 500 zahrnuje 500 největších amerických podniků, což není reprezentativní pro všechny americké firmy obecně, z nichž většina jsou spíše střední a malé podniky než velké firmy, a proto je výběrový soubor zkreslený. Naproti tomu seznam S&P umožní výběr velkých, středních a/nebo malých firem, podle toho, zda použijete seznam S&P large-cap, mid-cap nebo small-cap, ale zahrnuje veřejně obchodované firmy (a nikoli soukromé firmy), a tudíž je stále neobjektivní. Uvědomte si také, že populace, z níž je vzorek vybrán, nemusí být nutně stejná jako populace, o níž chceme skutečně získat informace. Například pokud chce výzkumník zjistit úspěšnost nového programu „odvykání kouření“, pak je cílovou populací soubor kuřáků, kteří měli přístup k tomuto programu, což může být neznámá populace. Výzkumník tedy může vybrat vzorek pacientů přicházejících do místního zdravotnického zařízení na léčbu odvykání kouření, z nichž někteří nemuseli mít kontakt s tímto konkrétním programem „odvykání kouření“, a v takovém případě výběrový soubor neodpovídá populaci, která ho zajímá.

Posledním krokem při výběru vzorku je výběr vzorku z výběrového souboru pomocí přesně definované techniky výběru. Techniky výběru vzorků lze rozdělit do dvou velkých kategorií: pravděpodobnostní (náhodný) výběr vzorků a nepravděpodobnostní výběr vzorků. Pravděpodobnostní výběr vzorku je ideální, pokud je pro vaši studii důležitá zobecnitelnost výsledků, ale mohou nastat jedinečné okolnosti, kdy lze odůvodnit i nepravděpodobnostní výběr vzorku. O těchto technikách pojednávají následující dvě části.

Pravděpodobnostní výběr

Pravděpodobnostní výběr je technika, při níž má každá jednotka v populaci šanci (nenulovou pravděpodobnost), že bude vybrána do vzorku, a tuto šanci lze přesně určit. Takto vytvořené výběrové statistiky, jako je výběrový průměr nebo směrodatná odchylka, jsou nestrannými odhady parametrů populace, pokud jsou výběrové jednotky váženy podle své pravděpodobnosti výběru. Všechny pravděpodobnostní výběry mají dva společné atributy: (1) každá jednotka v populaci má známou nenulovou pravděpodobnost, že bude vybrána, a (2) výběrový postup zahrnuje náhodný výběr v určitém bodě. Mezi různé typy technik pravděpodobnostního výběru patří:

Prostý náhodný výběr. Při této technice mají všechny možné podmnožiny populace (přesněji řečeno výběrového souboru) stejnou pravděpodobnost, že budou vybrány. Pravděpodobnost výběru libovolného souboru n jednotek z celkového počtu N jednotek ve výběrovém souboru je N C n . Výběrová statistika je tedy nestranným odhadem parametrů populace bez jakéhokoli vážení. Prostý náhodný výběr zahrnuje náhodný výběr respondentů z výběrového souboru, ale u velkých výběrových souborů se obvykle používá tabulka náhodných čísel nebo počítačový generátor náhodných čísel. Chcete-li například vybrat 200 firem pro průzkum ze seznamu 1000 firem, pokud je tento seznam zadán do tabulkového procesoru, jako je Excel, můžete použít funkci RAND() aplikace Excel, která vygeneruje náhodná čísla pro každého z 1000 klientů na tomto seznamu. Poté seznam seřadíte vzestupně podle odpovídajícího náhodného čísla a vyberete prvních 200 klientů z takto seřazeného seznamu. Jedná se o nejjednodušší ze všech technik pravděpodobnostního výběru; jednoduchost je však zároveň silnou stránkou této techniky. Protože výběrový soubor není rozdělen ani rozčleněn, je vzorek nestranný a závěry jsou ze všech technik pravděpodobnostního výběru nejobecnější.

Systematický výběr. Při této technice je výběrový soubor uspořádán podle určitých kritérií a prvky jsou vybírány v pravidelných intervalech prostřednictvím tohoto uspořádaného seznamu. Systematický výběr zahrnuje náhodný začátek a poté pokračuje výběrem každého k-tého prvku od tohoto bodu, kde k = N / n , kde k je poměr velikosti výběrového rámce N a požadované velikosti vzorku n , a formálně se nazývá výběrový poměr. Je důležité, aby počáteční bod nebyl automaticky první v seznamu, ale aby byl náhodně vybrán z prvních k prvků seznamu. V našem předchozím příkladu výběru 200 firem ze seznamu 1000 firem lze seřadit 1000 firem vzestupně (nebo sestupně) podle jejich velikosti (tj. počtu zaměstnanců nebo ročních tržeb), náhodně vybrat jednu z prvních pěti firem na seřazeném seznamu a poté vybrat každou pátou firmu na seznamu. Tento postup zajistí, že ve vašem vzorku nebudou nadměrně zastoupeny velké nebo malé firmy, ale že firmy všech velikostí budou obecně rovnoměrně zastoupeny, stejně jako je tomu ve vašem výběrovém souboru. Jinými slovy, vzorek je reprezentativní pro populaci, alespoň na základě kritéria třídění.

Stratifikovaný výběr. Při stratifikovaném výběru je výběrový rámec rozdělen na homogenní a nepřekrývající se podskupiny (nazývané „vrstvy“) a v každé podskupině je vybrán prostý náhodný vzorek. V předchozím příkladu výběru 200 firem ze seznamu 1000 firem můžete začít rozdělením firem podle jejich velikosti na velké (více než 500 zaměstnanců), střední (50 až 500 zaměstnanců) a malé (méně než 50 zaměstnanců). Z každé podskupiny pak můžete náhodně vybrat 67 firem, které vytvoří vzorek 200 firem. Protože je však ve výběrovém souboru mnohem více malých firem než velkých, bude mít vzorek stejný počet malých, středních a velkých firem méně reprezentativní pro populaci (tj. bude zkreslený ve prospěch velkých firem, kterých je v cílové populaci méně). Tomuto postupu se říká neproporcionální stratifikovaný výběr, protože podíl vzorku v každé podskupině neodráží poměry ve výběrovém souboru (nebo v zájmové populaci) a menší podskupina (velké firmy) je nadměrně zastoupena ve vzorku . Alternativní technikou bude výběr vzorků podskupin v poměru k jejich velikosti v populaci. Například pokud existuje 100 velkých firem, 300 středních firem a 600 malých firem, můžete vybrat 20 firem ze skupiny „velkých“, 60 ze skupiny „středních“ a 120 ze skupiny „malých“. V tomto případě je ve vzorku zachováno poměrné rozdělení firem v populaci, a proto se tato technika nazývá proporcionální stratifikovaný výběr. Všimněte si, že neproporcionální přístup je zvláště účinný při reprezentaci malých podskupin, jako jsou velké firmy, a není nutně méně reprezentativní pro populaci ve srovnání s proporcionálním přístupem, pokud jsou zjištění neproporcionálního přístupu vážena v souladu s podílem podskupiny na celkové populaci.

Klastrový výběr. Pokud máte populaci rozptýlenou v široké geografické oblasti, nemusí být možné provést prostý náhodný výběr celé populace. V takovém případě může být rozumné rozdělit populaci do „shluků“ (obvykle podél geografických hranic), náhodně vybrat několik shluků a změřit všechny jednotky v tomto shluku. Chcete-li například vybrat vzorek městských samospráv ve státě New York, místo abyste cestovali po celém státě a prováděli rozhovory s klíčovými městskými úředníky (jak byste možná museli učinit při prostém náhodném výběru), můžete tyto samosprávy seskupit podle jejich okresů, náhodně vybrat soubor tří okresů a pak provést rozhovory s úředníky všech úředníků v těchto okresech. V závislosti na rozdílech mezi jednotlivými shluky však bude variabilita odhadů ve výběrovém souboru u shlukového výběru obecně vyšší než u prostého náhodného výběru, a proto jsou výsledky méně zobecnitelné na populaci než výsledky získané z prostých náhodných výběrů.

Výběr několika párů. Někdy mohou výzkumníci chtít porovnat dvě podskupiny v rámci jedné populace na základě určitého kritéria. Například proč jsou některé firmy trvale ziskovější než jiné firmy? Chcete-li provést takovou studii, museli byste rozdělit výběrový soubor firem na „vysoce ziskové“ a „málo ziskové firmy“ na základě hrubé marže, zisku na akcii nebo jiného ukazatele ziskovosti. Poté byste vybrali jednoduchý náhodný vzorek firem z jedné podskupiny a každou firmu z této skupiny byste přiřadili k firmě z druhé podskupiny na základě její velikosti, segmentu odvětví a/nebo jiných odpovídajících kritérií. Nyní máte dva srovnatelné vzorky firem s vysokou a nízkou ziskovostí, které můžete podrobněji zkoumat. Taková technika výběru srovnávaných párů je často ideálním způsobem, jak pochopit bipolární rozdíly mezi různými podskupinami v rámci dané populace.

Vícestupňový výběr vzorků. Všechny dříve popsané techniky pravděpodobnostního výběru jsou příklady jednostupňových technik výběru. V závislosti na potřebách výběru vzorků můžete tyto jednostupňové techniky kombinovat a provádět vícestupňový výběr vzorků. Můžete například rozvrstvit seznam podniků podle velikosti firmy a poté provést systematický výběr vzorků v rámci každé vrstvy. Jedná se o dvoustupňovou kombinaci stratifikovaného a systematického výběru vzorků. Podobně můžete začít se shlukem školních obvodů ve státě New York a v rámci každého shluku vybrat prostý náhodný vzorek škol; v rámci každé školy vybrat prostý náhodný vzorek tříd; a v rámci každé třídy vybrat prostý náhodný vzorek studentů ke studiu. V tomto případě máte čtyřstupňový výběrový proces sestávající ze shlukového a prostého náhodného výběru.

Nepravděpodobnostní výběr

Nepravděpodobnostní výběr je výběrová technika, při které mají některé jednotky populace nulovou pravděpodobnost výběru nebo u které nelze pravděpodobnost výběru přesně určit. Obvykle se jednotky vybírají na základě určitých nenáhodných kritérií, jako je kvóta nebo výhodnost. Protože výběr není náhodný, nepravděpodobnostní výběr neumožňuje odhad výběrových chyb a může být zatížen výběrovým zkreslením. Proto nelze informace z výběrového souboru zobecnit zpětně na populaci. Mezi typy nepravděpodobnostních výběrových technik patří:

Výběr z výhodnosti. Nazývá se také náhodný nebo příležitostný výběr a jedná se o techniku, při níž se vzorek vybírá z té části populace, která je blízko, snadno dostupná nebo výhodná. Pokud například stojíte před nákupním centrem a rozdáváte lidem dotazníkové průzkumy nebo s nimi děláte rozhovory, když jdou dovnitř, vzorek respondentů, který získáte, bude výběrem z pohodlí. Jedná se o nepravděpodobnostní vzorek, protože systematicky vylučujete všechny lidi, kteří nakupují v jiných nákupních centrech. Názory, které byste získali z vámi vybraného vzorku, mohou odrážet jedinečné charakteristiky tohoto nákupního centra, jako je charakter jeho obchodů (např. obchody vyšší třídy budou přitahovat bohatší demografickou skupinu), demografický profil jeho návštěvníků nebo jeho umístění (např. nákupní centrum v blízkosti univerzity bude přitahovat především vysokoškolské studenty s jedinečnými nákupními zvyklostmi), a proto nemusí být reprezentativní pro názory nakupující populace jako celku. Proto bude vědecká zobecnitelnost takových pozorování velmi omezená. Dalšími příklady pohodlného výběru jsou výběr vzorků studentů zapsaných do určité třídy nebo výběr vzorků pacientů přicházejících do určité lékařské ordinace. Tento typ výběru je nejužitečnější pro pilotní testování, kde je cílem spíše testování nástrojů nebo validace měření než získání zobecnitelných závěrů.

Kvótový výběr. Při této technice je populace rozdělena na vzájemně se vylučující podskupiny (stejně jako při stratifikovaném výběru) a poté je z každé podskupiny vybrán nenáhodný soubor pozorování, aby byla splněna předem stanovená kvóta. Při proporcionálním kvótním výběru by měl podíl respondentů v každé podskupině odpovídat podílu v populaci. Pokud se například americká populace skládá ze 70 % z bělochů, 15 % z Hispánců a 13 % z Afroameričanů a vy chcete zjistit jejich volební preference ve vzorku 98 osob, můžete stát před nákupním centrem a ptát se lidí na jejich volební preference. Budete se však muset přestat ptát lidí hispánského vzhledu, když získáte 15 odpovědí z této podskupiny (nebo Afroameričanů, když získáte 13 odpovědí), i když budete pokračovat ve výběru vzorků ostatních etnických skupin, aby etnické složení vašeho vzorku odpovídalo složení celkové americké populace. Neproporcionální kvótní výběr je méně omezující v tom, že nemusíte dosáhnout poměrného zastoupení, ale třeba splnit minimální velikost v každé podskupině. V tomto případě se můžete rozhodnout, že budete mít 50 respondentů z každé ze tří etnických podskupin (běloši, Hispánci a Afroameričané), a zastavíte se, jakmile dosáhnete kvóty pro každou podskupinu. Ani jeden z typů kvótního výběru nebude reprezentativní pro americkou populaci, protože v závislosti na tom, zda byl váš výzkum prováděn v nákupním centru v New Yorku nebo v Kansasu, mohou být vaše výsledky zcela odlišné. Neproporcionální technika je ještě méně reprezentativní pro populaci, ale může být užitečná v tom, že umožňuje zachytit názory malých a nedostatečně zastoupených skupin prostřednictvím nadvýběru.

Expertní výběr. Jedná se o techniku, při níž jsou respondenti vybíráni nenáhodným způsobem na základě jejich odborných znalostí zkoumaného jevu. Chcete-li například pochopit dopady nové vládní politiky, jako je zákon Sarbanes-Oxley, můžete vybrat vzorek skupiny podnikových účetních, kteří jsou s tímto zákonem obeznámeni. Výhodou tohoto přístupu je, že vzhledem k tomu, že odborníci bývají s danou problematikou obeznámeni lépe než neodborníci, jsou názory ze vzorku odborníků důvěryhodnější než ze vzorku, který zahrnuje jak odborníky, tak neodborníky, ačkoli zjištění stále nelze zobecnit na celou populaci jako celek.

Výběr vzorku sněhovou koulí. Při výběru vzorku sněhovou koulí začnete tím, že určíte několik respondentů, kteří splňují kritéria pro zařazení do studie, a poté je požádáte, aby doporučili další své známé, kteří rovněž splňují kritéria výběru. Chcete-li například provést průzkum mezi správci počítačových sítí a znáte pouze jednu nebo dvě takové osoby, můžete začít u nich a požádat je, aby vám doporučili další osoby, které se rovněž zabývají správou sítí. Ačkoli tato metoda stěží vede k reprezentativním vzorkům, může být někdy jediným způsobem, jak oslovit obtížně dosažitelné populace nebo když není k dispozici žádný výběrový rámec.

Statistika výběru

V předchozích částech jsme zavedli pojmy jako populační parametr, výběrová statistika a výběrové zkreslení. V této části se pokusíme pochopit, co tyto pojmy znamenají a jak spolu souvisejí.

Pokud měříte určité pozorování z dané jednotky, například odpověď osoby na položku s Likertovou škálou, nazývá se toto pozorování odpověď (viz obrázek 8.2). Jinými slovy, odpověď je naměřená hodnota poskytnutá výběrovou jednotkou. Každý respondent vám poskytne různé odpovědi na různé položky nástroje. Odpovědi různých respondentů na stejnou položku nebo pozorování lze zakreslit do grafu do rozdělení četností na základě četnosti jejich výskytu. Pro velký počet odpovědí ve vzorku má toto rozdělení četností tendenci připomínat zvonovitou křivku zvanou normální rozdělení , kterou lze použít k odhadu celkových charakteristik celého vzorku, jako je výběrový průměr (průměr všech pozorování ve vzorku) nebo směrodatná odchylka (variabilita nebo rozpětí pozorování ve vzorku). Tyto výběrové odhady se nazývají výběrové statistiky („statistika“ je hodnota, která se odhaduje z pozorovaných dat). Populace mají také průměry a směrodatné odchylky, které bychom mohli získat, kdybychom mohli odebrat vzorek celé populace. Protože však nikdy nelze vybrat vzorek celé populace, charakteristiky populace jsou vždy neznámé a nazývají se populační parametry (a nikoli „statistika“, protože se statisticky neodhadují z dat). Výběrová statistika se může lišit od populačních parametrů, pokud vzorek není dokonale reprezentativní pro populaci; rozdíl mezi nimi se nazývá výběrová chyba . Teoreticky, pokud bychom mohli postupně zvětšovat velikost vzorku tak, aby se vzorek stále více přibližoval populaci, pak se výběrová chyba bude zmenšovat a výběrová statistika se bude stále více blížit odpovídajícímu populačnímu parametru.

Je-li vzorek skutečně reprezentativní pro populaci, pak by odhadnuté výběrové statistiky měly být totožné s odpovídajícími teoretickými populačními parametry. Jak zjistíme, zda se výběrová statistika alespoň přiměřeně blíží parametrům populace? Zde musíme pochopit pojem výběrového rozdělení . Představte si, že jste z dané populace odebrali tři různé náhodné vzorky, jak je znázorněno na obrázku 8.3, a pro každý vzorek jste odvodili výběrovou statistiku, například výběrový průměr a směrodatnou odchylku. Pokud byl každý náhodný vzorek skutečně reprezentativní pro populaci, pak budou vaše tři výběrové průměry ze tří náhodných vzorků shodné (a rovny parametru populace) a variabilita výběrových průměrů bude nulová. To je však krajně nepravděpodobné vzhledem k tomu, že každý náhodný vzorek bude pravděpodobně tvořit jinou podmnožinu populace, a tudíž se jejich průměry mohou navzájem mírně lišit. Můžete však vzít tyto tři výběrové průměry a vykreslit histogram četností výběrových průměrů. Pokud se počet těchto vzorků zvýší ze tří na 10 až 100, stane se z histogramu četností výběrové rozdělení. Výběrové rozdělení je tedy rozdělení četností výběrové statistiky (například výběrového průměru) ze souboru vzorků , zatímco běžně uváděné rozdělení četností je rozdělení odpovědi (pozorování) z jednoho vzorku. Stejně jako rozdělení četností bude mít i výběrové rozdělení tendenci mít více výběrových statistik seskupených kolem průměru (který je pravděpodobně odhadem populačního parametru) a méně hodnot rozptýlených kolem průměru. Při nekonečně velkém počtu vzorků se toto rozdělení bude blížit normálnímu rozdělení. Variabilita nebo rozptyl výběrové statistiky ve výběrovém rozdělení (tj. směrodatná odchylka výběrové statistiky) se nazývá její směrodatná chyba . Naproti tomu termín směrodatná odchylka je vyhrazen pro variabilitu pozorované odpovědi z jediného vzorku.

Obrázek 8.2. Směrodatná odchylka. Výběrová statistika.

Předpokládá se, že střední hodnota výběrové statistiky ve výběrovém rozdělení je odhadem neznámého populačního parametru. Na základě rozpětí tohoto výběrového rozdělení (tj. na základě směrodatné chyby) lze také odhadnout intervaly spolehlivosti pro tento predikovaný populační parametr. Interval spolehlivosti je odhadovaná pravděpodobnost, že populační parametr leží v určitém intervalu hodnot výběrové statistiky. Všechna normální rozdělení se zpravidla řídí pravidlem 68-95-99 % (viz obrázek 8.4), které říká, že více než 68 % případů v rozdělení leží uvnitř jedné směrodatné odchylky od střední hodnoty (µ + 1σ), více než 95 % případů v rozdělení leží uvnitř dvou směrodatných odchylek od střední hodnoty (µ + 2σ) a více než 99 % případů v rozdělení leží uvnitř tří směrodatných odchylek od střední hodnoty (µ + 3σ). Protože výběrové rozdělení s nekonečným počtem vzorků se bude blížit normálnímu rozdělení, platí stejné pravidlo 68-95-99 a lze říci, že:

  • (výběrová statistika + jedna směrodatná chyba) představuje 68% interval spolehlivosti pro populační parametr.
  • (Výběrová statistika + dvě standardní chyby) představuje 95% interval spolehlivosti pro parametr populace.
  • (Výběrová statistika + tři standardní chyby) představuje 99% interval spolehlivosti pro parametr populace.

Obrázek 8.3. Výběrové statistiky. Výběrové rozdělení.

Výběr je „neobjektivní“ (tj. není reprezentativní pro populaci), pokud jeho výběrové rozdělení nelze odhadnout nebo pokud výběrové rozdělení porušuje pravidlo 68-95-99 %. Na okraj poznamenejme, že ve většině regresních analýz, kde zkoumáme významnost regresních koeficientů s p<0,05, se snažíme zjistit, zda výběrová statistika (regresní koeficient) předpovídá odpovídající populační parametr (skutečnou velikost účinku) s 95% intervalem spolehlivosti. Zajímavé je, že norma „šest sigma“ se pokouší identifikovat výrobní vady mimo 99% interval spolehlivosti nebo šest směrodatných odchylek (směrodatná odchylka je znázorněna pomocí řeckého písmene sigma), což představuje testování významnosti při p<0,01.

Obrázek 8.4. Pravidlo 68-95-99 % pro interval spolehlivosti.

.