Próbkowanie jest statystycznym procesem wyboru podzbioru (zwanego „próbką”) interesującej nas populacji w celu dokonania obserwacji i wnioskowania statystycznego na temat tej populacji. Badania w naukach społecznych są generalnie o wnioskowaniu o wzorcach zachowań w ramach określonych populacji. Nie możemy badać całych populacji ze względu na ograniczenia związane z wykonalnością i kosztami, dlatego też musimy wybrać reprezentatywną próbę z interesującej nas populacji do obserwacji i analizy. Niezwykle ważne jest, aby wybrać próbę, która jest prawdziwie reprezentatywna dla populacji, tak aby wnioski wyciągnięte z próby mogły być uogólnione na populację będącą przedmiotem zainteresowania. Niewłaściwy i tendencyjny dobór próby jest główną przyczyną często rozbieżnych i błędnych wniosków podawanych w sondażach opinii publicznej i exit polls przeprowadzanych przez różne grupy badawcze, takie jak CNN/Gallup Poll, ABC i CBS, przed każdymi wyborami prezydenckimi w USA.
Proces pobierania próbek
Rysunek 8.1. Proces doboru próby
Proces doboru próby składa się z kilku etapów. Pierwszym etapem jest zdefiniowanie populacji docelowej. Populacja może być zdefiniowana jako wszystkie osoby lub przedmioty (jednostka analizy) z cechami, które chcemy badać. Jednostką analizy może być osoba, grupa, organizacja, kraj, obiekt lub jakikolwiek inny podmiot, o którym chcemy wnioskować naukowo. Czasami populacja jest oczywista. Na przykład, jeśli producent chce ustalić, czy wyroby gotowe wyprodukowane na linii produkcyjnej spełniają określone wymagania jakościowe, czy też muszą zostać zezłomowane i przerobione ponownie, wówczas populacja składa się z całego zbioru wyrobów gotowych wyprodukowanych w tym zakładzie produkcyjnym. W innych przypadkach, populacja docelowa może być nieco trudniejsza do zrozumienia. Jeśli chcesz zidentyfikować główne czynniki wpływające na naukę wśród uczniów szkół średnich, to jaka jest Twoja populacja docelowa: uczniowie szkół średnich, ich nauczyciele, dyrektorzy szkół, czy rodzice? Właściwa odpowiedź w tym przypadku brzmi: uczniowie szkół średnich, ponieważ interesują nas ich wyniki, a nie wyniki ich nauczycieli, rodziców czy szkół. Podobnie, jeśli chcesz przeanalizować zachowanie kół ruletki, aby zidentyfikować stronnicze koła, twoja populacja zainteresowania nie jest różnymi obserwacjami z jednego koła ruletki, ale różne koła ruletki (tj. ich zachowanie w nieskończonym zestawie kół).
Drugim krokiem w procesie próbkowania jest wybór ramki próbkowania . To jest dostępna sekcja docelowej populacji (zazwyczaj lista z informacjami kontaktowymi), z której próbka może być wylosowana. Jeśli populacja docelowa to profesjonalni pracownicy w pracy, ponieważ nie można uzyskać dostępu do wszystkich profesjonalnych pracowników na całym świecie, bardziej realistycznym operatem próby będzie lista pracowników jednej lub dwóch lokalnych firm, które są chętne do wzięcia udziału w badaniu. Jeśli populacja docelowa to organizacje, to lista firm Fortune 500 lub lista firm Standard & Poor’s (S&P) zarejestrowanych na nowojorskiej giełdzie papierów wartościowych może być akceptowalną ramą próbkowania.
Należy pamiętać, że ramy próbkowania mogą nie być całkowicie reprezentatywne dla całej populacji, a jeśli tak, to wnioski wyciągnięte z takiej próbki mogą nie być uogólnione na populację. Na przykład, jeśli Pana(i) populacja docelowa to pracownicy organizacyjni (np. chce Pan(i) zbadać samoocenę pracowników w tej populacji), a Pana(i) operat losowania obejmuje pracowników firm motoryzacyjnych na amerykańskim Środkowym Zachodzie, wyniki uzyskane w takich grupach mogą nie być nawet uogólnione na całą amerykańską siłę roboczą, nie mówiąc już o globalnym miejscu pracy. Dzieje się tak, ponieważ amerykański przemysł samochodowy przez ostatnie 50 lat znajdował się pod silną presją konkurencji i był świadkiem licznych reorganizacji i redukcji zatrudnienia, co prawdopodobnie doprowadziło do niskiego morale pracowników i ich samooceny. Ponadto, większość amerykańskiej siły roboczej jest zatrudniona w sektorze usług lub w małych przedsiębiorstwach, a nie w przemyśle samochodowym. W związku z tym próba pracowników amerykańskiego przemysłu samochodowego nie jest szczególnie reprezentatywna dla amerykańskiej siły roboczej. Podobnie, lista Fortune 500 obejmuje 500 największych amerykańskich przedsiębiorstw, co nie jest reprezentatywne dla wszystkich amerykańskich firm w ogóle, z których większość to średnie i małe firmy, a nie duże, a zatem jest to nieobiektywna rama próbkowania. W przeciwieństwie do tego, lista S&P pozwoli na wybór dużych, średnich i/lub małych firm, w zależności od tego, czy używasz listy S&P large-cap, mid-cap lub small-cap, ale zawiera firmy będące w obrocie publicznym (a nie firmy prywatne) i dlatego nadal jest nieobiektywna. Należy również pamiętać, że populacja, z której pobierana jest próbka, niekoniecznie musi być taka sama jak populacja, o której faktycznie chcemy uzyskać informacje. Na przykład, jeśli badacz chce określić wskaźnik sukcesu nowego programu „rzucania palenia”, to populacją docelową jest ogół palaczy, którzy mieli dostęp do tego programu, który może być populacją nieznaną. W związku z tym, badacz może wybrać do próby pacjentów przybywających do lokalnej placówki medycznej w celu zaprzestania palenia, z których niektórzy mogli nie mieć styczności z tym konkretnym programem „rzucania palenia”, w którym to przypadku, operat losowania nie odpowiada populacji będącej przedmiotem zainteresowania.
Ostatnim krokiem w próbkowaniu jest wybór próby z operatu losowania przy użyciu dobrze zdefiniowanej techniki próbkowania. Techniki próbkowania mogą być pogrupowane w dwie szerokie kategorie: próbkowanie probabilistyczne (losowe) i próbkowanie nieprobabilistyczne. Próbkowanie probabilistyczne jest idealne, jeśli uogólnienie wyników jest ważne dla badania, ale mogą istnieć wyjątkowe okoliczności, w których próbkowanie nieprobabilistyczne może być również uzasadnione. Techniki te są omówione w następnych dwóch sekcjach.
Próbkowanie prawdopodobieństwa
Próbkowanie prawdopodobieństwa jest techniką, w której każda jednostka w populacji ma szansę (niezerowe prawdopodobieństwo) bycia wybraną w próbie, a szansa ta może być dokładnie określona. Statystyki próby uzyskane w ten sposób, takie jak średnia z próby lub odchylenie standardowe, są bezstronnymi szacunkami parametrów populacji, tak długo jak jednostki poddane próbie są ważone zgodnie z ich prawdopodobieństwem wyboru. Wszystkie próby probabilistyczne mają dwie cechy wspólne: (1) każda jednostka w populacji ma znane niezerowe prawdopodobieństwo bycia wybraną do próby oraz (2) procedura próbkowania obejmuje losowy wybór w pewnym momencie. Różne rodzaje technik próbkowania prawdopodobieństwa obejmują:
Proste próbkowanie losowe. W tej technice wszystkie możliwe podzbiory populacji (dokładniej, operatu losowania) mają równe prawdopodobieństwo bycia wybranymi. Prawdopodobieństwo wyboru dowolnego zestawu n jednostek z całkowitej liczby N jednostek w operacie losowania wynosi N C n . Stąd, statystyki próby są bezstronnymi oszacowaniami parametrów populacji, bez żadnych wag. Prosty losowy dobór próby polega na losowym wyborze respondentów z operatu losowania, ale przy dużych operatach losowania zwykle używa się tabeli liczb losowych lub komputerowego generatora liczb losowych. Na przykład, jeśli chcesz wybrać 200 firm do badania z listy 1000 firm, jeśli ta lista jest wprowadzona do arkusza kalkulacyjnego takiego jak Excel, możesz użyć funkcji RAND() Excela, aby wygenerować losowe numery dla każdego z 1000 klientów z tej listy. Następnie posortować listę w porządku rosnącym ich odpowiedniej liczby losowej, i wybrać pierwsze 200 klientów na tej posortowanej liście. Jest to najprostsza z technik próbkowania prawdopodobieństwa; jednakże, prostota jest również mocną stroną tej techniki. Ponieważ operat losowania nie jest podzielony lub podzielony, próba jest bezstronna i wnioski są najbardziej ogólne wśród wszystkich technik próbkowania prawdopodobieństwa.
Systematyczne próbkowanie. W tej technice, operat losowania jest uporządkowany według pewnych kryteriów i elementy są wybierane w regularnych odstępach czasu z tej uporządkowanej listy. Systematyczne pobieranie próbek obejmuje losowy początek, a następnie kontynuuje się wybór każdego k-tego elementu od tego punktu, gdzie k = N / n , gdzie k jest stosunkiem wielkości operatu losowania N i pożądanej wielkości próby n , i jest formalnie nazywane współczynnikiem próbkowania . Ważne jest, że punkt początkowy nie jest automatycznie pierwszym na liście, ale zamiast tego jest losowo wybrany spośród pierwszych k elementów na liście. W naszym poprzednim przykładzie wyboru 200 firm z listy 1000 firm, można posortować 1000 firm w rosnącej (lub malejącej) kolejności ich wielkości (tj. liczby pracowników lub rocznych przychodów), losowo wybrać jedną z pierwszych pięciu firm na posortowanej liście, a następnie wybrać co piątą firmę na liście. Proces ten zapewni, że nie ma nadreprezentacji dużych lub małych firm w próbce, ale raczej, że firmy wszystkich rozmiarów są generalnie jednolicie reprezentowane, tak jak to jest w ramce próbkowania. Innymi słowy, próba jest reprezentatywna dla populacji, przynajmniej na podstawie kryterium sortowania.
Stratyfikowany dobór próby. W próbkowaniu warstwowym, operat losowania jest podzielony na jednorodne i nienakładające się podgrupy (zwane „warstwami”), a prosta próba losowa jest losowana w każdej podgrupie. W poprzednim przykładzie wyboru 200 firm z listy 1000 firm, można zacząć od kategoryzacji firm na podstawie ich wielkości jako duże (ponad 500 pracowników), średnie (między 50 a 500 pracowników) i małe (mniej niż 50 pracowników). Następnie można losowo wybrać 67 firm z każdej podgrupy, aby utworzyć próbę 200 firm. Jednakże, ponieważ istnieje o wiele więcej małych firm w ramie próbkowania niż dużych firm, posiadanie równej liczby małych, średnich i dużych firm sprawi, że próba będzie mniej reprezentatywna dla populacji (tj. będzie stronnicza na korzyść dużych firm, które są mniej liczne w populacji docelowej). Jest to nazywane nieproporcjonalnym warstwowym doborem próby, ponieważ proporcje próby w każdej podgrupie nie odzwierciedlają proporcji w operacie losowania (lub populacji zainteresowania), a mniejsza podgrupa (duże firmy) jest nadpróbkowana. Alternatywną techniką będzie wybór próbek podgrup proporcjonalnie do ich wielkości w populacji. Na przykład, jeśli istnieje 100 dużych firm, 300 średnich firm i 600 małych firm, można pobrać próbki 20 firm z grupy „dużych”, 60 z grupy „średnich” i 120 z grupy „małych”. W tym przypadku, proporcjonalna dystrybucja firm w populacji jest zachowana w próbce, i dlatego ta technika jest nazywana proporcjonalnym próbkowaniem warstwowym. Zauważ, że podejście nieproporcjonalne jest szczególnie skuteczne w reprezentowaniu małych podgrup, takich jak duże firmy, i niekoniecznie jest mniej reprezentatywne dla populacji w porównaniu z podejściem proporcjonalnym, tak długo, jak ustalenia podejścia nieproporcjonalnego są ważone zgodnie z udziałem podgrupy w całej populacji.
Próbkowanie klastrów. Jeśli masz populację rozproszoną w szerokim regionie geograficznym, może nie być wykonalne przeprowadzenie prostej próby losowej całej populacji. W takim przypadku rozsądne może być podzielenie populacji na „klastry” (zwykle wzdłuż granic geograficznych), losowe pobranie próbki z kilku klastrów i zmierzenie wszystkich jednostek w tym klastrze. Na przykład, jeśli chcemy badać samorządy miejskie w stanie Nowy Jork, zamiast podróżować po całym stanie, aby przeprowadzić wywiady z kluczowymi urzędnikami miejskimi (co musielibyśmy zrobić w przypadku prostej próby losowej), możemy zgrupować te samorządy na podstawie ich powiatów, losowo wybrać zestaw trzech powiatów, a następnie przeprowadzić wywiady z urzędnikami z każdego z tych powiatów. Jednakże, w zależności od różnic między klastrami, zmienność oszacowań próby w próbie klastrowej będzie ogólnie wyższa niż w prostej próbie losowej, a zatem wyniki są mniej ogólne dla populacji niż te uzyskane z prostych prób losowych.
Próbkowanie parami. Czasami, badacze mogą chcieć porównać dwie podgrupy w obrębie jednej populacji w oparciu o konkretne kryterium. Na przykład, dlaczego niektóre firmy są konsekwentnie bardziej zyskowne niż inne firmy? Prowadzić taki badanie, ty musieć kategoryzować próbkowanie rama firma w „wysoki rentowny” firma i „niski rentowny firma” opierać się na brutto marża, zysk na akcja, lub jakaś inny miara rentowność. Następnie należy wybrać prostą próbę losową firm w jednej podgrupie i dopasować każdą firmę w tej grupie do firmy w drugiej podgrupie, w oparciu o jej wielkość, segment przemysłu, i/lub inne kryteria dopasowania. Teraz, masz dwie dopasowane próby firm o wysokiej rentowności i niskiej rentowności, które możesz badać w sposób bardziej szczegółowy. Takie dopasowane pary technika próbkowania jest często idealnym sposobem zrozumienia dwubiegunowych różnic między różnymi podgrupami w danej populacji.
Wieloetapowe próbkowanie. Wszystkie opisane wcześniej techniki próbkowania prawdopodobieństwa są przykładami jednoetapowych technik próbkowania. W zależności od potrzeb próbkowania, można połączyć te jednoetapowe techniki, aby przeprowadzić próbkowanie wieloetapowe. Na przykład, można stratyfikować listę przedsiębiorstw w oparciu o wielkość firmy, a następnie przeprowadzić systematyczny dobór próby w każdej warstwie. Jest to dwuetapowe połączenie próbkowania warstwowego i systematycznego. Podobnie, można zacząć od klastra okręgów szkolnych w stanie Nowy Jork, a w ramach każdego klastra, wybrać prostą próbę losową szkół; w ramach każdej szkoły, wybrać prostą próbę losową poziomów klas; a w ramach każdego poziomu klas, wybrać prostą próbę losową uczniów do badania. W tym przypadku, masz czteroetapowy proces próbkowania składający się z klastra i prostego losowego próbkowania.
Próbkowanie bez prawdopodobieństwa
Próbkowanie bez prawdopodobieństwa jest techniką próbkowania, w której niektóre jednostki populacji mają zerowe szanse wyboru lub gdzie prawdopodobieństwo wyboru nie może być dokładnie określone. Zazwyczaj jednostki są wybierane w oparciu o pewne nielosowe kryteria, takie jak kontyngent lub wygoda. Ponieważ wybór jest nielosowy, nielosowy dobór próby nie pozwala na oszacowanie błędów doboru próby i może podlegać tendencyjności doboru próby. Dlatego informacje z próby nie mogą być uogólniane na populację. Rodzaje nielosowych technik próbkowania obejmują:
Próbkowanie dla wygody. Nazywane również próbkowaniem przypadkowym lub próbkowaniem możliwości, jest to technika, w której próbka jest pobierana z tej części populacji, która jest pod ręką, łatwo dostępna lub wygodna. Na przykład, jeśli stoi Pan(i) na zewnątrz centrum handlowego i rozdaje ludziom kwestionariusze lub przeprowadza z nimi wywiady, gdy wchodzą do środka, próba respondentów, którą Pan(i) uzyska będzie próbą dogodną. Jest to próba nieprobabilistyczna, ponieważ systematycznie wyklucza się wszystkie osoby, które robią zakupy w innych centrach handlowych. Opinie uzyskane z wybranej próby mogą odzwierciedlać unikalne cechy tego centrum handlowego, takie jak charakter sklepów (np. sklepy z wyższej półki przyciągają bardziej zamożną grupę demograficzną), profil demograficzny klientów lub lokalizacja (np. centrum handlowe w pobliżu uniwersytetu przyciąga przede wszystkim studentów z unikalnymi zwyczajami zakupowymi), a zatem mogą nie być reprezentatywne dla opinii ogółu kupujących. W związku z tym, naukowa możliwość generalizacji takich obserwacji będzie bardzo ograniczona. Innym przykładem próbkowania wygodnego jest próbkowanie studentów zarejestrowanych w pewnej klasie lub próbkowanie pacjentów przybywających do pewnej kliniki medycznej. Ten rodzaj próbkowania jest najbardziej przydatny do badań pilotażowych, gdzie celem jest testowanie instrumentów lub walidacja pomiarów, a nie uzyskanie uogólnionych wniosków.
Próbkowanie kwotowe. W tej technice, populacja jest podzielona na wzajemnie wykluczające się podgrupy (podobnie jak w próbkowaniu warstwowym), a następnie nielosowy zestaw obserwacji jest wybierany z każdej podgrupy w celu spełnienia wcześniej zdefiniowanego kontyngentu. W proporcjonalnym próbkowaniu kwotowym proporcja respondentów w każdej podgrupie powinna odpowiadać proporcji w populacji. Na przykład, jeśli amerykańska populacja składa się w 70% z ludzi rasy kaukaskiej, w 15% z Latynosów i w 13% z Afroamerykanów, a Pan(i) chce zrozumieć ich preferencje wyborcze w próbie liczącej 98 osób, może Pan(i) stanąć przed centrum handlowym i zapytać ludzi o ich preferencje wyborcze. Ale będzie Pan(i) musiał(a) przestać pytać osoby o Latynoskim wyglądzie, kiedy uzyska Pan(i) 15 odpowiedzi z tej podgrupy (lub Afroamerykanów, kiedy uzyska Pan(i) 13 odpowiedzi), nawet jeśli będzie Pan(i) kontynuował(a) próbkowanie innych grup etnicznych, tak aby skład etniczny Pana(i) próby odpowiadał składowi etnicznemu ogólnej populacji amerykańskiej. Nieproporcjonalny kwotowy dobór próby jest mniej restrykcyjny w tym sensie, że nie musisz osiągnąć proporcjonalnej reprezentacji, ale możesz spełnić minimalną wielkość w każdej podgrupie. W tym przypadku, może Pan(i) zdecydować się na 50 respondentów z każdej z trzech podgrup etnicznych (Kaukaz, Latynosi i Afroamerykanie) i zatrzymać się, gdy limit dla każdej podgrupy zostanie osiągnięty. Żaden z tych sposobów nie będzie reprezentatywny dla populacji amerykańskiej, ponieważ w zależności od tego, czy badanie zostało przeprowadzone w centrum handlowym w Nowym Jorku czy w Kansas, wyniki mogą być zupełnie inne. Technika nieproporcjonalna jest jeszcze mniej reprezentatywna dla populacji, ale może być użyteczna, ponieważ pozwala na uchwycenie opinii małych i niedoreprezentowanych grup poprzez nadpróbkowanie.
Próbkowanie eksperckie. Jest to technika, w której respondenci są wybierani w sposób nielosowy w oparciu o ich wiedzę na temat badanego zjawiska. Na przykład, aby zrozumieć wpływ nowej polityki rządowej, takiej jak Sarbanes-Oxley Act, można wybrać grupę księgowych korporacji, którzy są zaznajomieni z tym aktem. Zaletą tego podejścia jest to, że ponieważ eksperci mają tendencję do bycia bardziej zaznajomionymi z tematem niż nie-eksperci, opinie z próby ekspertów są bardziej wiarygodne niż próba, która zawiera zarówno ekspertów jak i nie-ekspertów, chociaż wyniki nadal nie są uogólnione na całą populację w ogóle.
Próbkowanie kuli śnieżnej. W próbkowaniu kuli śnieżnej, zaczynamy od zidentyfikowania kilku respondentów, którzy spełniają kryteria włączenia do badania, a następnie prosimy ich o polecenie innych, których znają, a którzy również spełniają kryteria wyboru. Na przykład, jeśli chcemy zbadać administratorów sieci komputerowych, a znamy tylko jedną lub dwie takie osoby, możemy zacząć od nich i poprosić ich o polecenie innych, którzy również zajmują się administracją sieci. Chociaż ta metoda z trudem prowadzi do reprezentatywnych prób, czasami może być jedynym sposobem na dotarcie do trudno dostępnych populacji lub gdy nie ma dostępnego operatu losowania.
Statystyka próbkowania
W poprzednich rozdziałach wprowadziliśmy pojęcia takie jak parametr populacji, statystyka próby i błąd próbkowania. W tym rozdziale postaramy się zrozumieć, co te terminy oznaczają i jak są ze sobą powiązane.
Gdy mierzymy pewną obserwację z danej jednostki, taką jak odpowiedź osoby na pozycję w skali Likerta, obserwacja ta nazywana jest odpowiedzią (patrz rysunek 8.2). Innymi słowy, odpowiedź jest wartością pomiaru dostarczoną przez jednostkę objętą próbą. Każdy respondent udzieli różnych odpowiedzi na różne pozycje w instrumencie. Odpowiedzi od różnych respondentów na tę samą pozycję lub obserwację można ułożyć w rozkład częstotliwości na podstawie częstości ich występowania. W przypadku dużej liczby odpowiedzi w próbie, rozkład częstotliwości ma tendencję do przypominania krzywej w kształcie dzwonu zwanej rozkładem normalnym, która może być wykorzystana do oszacowania ogólnych cech całej próby, takich jak średnia z próby (średnia wszystkich obserwacji w próbie) lub odchylenie standardowe (zmienność lub rozrzut obserwacji w próbie). Te oszacowania próby są nazywane statystykami próby („statystyka” to wartość, która jest szacowana na podstawie obserwowanych danych). Populacje również mają średnie i odchylenia standardowe, które można by uzyskać, gdybyśmy mogli pobrać próbki całej populacji. Ponieważ jednak nigdy nie można pobrać próby z całej populacji, cechy populacji są zawsze nieznane i nazywane są parametrami populacji (a nie „statystyką”, ponieważ nie są one szacowane statystycznie na podstawie danych). Statystyki próbki mogą różnić się od parametrów populacji, jeśli próbka nie jest idealnie reprezentatywna dla populacji; różnica między nimi nazywana jest błędem próbkowania. Teoretycznie, jeśli moglibyśmy stopniowo zwiększać wielkość próbki, tak aby próbka zbliżała się coraz bardziej do populacji, wtedy błąd próbkowania zmniejszy się i statystyka próbki będzie coraz bardziej zbliżona do odpowiadającego jej parametru populacji.
Jeśli próbka jest rzeczywiście reprezentatywna dla populacji, wtedy oszacowane statystyki próbki powinny być identyczne z odpowiadającymi im teoretycznymi parametrami populacji. Skąd możemy wiedzieć, czy statystyki próby są przynajmniej w miarę bliskie parametrom populacji? W tym miejscu musimy zrozumieć pojęcie rozkładu próbkowego. Wyobraźmy sobie, że wzięliśmy trzy różne próbki losowe z danej populacji, jak pokazano na rysunku 8.3, i dla każdej z nich wyznaczyliśmy statystyki, takie jak średnia i odchylenie standardowe. Jeśli każda próba losowa była prawdziwie reprezentatywna dla populacji, wtedy trzy średnie z trzech prób losowych będą identyczne (i równe parametrowi populacji), a zmienność średnich z prób wyniesie zero. Jest to jednak bardzo mało prawdopodobne, ponieważ każda próba losowa będzie prawdopodobnie stanowić inny podzbiór populacji, a zatem ich średnie mogą być nieco różne od siebie. Można jednak wziąć te trzy średnie z próbek i wykreślić histogram częstości średnich z próbek. Jeśli liczba takich próbek wzrośnie z trzech, przez 10 do 100, histogram częstotliwości stanie się rozkładem próbkowania. Stąd, rozkład próbkowania jest rozkładem częstotliwości statystyki próbki (jak średnia próbki) z zestawu próbek , podczas gdy powszechnie określany rozkład częstotliwości jest rozkładem odpowiedzi (obserwacji) z pojedynczej próbki . Podobnie jak rozkład częstotliwości, rozkład próbkowania będzie miał również tendencję do posiadania większej liczby statystyk próbki skupionych wokół średniej (która przypuszczalnie jest oszacowaniem parametru populacji), z mniejszą liczbą wartości rozproszonych wokół średniej. Przy nieskończenie dużej liczbie próbek, rozkład ten będzie zbliżony do rozkładu normalnego. Zmienność lub rozrzut statystyki próby w rozkładzie próbkowania (tj. odchylenie standardowe statystyki próbkowania) jest nazywane jej błędem standardowym . W przeciwieństwie do tego, termin odchylenie standardowe jest zarezerwowany dla zmienności obserwowanej odpowiedzi z pojedynczej próbki.
Rysunek 8.2. Statystyka próbki.
Zakłada się, że średnia wartość statystyki próbki w rozkładzie próbkowania jest oszacowaniem nieznanego parametru populacji. Na podstawie rozrzutu tego rozkładu próbkowania (tj. na podstawie błędu standardowego) można również oszacować przedziały ufności dla tego przewidywanego parametru populacji. Przedział ufności jest szacowanym prawdopodobieństwem, że parametr populacji leży w określonym przedziale wartości statystyki próby. Wszystkie rozkłady normalne mają tendencję do przestrzegania reguły 68-95-99 procent (patrz rysunek 8.4), która mówi, że ponad 68% przypadków w rozkładzie leży w granicach jednego odchylenia standardowego od wartości średniej (µ + 1σ), ponad 95% przypadków w rozkładzie leży w granicach dwóch odchyleń standardowych od wartości średniej (µ + 2σ), a ponad 99% przypadków w rozkładzie leży w granicach trzech odchyleń standardowych od wartości średniej (µ + 3σ). Ponieważ rozkład z nieskończoną liczbą prób będzie zbliżony do rozkładu normalnego, obowiązuje ta sama reguła 68-95-99 i można powiedzieć, że:
- (Statystyka z próby + jeden błąd standardowy) reprezentuje 68% przedział ufności dla parametru populacji.
- (Statystyka próbki + dwa błędy standardowe) reprezentuje 95% przedział ufności dla parametru populacji.
- (Statystyka próbki + trzy błędy standardowe) reprezentuje 99% przedział ufności dla parametru populacji.
Rysunek 8.3. Rozkład próbkowania.
Próbka jest „stronnicza” (tzn. nie jest reprezentatywna dla populacji), jeśli jej rozkład próbkowania nie może być oszacowany lub jeśli rozkład próbkowania narusza regułę 68-95-99 procent. Na marginesie, zauważ, że w większości analiz regresji, gdzie badamy istotność współczynników regresji z p<0,05, próbujemy zobaczyć, czy statystyka próbkowania (współczynnik regresji) przewiduje odpowiedni parametr populacji (prawdziwy rozmiar efektu) z 95% przedziałem ufności. Co ciekawe, standard „sześć sigma” próbuje zidentyfikować wady produkcyjne poza 99% przedziałem ufności lub sześcioma odchyleniami standardowymi (odchylenie standardowe jest przedstawiane za pomocą greckiej litery sigma), reprezentującymi testowanie istotności przy p<0,01.
Rysunek 8.4. Reguła 68-95-99 procent dla przedziału ufności.
.