Jest to oszacowanie przedziału używanego w statystyce, który zawiera parametr populacji. Ten nieznany parametr populacji znajduje się poprzez a przykładowy model obliczony na podstawie zebranych danych.
Przykład: średnia pobranej próbki x̅ może, ale nie musi pokrywać się z rzeczywistą średnią populacji μ. W tym celu możliwe jest rozważenie zakresu średnich z próby, w których ta średnia populacji może być zawarta. Im dłuższy jest ten odstęp, tym większe prawdopodobieństwo, że to zrobi.
Przedział ufności jest wyrażony w procentach, nazywanym poziomem ufności, przy czym najbardziej odpowiednie są 90%, 95% i 99%. Na poniższym obrazku, na przykład, mamy 90% przedział ufności między jego górną i dolną granicą (o i -a).
Przykład 90% przedział ufności między górnym (a) a dolnym (-a) limitem.
Przedział ufności jest jednym z najważniejszych pojęć w testowaniu hipotez statystycznych, ponieważ jest używany jako miara niepewności. Termin został wprowadzony przez polskiego matematyka i statystyka Jerzego Neymana w 1937 roku.
Jakie jest znaczenie przedziału ufności?
Przedział ufności jest ważny, aby wskazać margines niepewności (lub niedokładności) przed wykonanym obliczeniem. To obliczenie wykorzystuje próbkę badawczą do oszacowania rzeczywistej wielkości wyniku w populacji źródłowej.
Obliczanie przedziału ufności to strategia, która uwzględnia próbkowanie błędów. Wielkość wyniku badania i jego przedział ufności charakteryzują przyjęte wartości dla pierwotnej populacji.
Im węższy przedział ufności, tym większe prawdopodobieństwo procentu populacji badania reprezentują rzeczywistą liczbę ludności pochodzenia, dając większą pewność co do wyniku przedmiotu nauka.
Jak interpretować przedział ufności?
Prawidłowa interpretacja przedziału ufności jest prawdopodobnie najtrudniejszym aspektem tej koncepcji statystycznej. Przykład najczęstszej interpretacji tego pojęcia jest następujący:
Jest jeden 95% prawdopodobieństwo że w przyszłości prawdziwa wartość parametru populacji (na przykład średnia) mieści się w przedziale X (dolna granica) i Tak (Górna granica).
Zatem przedział ufności jest interpretowany w następujący sposób: jest 95% pewności, że zakres między X (dolna granica) a Y (górna granica) zawiera prawdziwą wartość parametru populacji.
Byłoby całkowicie niepoprawny stwierdzić, że: istnieje 95% prawdopodobieństwo, że przedział między X (dolna granica) a Y (górna granica) zawiera rzeczywistą wartość parametru populacji.
Powyższe stwierdzenie jest najczęstszym nieporozumieniem dotyczącym przedziału ufności. Po obliczeniu zakresu statystycznego może on zawierać tylko parametr populacji lub nie.
Jednak zakresy mogą się różnić między próbkami, podczas gdy prawdziwy parametr populacji jest taki sam niezależnie od próbki.
Dlatego stwierdzenie prawdopodobieństwa dotyczące przedziału ufności można wykonać tylko w przypadku, gdy przedziały ufności są przeliczane dla liczby próbek.
Etapy obliczania przedziału ufności
Zakres jest obliczany w następujący sposób:
- Zbierz przykładowe dane: Nie;
- Oblicz średnią próbki x̅;
- Określ, czy odchylenie standardowe populacji (σ) jest znany lub nieznany;
- Jeśli znane jest odchylenie standardowe populacji, można użyć punktu. z dla odpowiedniego poziomu ufności;
- Jeśli odchylenie standardowe populacji jest nieznane, możemy użyć statystyki t dla odpowiedniego poziomu ufności;
- Zatem dolną i górną granicę przedziału ufności wyznacza się za pomocą następujących wzorów:
) Odchylenie standardowe znanej populacji:
Wzór do obliczania odchylenia standardowego znanej populacji.
B) Odchylenie standardowe nieznanej populacji:
Wzór do obliczania odchylenia standardowego nieznanej populacji.
Praktyczny przykład przedziału ufności
W badaniu klinicznym oceniono związek między obecnością astmy a ryzykiem rozwoju obturacyjnego bezdechu sennego u dorosłych.
Niektórzy dorośli zostali losowo zwerbowani z listy urzędników państwowych, która miała być obserwowana przez cztery lata.
Uczestnicy z astmą, w porównaniu z osobami bez astmy, mieli wyższe ryzyko rozwoju bezdechu w ciągu czterech lat.
Podczas prowadzenia badań klinicznych, takich jak ten przykład, zwykle rekrutuje się podzbiór populacji zainteresowania, aby zwiększyć wydajność badania (mniejszy koszt i mniej czasu).
Ta podgrupa osób, badana populacja, składa się z tych, którzy spełniają kryteria włączenia i zgadzają się na udział w badaniu, jak pokazano na poniższym obrazku.
Wykres wyjaśniający populacji badanej w przykładzie.
Następnie badanie jest zakończone i obliczana jest wielkość efektu (na przykład: średnia różnica lub jeden względne ryzyko), aby odpowiedzieć na pytanie ankiety.
Ten proces, zwany wnioskowanie, polega na wykorzystaniu danych zebranych z badanej populacji do oszacowania rzeczywistej wielkości efektu w populacji będącej przedmiotem zainteresowania, tj. populacji źródłowej.
W podanym przykładzie badacze zrekrutowali losową próbę pracowników państwowych (populacja źródłowa), którzy kwalifikowali się i zgodził się na udział w badaniu (populacja badana) i zgłosił, że astma zwiększa ryzyko rozwoju bezdechu w populacji badane.
Aby uwzględnić błąd próby związany z rekrutacją tylko podzbioru populacji zainteresowania, obliczono również a 95% przedział ufności (wokół oszacowania) 1,06 - 1,82, wskazując na prawdopodobieństwo 95%, że rzeczywiste ryzyko względne w populacji pochodzenia wynosi od 1,06 do 1,82.
Przedział ufności dla średniej
Mając informacje o odchyleniu standardowym populacji, można obliczyć przedział ufności dla średniej lub średniej tej populacji.
Gdy mierzona cecha statystyczna (taka jak dochód, IQ, cena, wzrost, ilość lub waga) jest liczbowa, w większości przypadków szacuje się, że zostanie znaleziona średnia wartość dla populacji.
Dlatego staramy się znaleźć średnią populacji (μ) przy użyciu średniej z próby (x̅), z marginesem błędu. Wynik tego obliczenia nazywa się przedział ufności dla średniej populacji.
Gdy znane jest odchylenie standardowe populacji, wzór na przedział ufności (CI) dla średniej populacji jest następujący:
Gdzie:
- x̅ jest średnią próbki;
- σ to odchylenie standardowe populacji;
- Nieto wielkość próbki;
- Ζ* reprezentuje odpowiednią wartość standardowego rozkładu normalnego dla pożądanego poziomu ufności.
Poniżej znajdują się wartości dla różnych poziomów ufności (Ζ*):
Poziom zaufania | Wartość Z*- |
---|---|
80% | 1.28 |
90% | 1645 (konwencjonalny) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
Powyższa tabela przedstawia wartości z* dla danych poziomów ufności. Zauważ, że te wartości są pobierane ze standardowego rozkładu normalnego (Z-).
Obszar między każdą wartością z * a ujemną wartością to procent ufności (w przybliżeniu). Na przykład obszar między z * = 1,28 i z = -1,28 wynosi około 0,80. Dlatego tę tabelę można również rozszerzyć o inne wartości procentowe ufności. W tabeli przedstawiono tylko najczęściej używane wartości procentowe ufności.
Zobacz także znaczenie Hipoteza.