See on statistikas kasutatava intervalli hinnang, mis sisaldab populatsiooni parameetrit. See tundmatu populatsiooni parameeter leitakse a kaudu kogutud andmete põhjal arvutatud näidismudel.
Näide: kogutud proovi keskmine x mean võib kattuda tegeliku populatsiooni keskmise μ-ga või mitte. Selleks on võimalik kaaluda valimivahendite vahemikku, kus seda populatsiooni keskmist saab piirata. Mida pikem on see vahemik, seda tõenäolisem on see.
Usaldusvahemik väljendatakse protsentides, mida nimetatakse usaldustasemeks, kusjuures kõige sobivamad on 90%, 95% ja 99%. Näiteks alloleval pildil on 90% usaldusvahemik selle ülemise ja alumise piiri vahel (o ja -a).
Näide 90% usaldusvahemik teie ülemise (a) ja alumise (-a) piiri vahel.
Usaldusvahemik on statistiliste hüpoteeside testimisel üks olulisemaid mõisteid, kuna seda kasutatakse määramatuse mõõdupuuna. Selle termini võttis kasutusele Poola matemaatik ja statistik Jerzy Neyman aastal 1937.
Mis on usalduse intervalli asjakohasus?
Usaldusvahemik on oluline ebakindluse (või ebatäpsuse) piiri näitamiseks tehtud arvutuse ees. Selles arvutuses kasutatakse uuringu valimit tulemuse tegeliku suuruse hindamiseks lähteallikas.
Usaldusväärsuse intervalli arvutamine on strateegia, mis võtab arvesse vigade valimist. Teie uurimistulemuse suurus ja selle usaldusvahemik iseloomustavad esialgse populatsiooni eeldatavaid väärtusi.
Mida kitsam on usaldusintervall, seda suurem on populatsiooni protsendi tõenäosus uuring esindab päritolupopulatsiooni tegelikku arvu, andes suurema kindluse tulemuse kohta Uuring.
Kuidas tõlgendada usalduse intervalli?
Usaldusvahemiku õige tõlgendamine on selle statistilise kontseptsiooni ilmselt kõige keerulisem aspekt. Mõiste kõige tavalisema tõlgendamise näide on järgmine:
On üks 95% tõenäosus et tulevikus jääb populatsiooni parameetri (näiteks keskmise) tegelik väärtus vahemikku X (alumine piir) ja Y (ülemine piir).
Seega tõlgendatakse usaldusvahemikku järgmiselt: on 95% kindel, et X (alumine piir) ja Y (ülemine piir) vaheline intervall sisaldab populatsiooni parameetri tõelist väärtust.
Oleks täiesti vale öelge, et: on 95% tõenäosus, et X (alumine piir) ja Y (ülemine piir) vaheline intervall sisaldab populatsiooni parameetri tegelikku väärtust.
Ülaltoodud väide on enim levinud väärarusaam usaldusvahemiku kohta. Pärast statistilise vahemiku arvutamist võib see sisaldada ainult populatsiooni parameetrit või mitte.
Vahemikud võivad proovide vahel siiski erineda, samas kui tegelik populatsiooni parameeter on valimist sõltumata sama.
Seetõttu saab usaldusintervalli käsitleva tõenäosuse avalduse teha ainult juhul, kui usaldusintervallid arvutatakse proovide arvu jaoks ümber.
Usaldusväärsuse intervalli arvutamise etapid
Vahemiku arvutamiseks kasutatakse järgmisi samme:
- Koguge valimi andmed: ei;
- Arvutage valimi keskmine x̅;
- Tehke kindlaks, kas populatsiooni standardhälve (σ) on teada või tundmatu;
- Kui populatsiooni standardhälve on teada, saab kasutada punkti. z vastava usaldustaseme jaoks;
- Kui populatsiooni standardhälve ei ole teada, võime kasutada statistikat t vastava usaldustaseme jaoks;
- Seega leitakse usaldusvahemiku alumine ja ülemine piir järgmiste valemite abil:
) Tuntud populatsiooni standardhälve:
Valem teadaoleva populatsiooni standardhälbe arvutamiseks.
B) Tundmatu populatsiooni standardhälve:
Valem tundmatu populatsiooni standardhälbe arvutamiseks.
Praktiline näide usaldusvahemikust
Kliinilises uuringus hinnati seost astma esinemise ja obstruktiivse uneapnoe tekkimise riski vahel täiskasvanutel.
Mõned täiskasvanud värbati juhuslikult riigiametnike nimekirjast, mida tuleb jälgida nelja aasta jooksul.
Astmaga osalejatel oli võrreldes nelja aastaga suurem apnoe tekkimise oht nelja aasta jooksul.
Selles näites sarnaste kliiniliste uuringute läbiviimisel värvatakse uuringu efektiivsuse (vähem kulusid ja vähem aega) suurendamiseks tavaliselt huvipakkuvate elanikkonna alamhulk.
See isikute alarühm, uuritud populatsioon, koosneb neist, kes vastavad kaasamise kriteeriumidele ja nõustuvad uuringus osalema, nagu on näidatud alloleval pildil.
Näites uuritud populatsiooni seletav graafik.
Seejärel on uuring lõpetatud ja arvutatakse efekti suurus (näiteks: keskmine erinevus või üks suhteline risk) küsitlusküsimusele vastamiseks.
See protsess, nn järeldaminehõlmab uuringupopulatsioonilt kogutud andmete kasutamist huvipakkuva populatsiooni, st lähtepopulatsiooni tegeliku mõju suuruse hindamiseks.
Toodud näites värbasid teadlased juhusliku valimi riigitöötajatest (lähtepopulatsioon), kes olid abikõlblikud ja nõustus uuringus osalema (uuritav populatsioon) ja teatas, et astma suurendab populatsioonis apnoe tekkimise riski uuritud.
Ainult huvipakkuva populatsiooni alamhulga värbamisel tekkinud valimisvea arvestamiseks arvutasid nad ka a 95% usaldusintervall (hinnangulise ümber) 1,06–1,82, mis näitab tõenäosust 95%, et tegelik suhteline risk päritolupopulatsioonis oleks vahemikus 1,06–1,82.
Enesekindluse intervall keskmiseks
Kui teil on teavet populatsiooni standardhälbe kohta, saate arvutada selle populatsiooni keskmise või keskmise usaldusvahemiku.
Kui mõõdetav statistiline näitaja (nt sissetulek, IQ, hind, pikkus, kogus või kaal) on arvuline, leitakse hinnanguliselt enamikul juhtudel populatsiooni keskmine väärtus.
Seega püüame leida populatsiooni keskmise (μ), kasutades valimi keskmist (x̅), veavaruga. Selle arvutuse tulemust nimetatakse usaldusintervall elanikkonna keskmiseks.
Kui populatsiooni standardhälve on teada, on populatsiooni keskmise usaldusvahemiku (CI) valem:
Kus:
- x̅ on valimi keskmine;
- σ on populatsiooni standardhälve;
- eion valimi suurus;
- Ζ* tähistab tavalise normaaljaotuse sobivat väärtust teie soovitud usaldustaseme jaoks.
Allpool on toodud erinevate usaldustasemete väärtused (Ζ*):
Usalduse tase | Z väärtus * - |
---|---|
80% | 1.28 |
90% | 1 645 (tavapärane) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
Ülaltoodud tabel näitab antud usaldustaseme z * väärtusi. Pange tähele, et need väärtused võetakse standard normaaljaotusest (Z-).
Iga z * väärtuse ja selle väärtuse negatiivse vaheline ala on usaldusprotsent (ligikaudne). Näiteks on ala z * = 1,28 ja z = -1,28 vahel ligikaudu 0,80. Seetõttu saab seda tabelit laiendada ka teistele usalduse protsentidele. Tabelis on toodud ainult enim kasutatud usalduse protsendid.
Vt ka tähendust Hüpotees.