Det är en uppskattning av ett intervall som används i statistiken, som innehåller en populationsparameter. Denna okända populationsparameter hittas genom a provmodell beräknad från insamlad data.
Exempel: medelvärdet av ett samlat prov x̅ kan sammanfalla med eller inte med det verkliga populationsmedlet μ. För detta är det möjligt att överväga ett antal provmedel där detta populationsmedelvärde kan inkluderas. Ju längre detta intervall är, desto mer sannolikt är det att göra det.
Konfidensintervallet uttrycks i procent, kallat konfidensnivå, med 90%, 95% och 99% som mest lämpliga. I bilden nedan har vi till exempel ett 90% konfidensintervall mellan dess övre och nedre gränser (o och -a).
Exempel 90% konfidensintervall mellan dina övre (a) och nedre (-a) gränser.
Konfidensintervallet är ett av de viktigaste begreppen i statistisk hypotesprovning, eftersom det används som ett mått på osäkerhet. Termen introducerades av den polska matematikern och statistikern Jerzy Neyman 1937.
Vad är relevansen av ett förtroendeintervall?
Konfidensintervallet är viktigt för att indikera osäkerhetsmarginalen (eller oprecision) framför en beräkning. Denna beräkning använder studieprovet för att uppskatta den faktiska storleken på resultatet i källpopulationen.
Att beräkna ett konfidensintervall är en strategi som tar hänsyn till felprovtagning. Studieresultatets storlek och dess konfidensintervall karakteriserar de antagna värdena för den ursprungliga populationen.
Ju smalare konfidensintervallet är, desto större är sannolikheten för befolkningsprocenten studie representerar det verkliga antalet ursprungspopulationer, vilket ger större säkerhet när det gäller resultatet av objektet studie.
Hur tolkar man ett förtroendeintervall?
Korrekt tolkning av konfidensintervallet är förmodligen den mest utmanande aspekten av detta statistiska koncept. Ett exempel på den vanligaste tolkningen av konceptet är följande:
Det finns en 95% sannolikhet att det verkliga värdet av befolkningsparametern (till exempel medelvärdet) i framtiden faller inom intervallet X (nedre gräns) och Y (övre gräns).
Således tolkas konfidensintervallet enligt följande: det är 95% säkert att intervallet mellan X (nedre gräns) och Y (övre gräns) innehåller det verkliga värdet av populationsparametern.
Skulle vara helt felaktigt ange att: det finns en sannolikhet på 95% att intervallet mellan X (nedre gräns) och Y (övre gräns) innehåller det faktiska värdet av populationsparametern.
Ovanstående uttalande är den vanligaste missuppfattningen om konfidensintervallet. När det statistiska intervallet har beräknats kan det bara innehålla populationsparametern eller inte.
Områdena kan dock variera mellan proverna, medan den sanna populationsparametern är densamma oavsett provet.
Därför kan sannolikhetsuttalandet om konfidensintervallet endast göras i det fall konfidensintervallen beräknas om för antalet prover.
Stegen för att beräkna konfidensintervallet
Området beräknas enligt följande steg:
- Samla in exempeldata: Nej;
- Beräkna provets medelvärde x̅;
- Bestäm om en populationsstandardavvikelse (σ) är känd eller okänd;
- Om en befolkningsstandardavvikelse är känd kan en punkt användas. z för motsvarande konfidensnivå;
- Om en befolkningsstandardavvikelse är okänd kan vi använda en statistik t för motsvarande konfidensnivå;
- Således finns de nedre och övre gränserna för konfidensintervallet med följande formler:
De) Standardavvikelse för en känd befolkning:
Formel för beräkning av standardavvikelsen för en känd befolkning.
B) Standardavvikelse för okänd befolkning:
Formel för beräkning av standardavvikelsen för en okänd befolkning.
Praktiskt exempel på ett konfidensintervall
En klinisk studie utvärderade sambandet mellan förekomst av astma och risken för att utveckla obstruktiv sömnapné hos vuxna.
Vissa vuxna rekryterades slumpmässigt från en lista över statliga tjänstemän som ska följas under fyra år.
Deltagare med astma, jämfört med dem utan, hade en högre risk att utveckla apné inom fyra år.
När man utför kliniska prövningar som detta exempel rekryterar man vanligtvis en delmängd av befolkningen av intresse för att öka studiens effektivitet (mindre kostnad och mindre tid).
Denna undergrupp av individer, den studerade befolkningen, består av de som uppfyller inklusionskriterierna och går med på att delta i studien, som visas i bilden nedan.
Förklarande diagram över befolkningen som studerats i exemplet.
Därefter avslutas studien och en effektstorlek beräknas (till exempel: en genomsnittlig skillnad eller en relativ risk) för att besvara undersökningsfrågan.
Denna process, kallad slutledning, innebär att man använder data som samlats in från studiepopulationen för att uppskatta den faktiska effektstorleken i den intressanta befolkningen, dvs. källpopulationen.
I det givna exemplet rekryterade forskarna ett slumpmässigt urval av statsanställda (källpopulation) som var berättigade och enades om att delta i studien (studiepopulationen) och rapporterade att astma ökar risken för att utveckla apné i befolkningen studerade.
För att ta hänsyn till ett stickprovsfel på grund av att bara rekrytera en delmängd av den intressanta befolkningen beräknade de också a 95% konfidensintervall (runt uppskattningen) av 1,06 - 1,82, vilket indikerar en sannolikhet för 95% att den verkliga relativa risken i ursprungspopulationen skulle vara mellan 1,06 och 1,82.
Förtroendeintervall för genomsnittet
När du har information om standardpopulationens avvikelse kan du beräkna ett konfidensintervall för medelvärdet eller medelvärdet för den populationen.
När en statistisk egenskap som mäts (som inkomst, IQ, pris, höjd, kvantitet eller vikt) är numerisk, beräknas i de flesta fall medelvärdet för befolkningen hittas.
Således försöker vi hitta befolkningens medelvärde (μ) med hjälp av ett provmedelvärde (x̅), med en felmarginal. Resultatet av denna beräkning kallas konfidensintervall för befolkningens medelvärde.
När populationsstandardavvikelsen är känd är formeln för ett konfidensintervall (CI) för ett populationsmedelvärde:
Var:
- x̅ är provmedlet;
- σ är befolkningsstandardavvikelsen;
- Nejär provstorleken;
- Ζ* representerar det lämpliga värdet av standardnormalfördelningen för din önskade konfidensnivå.
Nedan följer värdena för de olika konfidensnivåerna (Ζ*):
Tillitsnivå | Z-värde * - |
---|---|
80% | 1.28 |
90% | 1645 (konventionell) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
Tabellen ovan visar z * -värden för de angivna konfidensnivåerna. Observera att dessa värden hämtas från standardnormalfördelningen (Z-).
Området mellan varje z * -värde och det negativa av det värdet är procentförtroendet (ungefärlig). Till exempel är området mellan z * = 1,28 och z = -1,28 ungefär 0,80. Därför kan denna tabell också utvidgas till andra förtroendeprocent. Tabellen visar endast de mest använda förtroendeprocenten.
Se även innebörden av Hypotes.