Betydning af tillidsinterval (hvad det er, koncept og definition)

Det er et skøn over et interval anvendt i statistikker, som indeholder en populationsparameter. Denne ukendte populationsparameter findes gennem en prøve model beregnet ud fra indsamlede data.

Eksempel: gennemsnittet af en samlet prøve x̅ falder måske sammen med den sande populationsgennemsnit μ. Til dette er det muligt at overveje en række stikprøveværdier, hvor dette populationsgennemsnit kan være indeholdt. Jo længere dette interval er, desto mere sandsynligt er det at gøre det.

Konfidensintervallet udtrykkes i procent, kaldet konfidensniveau, hvor 90%, 95% og 99% er den mest egnede. På billedet nedenfor har vi for eksempel et 90% konfidensinterval mellem dets øvre og nedre grænse (o og -a).

tillidsintervalEksempel 90% tillidsinterval mellem dine øvre (a) og nedre (-a) grænser.

Tillidsintervallet er et af de vigtigste begreber i statistisk hypotesetest, da det bruges som et mål for usikkerhed. Udtrykket blev introduceret af den polske matematiker og statistiker Jerzy Neyman i 1937.

Hvad er relevansen af ​​et tillidsinterval?

Konfidensintervallet er vigtigt for at indikere usikkerhedsmargenen (eller upræcisionen) foran en foretaget beregning. Denne beregning bruger undersøgelsesprøven til at estimere den faktiske størrelse af resultatet i kildepopulationen.

Beregning af et konfidensinterval er en strategi, der tager fejlprøvetagning i betragtning. Størrelsen på dit undersøgelsesresultat og dets konfidensinterval karakteriserer de antagne værdier for den oprindelige population.

Jo snævrere konfidensintervallet er, jo større er sandsynligheden for, at befolkningsprocenten er undersøgelse repræsenterer det reelle antal oprindelsespopulation, hvilket giver større sikkerhed med hensyn til resultatet af genstanden for undersøgelse.

Hvordan fortolkes et tillidsinterval?

Korrekt fortolkning af konfidensintervallet er sandsynligvis det mest udfordrende aspekt af dette statistiske koncept. Et eksempel på den mest almindelige fortolkning af konceptet er som følger:

Der er en 95% sandsynlighed at den sande værdi af populationsparameteren (for eksempel middelværdi) i fremtiden falder inden for området x (nedre grænse) og Y (Øverste grænse).

Således fortolkes konfidensintervallet som følger: det er 95% overbevist om, at området mellem X (nedre grænse) og Y (øvre grænse) indeholder den sande værdi af populationsparameteren.

Ville være helt forkert angive, at der er 95% sandsynlighed for, at intervallet mellem X (nedre grænse) og Y (øvre grænse) indeholder den aktuelle værdi af populationsparameteren.

Ovenstående udsagn er den mest almindelige misforståelse om konfidensintervallet. Når det statistiske interval er beregnet, kan det kun indeholde populationsparameteren eller ej.

Imidlertid kan intervallerne variere mellem prøverne, mens den sande populationsparameter er den samme uanset prøven.

Derfor kan sandsynlighedserklæringen vedrørende konfidensintervallet kun foretages i det tilfælde, hvor konfidensintervallerne genberegnes for antallet af prøver.

Trinene til beregning af tillidsintervallet

Området beregnes ved hjælp af følgende trin:

  • Saml eksempeldata: ingen;
  • Beregn prøve gennemsnit x;
  • Bestem, om en populationsstandardafvigelse (σ) er kendt eller ukendt;
  • Hvis en populationsstandardafvigelse er kendt, kan et punkt bruges. z for det tilsvarende konfidensniveau
  • Hvis en populationsstandardafvigelse er ukendt, kan vi bruge en statistik t for det tilsvarende konfidensniveau
  • Således findes de nedre og øvre grænser for konfidensintervallet ved hjælp af følgende formler:

Det) Standardafvigelse for en kendt population:

icokok
Formel til beregning af standardafvigelsen for en kendt population.

B) Standardafvigelse for en ukendt population:

ICk
Formel til beregning af standardafvigelsen for en ukendt population.

Praktisk eksempel på et konfidensinterval

En klinisk undersøgelse evaluerede sammenhængen mellem tilstedeværelsen af ​​astma og risikoen for at udvikle obstruktiv søvnapnø hos voksne.

Nogle voksne blev tilfældigt rekrutteret fra en liste over statstjenestemænd, der skulle følges over fire år.

Deltagere med astma, sammenlignet med dem uden, havde en højere risiko for at udvikle apnø inden for fire år.

Når man udfører kliniske forsøg som dette eksempel, rekrutterer man typisk en delmængde af befolkningen af ​​interesse for at øge effektiviteten af ​​undersøgelsen (mindre omkostninger og mindre tid).

Denne undergruppe af individer, den undersøgte population, består af dem, der opfylder inklusionskriterierne og accepterer at deltage i undersøgelsen, som vist i billedet nedenfor.

ICForklarende graf over befolkningen undersøgt i eksemplet.

Derefter er undersøgelsen afsluttet, og en effektstørrelse beregnes (for eksempel: en gennemsnitlig forskel eller en relativ risiko) for at besvare spørgeskemaundersøgelsen.

Denne proces kaldes slutninginvolverer brug af data indsamlet fra undersøgelsespopulationen til at estimere den faktiske effektstørrelse i den interessepopulation, dvs. kildepopulationen.

I det givne eksempel rekrutterede forskerne en tilfældig stikprøve af statsansatte (kildepopulation), der var støtteberettigede og blev enige om at deltage i undersøgelsen (undersøgelsespopulation) og rapporterede, at astma øger risikoen for at udvikle apnø i befolkningen studeret.

For at tage højde for en stikprøvefejl på grund af kun at rekruttere en delmængde af den interessepopulation, beregnede de også en 95% konfidensinterval (omkring estimatet) på 1,06 - 1,82, hvilket indikerer en sandsynlighed for 95%, at den sande relative risiko i oprindelsespopulationen ville være mellem 1,06 og 1,82.

Tillidsinterval for gennemsnit

Når du har oplysninger om standardpopulationens afvigelse, kan du beregne et konfidensinterval for gennemsnittet eller gennemsnittet af denne population.

Når en statistisk egenskab, der måles (som indkomst, IQ, pris, højde, mængde eller vægt), er numerisk, estimeres det i de fleste tilfælde, at gennemsnitsværdien for befolkningen findes.

Således søger vi at finde befolkningens middelværdi (μ) ved hjælp af et prøve gennemsnit (x) med en fejlmargen. Resultatet af denne beregning kaldes konfidensinterval for befolkningens gennemsnit.

Når populationsstandardafvigelsen er kendt, er formlen for et konfidensinterval (CI) for et populationsgennemsnit:

formel for konfidensinterval

Hvor:

  • x er prøven gennemsnit
  • σ er populationens standardafvigelse
  • ingener prøvestørrelsen
  • Ζ* repræsenterer den passende værdi af standardnormalfordelingen til dit ønskede konfidensniveau.

Nedenfor er værdierne for de forskellige konfidensniveauer (Ζ*):

Tillidsniveau Z-værdi * -
80% 1.28
90% 1.645 (konventionel)
95% 1.96
98% 2.33
99% 2.58

Ovenstående tabel viser z * -værdier for de givne konfidensniveauer. Bemærk, at disse værdier er taget fra standardnormalfordelingen (Z-).

Området mellem hver z * -værdi og det negative af denne værdi er den procentvise tillid (ca.). For eksempel er området mellem z * = 1,28 og z = -1,28 ca. 0,80. Derfor kan denne tabel også udvides til andre tillidsprocentdele. Tabellen viser kun de mest anvendte tillidsprocenter.

Se også betydningen af Hypotese.

Betydning af Igloo (hvad det er, koncept og definition)

Betydning af Igloo (hvad det er, koncept og definition)

iglo er en bygning lavet af sne og is, brugt som ly for kulden ekstrem i polarområder. Igloos bru...

read more

Betydning af biostatistik (hvad det er, koncept og definition)

Biostatistik er anvendt undersøgelse af statistik inden for biologi og medicin.Denne undersøgelse...

read more

Betydning af Ratimbum (Hvad det er, koncept og definition)

Ratimbum eller Rá-Tim-Bum var en børneprogrammed stor succes, produceret af TV Cultura, mellem 19...

read more