Het is een schatting van een interval dat in statistieken wordt gebruikt en dat een populatieparameter bevat. Deze onbekende populatieparameter wordt gevonden via a voorbeeldmodel berekend op basis van verzamelde gegevens.
Voorbeeld: het gemiddelde van een verzamelde steekproef x̅ kan al dan niet samenvallen met het werkelijke populatiegemiddelde μ. Hiervoor is het mogelijk om een reeks steekproefgemiddelden te overwegen waar dit populatiegemiddelde kan worden opgenomen. Hoe langer dit interval, hoe groter de kans dat dit gebeurt.
Het betrouwbaarheidsinterval wordt uitgedrukt als een percentage, het betrouwbaarheidsniveau genoemd, waarbij 90%, 95% en 99% het meest geschikt zijn. In de onderstaande afbeelding hebben we bijvoorbeeld een betrouwbaarheidsinterval van 90% tussen de boven- en ondergrens (o en -a).
Voorbeeld 90% betrouwbaarheidsinterval tussen uw bovenste (a) en onderste (-a) limiet.
Het betrouwbaarheidsinterval is een van de belangrijkste concepten bij het toetsen van statistische hypothesen, omdat het wordt gebruikt als een maatstaf voor onzekerheid. De term werd geïntroduceerd door de Poolse wiskundige en statisticus
Jerzy Neyman in 1937.Wat is de relevantie van een betrouwbaarheidsinterval?
Het betrouwbaarheidsinterval is belangrijk om de onzekerheidsmarge (of onnauwkeurigheid) vóór een gemaakte berekening aan te geven. Deze berekening gebruikt de onderzoekssteekproef om de werkelijke omvang van het resultaat in de bronpopulatie te schatten.
Het berekenen van een betrouwbaarheidsinterval is een strategie die rekening houdt met foutensteekproeven. De grootte van uw onderzoeksresultaat en het betrouwbaarheidsinterval karakteriseren de veronderstelde waarden voor de oorspronkelijke populatie.
Hoe kleiner het betrouwbaarheidsinterval, hoe groter de kans op het populatiepercentage van studie geeft het werkelijke aantal van de populatie van herkomst weer, wat meer zekerheid geeft over het resultaat van het object van studie.
Hoe interpreteer je een betrouwbaarheidsinterval?
De juiste interpretatie van het betrouwbaarheidsinterval is waarschijnlijk het meest uitdagende aspect van dit statistische concept. Een voorbeeld van de meest voorkomende interpretatie van het concept is als volgt:
Er is er een 95% kans dat in de toekomst de werkelijke waarde van de populatieparameter (bijvoorbeeld gemiddelde) binnen het bereik valt X (ondergrens) en Y (bovenste limiet).
Het betrouwbaarheidsinterval wordt dus als volgt geïnterpreteerd: het is 95% zeker dat het bereik tussen X (ondergrens) en Y (bovengrens) de werkelijke waarde van de populatieparameter bevat.
Zou zijn totaal onjuist stel dat: er 95% kans is dat het interval tussen X (ondergrens) en Y (bovengrens) de werkelijke waarde van de populatieparameter bevat.
De bovenstaande verklaring is de meest voorkomende misvatting over het betrouwbaarheidsinterval. Nadat het statistische bereik is berekend, kan het alleen de populatieparameter bevatten of niet.
Het bereik kan echter variëren tussen steekproeven, terwijl de werkelijke populatieparameter hetzelfde is, ongeacht de steekproef.
Daarom kan de waarschijnlijkheidsverklaring met betrekking tot het betrouwbaarheidsinterval alleen worden gemaakt in het geval dat de betrouwbaarheidsintervallen opnieuw worden berekend voor het aantal steekproeven.
De stappen voor het berekenen van het betrouwbaarheidsinterval
Het bereik wordt berekend aan de hand van de volgende stappen:
- Verzamel voorbeeldgegevens: Nee;
- Bereken het steekproefgemiddelde X;
- Bepaal of een populatiestandaarddeviatie (σ) is bekend of onbekend;
- Als een populatiestandaarddeviatie bekend is, kan een punt worden gebruikt. z voor het bijbehorende betrouwbaarheidsniveau;
- Als een populatiestandaarddeviatie onbekend is, kunnen we een statistiek gebruiken t voor het bijbehorende betrouwbaarheidsniveau;
- De onder- en bovengrenzen van het betrouwbaarheidsinterval worden dus gevonden met behulp van de volgende formules:
De) Standaarddeviatie van een bekende populatie:
Formule voor het berekenen van de standaarddeviatie van een bekende populatie.
B) Standaarddeviatie van een onbekende populatie:
Formule voor het berekenen van de standaarddeviatie van een onbekende populatie.
Praktijkvoorbeeld van een betrouwbaarheidsinterval
Een klinische studie evalueerde het verband tussen de aanwezigheid van astma en het risico op het ontwikkelen van obstructieve slaapapneu bij volwassenen.
Sommige volwassenen werden willekeurig gerekruteerd uit een lijst van staatsambtenaren die gedurende vier jaar moesten worden gevolgd.
Deelnemers met astma hadden in vergelijking met degenen zonder astma een hoger risico om binnen vier jaar apneu te ontwikkelen.
Bij het uitvoeren van klinische onderzoeken zoals dit voorbeeld, rekruteert men doorgaans een subset van de populatie van belang om de efficiëntie van het onderzoek te verhogen (minder kosten en minder tijd).
Deze subgroep van individuen, de bestudeerde populatie, bestaat uit degenen die voldoen aan de inclusiecriteria en akkoord gaan met deelname aan het onderzoek, zoals weergegeven in de onderstaande afbeelding.
Verklarende grafiek van de in het voorbeeld bestudeerde populatie.
Vervolgens wordt het onderzoek afgerond en wordt een effectgrootte berekend (bijvoorbeeld: een gemiddeld verschil of een relatief risico) om de onderzoeksvraag te beantwoorden.
Dit proces, genaamd gevolgtrekking, omvat het gebruik van gegevens die zijn verzameld uit de onderzoekspopulatie om de werkelijke effectgrootte in de populatie van interesse, dwz de bronpopulatie, te schatten.
In het gegeven voorbeeld rekruteerden de onderzoekers een willekeurige steekproef van staatswerknemers (bronpopulatie) die in aanmerking kwamen en stemde toe om deel te nemen aan het onderzoek (onderzoekspopulatie) en meldde dat astma het risico op het ontwikkelen van apneu in de populatie verhoogt bestudeerd.
Om rekening te houden met een steekproeffout als gevolg van het rekruteren van slechts een subset van de populatie van interesse, berekenden ze ook a 95% betrouwbaarheidsinterval (rond de schatting) van 1,06 - 1,82, wat wijst op een waarschijnlijkheid van 95% dat het werkelijke relatieve risico in de populatie van herkomst tussen 1,06 en 1,82 zou liggen.
Betrouwbaarheidsinterval voor gemiddelde
Als je informatie hebt over de standaarddeviatie van een populatie, kun je een betrouwbaarheidsinterval berekenen voor het gemiddelde of gemiddelde van die populatie.
Wanneer een statistisch kenmerk dat wordt gemeten (zoals inkomen, IQ, prijs, lengte, hoeveelheid of gewicht) numeriek is, wordt in de meeste gevallen de gemiddelde waarde voor de populatie geschat.
We zoeken dus het populatiegemiddelde (μ) met behulp van een steekproefgemiddelde (X), met een foutmarge. Het resultaat van deze berekening heet betrouwbaarheidsinterval voor het populatiegemiddelde.
Wanneer de standaarddeviatie van de populatie bekend is, is de formule voor een betrouwbaarheidsinterval (BI) voor een populatiegemiddelde:
Waar:
- X is het steekproefgemiddelde;
- σ is de standaarddeviatie van de populatie;
- Neeis de steekproefomvang;
- Ζ* vertegenwoordigt de juiste waarde van de standaard normale verdeling voor uw gewenste betrouwbaarheidsniveau.
Hieronder staan de waarden voor de verschillende betrouwbaarheidsniveaus (Ζ*):
Vertrouwensniveau | Z-waarde*- |
---|---|
80% | 1.28 |
90% | 1.645 (conventioneel) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
De bovenstaande tabel toont z*-waarden voor de gegeven betrouwbaarheidsniveaus. Merk op dat deze waarden zijn overgenomen van de standaard normale verdeling (Z-).
Het gebied tussen elke z * -waarde en het negatief van die waarde is het procentuele vertrouwen (bij benadering). Het gebied tussen z * = 1,28 en z = -1,28 is bijvoorbeeld ongeveer 0,80. Daarom kan deze tabel ook worden uitgebreid naar andere betrouwbaarheidspercentages. De tabel toont alleen de meest gebruikte betrouwbaarheidspercentages.
Zie ook de betekenis van Hypothese.