Jde o odhad intervalu použitého ve statistice, který obsahuje parametr populace. Tento neznámý parametr populace je nalezen prostřednictvím a vzorový model vypočítaný ze shromážděných údajů.
Příklad: průměr odebraného vzorku x̅ se může nebo nemusí shodovat se skutečným průměrem populace μ. K tomu je možné uvažovat o rozsahu výběrových prostředků, kde lze tento průměr populace obsáhnout. Čím delší je tento interval, tím je pravděpodobnější.
Interval spolehlivosti je vyjádřen v procentech nazývaných úroveň spolehlivosti, přičemž nejvhodnější je 90%, 95% a 99%. Například na obrázku níže máme 90% interval spolehlivosti mezi horní a dolní mezí (o a -a).
Příklad 90% interval spolehlivosti mezi horními (a) a dolními (-a) limity.
Interval spolehlivosti je jedním z nejdůležitějších konceptů při testování statistických hypotéz, protože se používá jako měřítko nejistoty. Termín zavedl polský matematik a statistik Jerzy Neyman v roce 1937.
Jaký význam má interval spolehlivosti?
Interval spolehlivosti je důležitý pro označení meze nejistoty (nebo nepřesnosti) před provedeným výpočtem. Tento výpočet využívá studijní vzorek k odhadu skutečné velikosti výsledku ve zdrojové populaci.
Výpočet intervalu spolehlivosti je strategie, která zohledňuje vzorkování chyb. Velikost výsledku studie a její interval spolehlivosti charakterizují předpokládané hodnoty pro původní populaci.
Čím užší je interval spolehlivosti, tím větší je pravděpodobnost procenta populace Studie představují reálný počet populace původu, což poskytuje větší jistotu ohledně výsledku předmětu studie.
Jak interpretovat interval spolehlivosti?
Správná interpretace intervalu spolehlivosti je pravděpodobně nejnáročnějším aspektem této statistické koncepce. Příklad nejběžnější interpretace konceptu je následující:
Jeden je 95% pravděpodobnost že v budoucnu skutečná hodnota parametru populace (například průměr) spadá do rozsahu X (dolní mez) a Y (horní limit).
Interval spolehlivosti je tedy interpretován následovně: je 95% přesvědčeno, že rozsah mezi X (dolní limit) a Y (horní limit) obsahuje skutečnou hodnotu parametru populace.
Bylo by naprosto nesprávné uveďte, že: je 95% pravděpodobnost, že interval mezi X (dolní limit) a Y (horní limit) obsahuje skutečnou hodnotu parametru populace.
Výše uvedené tvrzení je nejčastější mylnou představou o intervalu spolehlivosti. Po výpočtu statistického rozsahu může obsahovat pouze parametr populace nebo ne.
Rozsahy se však mohou mezi vzorky lišit, zatímco parametr skutečné populace je stejný bez ohledu na vzorek.
Prohlášení o pravděpodobnosti týkající se intervalu spolehlivosti lze tedy učinit pouze v případě, že jsou intervaly spolehlivosti přepočítány na počet vzorků.
Kroky výpočtu intervalu spolehlivosti
Rozsah se vypočítá pomocí následujících kroků:
- Shromážděte ukázková data: Ne;
- Vypočítejte průměr vzorku X;
- Určete, zda je směrodatná odchylka populace (σ) je znám nebo neznámý;
- Pokud je známa standardní odchylka populace, lze použít bod. z pro odpovídající úroveň spolehlivosti;
- Pokud standardní odchylka populace není známa, můžeme použít statistiku t pro odpovídající úroveň spolehlivosti;
- Dolní a horní mez intervalu spolehlivosti se tedy nacházejí pomocí následujících vzorců:
The) Směrodatná odchylka známé populace:
Vzorec pro výpočet standardní odchylky známé populace.
B) Směrodatná odchylka neznámé populace:
Vzorec pro výpočet standardní odchylky neznámé populace.
Praktický příklad intervalu spolehlivosti
Klinická studie hodnotila souvislost mezi přítomností astmatu a rizikem vzniku obstrukční spánkové apnoe u dospělých.
Někteří dospělí byli náhodně vybráni ze seznamu státních úředníků, kteří měli být sledováni po dobu čtyř let.
Účastníci s astmatem měli ve srovnání s těmi, kteří neměli, vyšší riziko rozvoje apnoe během čtyř let.
Při provádění klinických studií, jako je tento příklad, se obvykle najímá podmnožina zájmové populace, aby se zvýšila účinnost studie (nižší náklady a méně času).
Tuto podskupinu jednotlivců, studovanou populaci, tvoří ti, kteří splňují kritéria pro zařazení a souhlasí s účastí ve studii, jak je znázorněno na obrázku níže.
Vysvětlující graf populace studované v příkladu.
Poté je studie dokončena a je vypočítána velikost účinku (například: průměrný rozdíl nebo jeden relativní risk) odpovědět na dotazník.
Tento proces se nazývá odvození, zahrnuje použití dat shromážděných od studované populace k odhadu skutečné velikosti efektu v populaci zájmu, tj. zdrojové populaci.
V uvedeném příkladu vědci přijali náhodný vzorek státních zaměstnanců (zdrojová populace), kteří byli způsobilí a souhlasil s účastí ve studii (studovaná populace) a uvedl, že astma zvyšuje riziko rozvoje apnoe v populaci studoval.
Aby zohlednili chybu ve výběru kvůli náboru pouze podmnožiny zájmové populace, vypočítali také a 95% interval spolehlivosti (kolem odhadu) 1,06 - 1,82, což naznačuje pravděpodobnost 95%, že skutečné relativní riziko v populaci původu by bylo mezi 1,06 a 1,82.
Interval spolehlivosti pro průměr
Když máte informace o směrodatné odchylce populace, můžete vypočítat interval spolehlivosti pro průměr nebo průměr této populace.
Když je statistická charakteristika, která se měří (jako je příjem, IQ, cena, výška, množství nebo hmotnost), číselná, ve většině případů se odhaduje, že bude nalezena střední hodnota populace.
Snažíme se tedy najít průměrnou populaci (μ) s použitím výběrového průměru (X), s chybou chyby. Výsledek tohoto výpočtu se nazývá interval spolehlivosti pro průměrnou populaci.
Pokud je známa směrodatná odchylka populace, vzorec pro interval spolehlivosti (CI) pro průměr populace je:

Kde:
- X je průměr vzorku;
- σ je směrodatná odchylka populace;
- Neje velikost vzorku;
- Ζ* představuje příslušnou hodnotu standardního normálního rozdělení pro požadovanou úroveň spolehlivosti.
Níže jsou uvedeny hodnoty pro různé úrovně spolehlivosti (Ζ*):
Úroveň důvěryhodnosti | Hodnota Z * - |
---|---|
80% | 1.28 |
90% | 1645 (konvenční) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
Tabulka výše zobrazuje hodnoty z * pro dané úrovně spolehlivosti. Tyto hodnoty jsou převzaty ze standardního normálního rozdělení (Z-).
Oblast mezi každou hodnotou z * a záporem této hodnoty je procentuální spolehlivost (přibližná). Například oblast mezi z * = 1,28 az = -1,28 je přibližně 0,80. Proto lze tuto tabulku rozšířit i na další procenta spolehlivosti. Tabulka zobrazuje pouze nejpoužívanější procenta spolehlivosti.
Viz také význam Hypotéza.