Това е оценка на интервал, използван в статистиката, който съдържа параметър за популация. Този неизвестен параметър на популацията се намира чрез a примерен модел, изчислен от събрани данни.
Пример: средната стойност на събраната проба x̅ може или не може да съвпада с истинската средна популация μ. За това е възможно да се разгледа набор от примерни средства, където това средно население може да се съдържа. Колкото по-дълъг е този интервал, толкова по-вероятно е да го направи.
Интервалът на доверие се изразява като процент, наречен ниво на доверие, като 90%, 95% и 99% са най-подходящи. На изображението по-долу например имаме 90% доверителен интервал между горната и долната граница (o и -a).
Пример 90% доверителен интервал между вашите горни (a) и долни (-a) граници.
Интервалът на доверие е една от най-важните концепции при тестване на статистически хипотези, тъй като се използва като мярка за несигурност. Терминът е въведен от полския математик и статистик Йежи Нейман през 1937г.
Какво значение има интервалът на доверие?
Доверителният интервал е важен, за да се посочи границата на несигурност (или неточност) пред направеното изчисление. Това изчисление използва извадката от изследването, за да оцени действителния размер на резултата в популацията на източника.
Изчисляването на доверителен интервал е стратегия, която взема предвид вземането на проби за грешки. Размерът на резултата от вашето проучване и неговият доверителен интервал характеризират приетите стойности за първоначалната популация.
Колкото по-тесен е интервалът на доверие, толкова по-голяма е вероятността за процента на населението от Проучването представлява реалния брой на популацията на произход, като дава по-голяма сигурност по отношение на резултата от обекта на проучване.
Как да тълкуваме доверителен интервал?
Правилната интерпретация на доверителния интервал е може би най-предизвикателният аспект на тази статистическа концепция. Пример за най-често срещаното тълкуване на концепцията е както следва:
Има един 95% вероятност че в бъдеще истинската стойност на параметъра на популацията (например средна стойност) попада в диапазона х (долна граница) и Y. (горен лимит).
По този начин интервалът на доверие се интерпретира по следния начин: 95% е уверен, че диапазонът между X (долна граница) и Y (горна граница) съдържа истинската стойност на параметъра на популацията.
Би било напълно неправилно заявете, че: има 95% вероятност интервалът между X (долна граница) и Y (горна граница) да съдържа действителната стойност на параметъра на популацията.
Горното твърдение е най-често срещаното погрешно схващане за доверителния интервал. След като се изчисли статистическият диапазон, той може да съдържа само параметъра на популацията или не.
Въпреки това диапазоните могат да варират между пробите, докато истинският параметър на популацията е един и същ, независимо от пробата.
Следователно, изявлението за вероятност относно доверителния интервал може да бъде направено само в случаите, когато доверителните интервали са преизчислени за броя на пробите.
Стъпките за изчисляване на доверителния интервал
Обхватът се изчислява, като се използват следните стъпки:
- Съберете примерни данни: не;
- Изчислете средната стойност на пробата х;
- Определете дали стандартното отклонение на популацията (σ) е известно или неизвестно;
- Ако стандартното отклонение на популацията е известно, може да се използва точка. z за съответното ниво на доверие;
- Ако стандартното отклонение на популацията е неизвестно, можем да използваме статистика T за съответното ниво на доверие;
- По този начин долната и горната граница на доверителния интервал се намират, като се използват следните формули:
The) Стандартно отклонение на известна популация:
Формула за изчисляване на стандартното отклонение на известна популация.
Б) Стандартно отклонение на неизвестна популация:
Формула за изчисляване на стандартното отклонение на неизвестна популация.
Практически пример за доверителен интервал
Клинично проучване оценява връзката между наличието на астма и риска от развитие на обструктивна сънна апнея при възрастни.
Някои възрастни бяха наети на случаен принцип от списък на държавните служители, които да бъдат проследявани в продължение на четири години.
Участниците с астма, в сравнение с тези без, са имали по-висок риск от развитие на апнея в рамките на четири години.
Когато се провеждат клинични изпитвания като този пример, обикновено се набира подгрупа от интересуващата популация, за да се увеличи ефективността на изследването (по-малко разходи и по-малко време).
Тази подгрупа от индивиди, изследваната популация, се състои от тези, които отговарят на критериите за включване и са съгласни да участват в изследването, както е показано на изображението по-долу.
Обяснителна графика на популацията, изследвана в примера.
След това проучването завършва и се изчислява размерът на ефекта (например: средна разлика или един относителен риск), за да отговорите на въпроса от анкетата.
Този процес, т.нар умозаключение, включва използването на данни, събрани от изследваната популация, за да се оцени действителният размер на ефекта в популацията, която представлява интерес, т.е. популацията на източника.
В дадения пример изследователите набраха произволна извадка от държавни служители (популация), които отговаряха на условията и се съгласи да участва в проучването (изследвана популация) и съобщи, че астмата увеличава риска от развитие на апнея сред населението проучен.
За да се отчете грешка в извадката поради набиране само на подмножество от популацията от интерес, те също изчисляват a 95% доверителен интервал (около прогнозата) от 1,06 - 1,82, което показва вероятност от 95%, че истинският относителен риск в популацията на произхода ще бъде между 1,06 и 1,82.
Доверителен интервал за средно
Когато имате информация за стандартното отклонение на популация, можете да изчислите доверителен интервал за средната или средната стойност на тази популация.
Когато измерваната статистическа характеристика (като доход, коефициент на интелигентност, цена, височина, количество или тегло) е числена, в повечето случаи се изчислява средната стойност за популацията.
По този начин ние се стремим да намерим средното население (μ) използвайки примерна средна стойност (х), с допустима грешка. Резултатът от това изчисление се нарича доверителен интервал за средното население.
Когато стандартното отклонение на популацията е известно, формулата за доверителен интервал (CI) за средно население е:
Където:
- х е средната стойност на пробата;
- σ е стандартното отклонение на популацията;
- нее размерът на пробата;
- Ζ* представлява подходящата стойност на стандартното нормално разпределение за желаното ниво на доверие.
По-долу са посочени стойностите за различните нива на доверие (Ζ*):
Ниво на доверие | Z стойност * - |
---|---|
80% | 1.28 |
90% | 1,645 (конвенционално) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
Таблицата по-горе показва z * стойности за дадените нива на доверие. Имайте предвид, че тези стойности са взети от стандартното нормално разпределение (Z-).
Площта между всяка z * стойност и отрицателната на тази стойност е процентната увереност (приблизителна). Например площта между z * = 1,28 и z = -1,28 е приблизително 0,80. Следователно тази таблица може да бъде разширена и до други проценти на доверие. Таблицата показва само най-използваните проценти на доверие.
Вижте също значението на Хипотеза.