Это оценка интервала, используемого в статистике, который содержит параметр совокупности. Этот неизвестный параметр популяции находится с помощью модель образца, рассчитанная на основе собранных данных.
Пример: среднее значение собранной выборки x̅ может совпадать или не совпадать с истинным средним значением генеральной совокупности μ. Для этого можно рассмотреть диапазон выборочных средних, в которых может содержаться это среднее значение генеральной совокупности. Чем дольше этот интервал, тем больше вероятность того, что это произойдет.
Доверительный интервал выражается в процентах, называемых доверительным уровнем, причем наиболее подходящими являются 90%, 95% и 99%. На изображении ниже, например, у нас есть 90% доверительный интервал между его верхним и нижним пределами (о и -а).
Пример 90% доверительного интервала между верхним (а) и нижним (-а) пределами.
Доверительный интервал - одно из наиболее важных понятий при проверке статистических гипотез, поскольку он используется в качестве меры неопределенности. Термин был введен польским математиком и статистиком.
Ежи Нейман в 1937 г.В чем важность доверительного интервала?
Доверительный интервал важен для обозначения предела неопределенности (или неточности) перед выполненным расчетом. В этом расчете используется выборка исследования для оценки фактического размера результата в исходной совокупности.
Вычисление доверительного интервала - это стратегия, которая учитывает выборку ошибок. Размер результата вашего исследования и его доверительный интервал характеризуют предполагаемые значения для исходной популяции.
Чем уже доверительный интервал, тем больше вероятность того, что процент населения исследования представляют собой реальную численность населения происхождения, что дает большую уверенность в результате объекта изучение.
Как интерпретировать доверительный интервал?
Правильная интерпретация доверительного интервала, вероятно, является самым сложным аспектом этой статистической концепции. Пример наиболее распространенного толкования понятия выглядит следующим образом:
Существует один 95% вероятность что в будущем истинное значение параметра совокупности (например, среднего) попадает в диапазон Икс (нижний предел) и Y (верхний предел).
Таким образом, доверительный интервал интерпретируется следующим образом: на 95% уверен, что диапазон между X (нижний предел) и Y (верхний предел) содержит истинное значение параметра совокупности.
Было бы совершенно неверно заявите, что: существует 95% -ная вероятность того, что интервал между X (нижний предел) и Y (верхний предел) содержит фактическое значение параметра совокупности.
Приведенное выше утверждение является наиболее распространенным заблуждением о доверительном интервале. После расчета статистического диапазона он может содержать только параметр генеральной совокупности или нет.
Однако диапазоны могут варьироваться между выборками, в то время как истинный параметр генеральной совокупности одинаков независимо от выборки.
Следовательно, утверждение вероятности относительно доверительного интервала может быть сделано только в том случае, когда доверительные интервалы пересчитываются для количества выборок.
Этапы расчета доверительного интервала
Диапазон рассчитывается с использованием следующих шагов:
- Соберите образцы данных: нет;
- Рассчитайте выборочное среднее Икс;
- Определите, является ли стандартное отклонение генеральной совокупности (σ) известно или неизвестно;
- Если известно стандартное отклонение генеральной совокупности, можно использовать точку. z для соответствующего уровня достоверности;
- Если стандартное отклонение населения неизвестно, мы можем использовать статистику т для соответствующего уровня достоверности;
- Таким образом, нижняя и верхняя границы доверительного интервала находятся по следующим формулам:
) Стандартное отклонение известной совокупности:
Формула для расчета стандартного отклонения известной совокупности.
Б) Стандартное отклонение неизвестной совокупности:
Формула для расчета стандартного отклонения неизвестной совокупности.
Практический пример доверительного интервала
В клиническом исследовании оценивалась связь между наличием астмы и риском развития обструктивного апноэ во сне у взрослых.
Некоторые взрослые были выбраны случайным образом из списка государственных гражданских служащих, за которыми следовало следить в течение четырех лет.
У участников, страдающих астмой, по сравнению с пациентами без астмы, был более высокий риск развития апноэ в течение четырех лет.
При проведении клинических испытаний, подобных этому примеру, обычно набирают подмножество представляющей интерес популяции, чтобы повысить эффективность исследования (меньше затрат и меньше времени).
Эта подгруппа людей, изучаемая популяция, состоит из тех, кто соответствует критериям включения и согласен участвовать в исследовании, как показано на изображении ниже.
Пояснительный график популяции, изученной в примере.
Затем исследование завершается и рассчитывается величина эффекта (например: средняя разница или один относительный риск), чтобы ответить на вопрос анкеты.
Этот процесс, называемый вывод, включает использование данных, собранных из исследуемой популяции, для оценки фактического размера эффекта в интересующей популяции, то есть в исходной популяции.
В приведенном примере исследователи набрали случайную выборку государственных служащих (исходная совокупность), которые имели право и согласились участвовать в исследовании (исследуемая популяция) и сообщили, что астма увеличивает риск развития апноэ в популяции учился.
Чтобы учесть ошибку выборки из-за набора только подмножества интересующей совокупности, они также вычислили 95% доверительный интервал (около оценки) 1,06 - 1,82, что указывает на вероятность 95%, что истинный относительный риск для населения происхождения будет между 1,06 и 1,82..
Доверительный интервал для среднего
Когда у вас есть информация о стандартном отклонении генеральной совокупности, вы можете рассчитать доверительный интервал для среднего или среднего значения этой генеральной совокупности.
Когда измеряемая статистическая характеристика (например, доход, IQ, цена, рост, количество или вес) является числовой, в большинстве случаев вычисляется среднее значение для населения.
Таким образом, мы стремимся найти среднюю численность населения (μ) с использованием выборочного среднего (Икс), с погрешностью. Результат этого расчета называется доверительный интервал для среднего населения.
Когда известно стандартное отклонение совокупности, формула доверительного интервала (ДИ) для среднего значения совокупности имеет следующий вид:
Где:
- Икс - выборочное среднее;
- σ стандартное отклонение генеральной совокупности;
- нет- размер выборки;
- Ζ* представляет соответствующее значение стандартного нормального распределения для желаемого уровня достоверности.
Ниже приведены значения для различных уровней достоверности (Ζ*):
Уровень доверия | Значение Z * - |
---|---|
80% | 1.28 |
90% | 1,645 (условно) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
В таблице выше показаны значения z * для заданных уровней достоверности. Обратите внимание, что эти значения взяты из стандартного нормального распределения (Z-).
Область между каждым значением z * и отрицательным значением этого значения представляет собой процентную достоверность (приблизительную). Например, область между z * = 1,28 и z = -1,28 составляет приблизительно 0,80. Таким образом, эту таблицу также можно расширить до других процентов достоверности. В таблице показаны только наиболее часто используемые проценты достоверности.
См. Также значение Гипотеза.