Es una estimación de un intervalo utilizado en estadísticas, que contiene un parámetro de población. Este parámetro de población desconocido se encuentra a través de un modelo de muestra calculado a partir de los datos recopilados.
Ejemplo: la media de una muestra recogida x̅ puede coincidir o no con la media real de la población μ. Para ello, es posible considerar un rango de medias muestrales donde se puede contener esta media poblacional. Cuanto más largo sea este intervalo, más probable será que lo haga.
El intervalo de confianza se expresa en porcentaje, denominado nivel de confianza, siendo 90%, 95% y 99% los más adecuados. En la imagen de abajo, por ejemplo, tenemos un intervalo de confianza del 90% entre sus límites superior e inferior (o y -a).
Ejemplo Intervalo de confianza del 90% entre sus límites superior (a) e inferior (-a).
El intervalo de confianza es uno de los conceptos más importantes en la prueba de hipótesis estadísticas, ya que se utiliza como medida de incertidumbre. El término fue introducido por el matemático y estadístico polaco Jerzy Neyman en 1937.
¿Cuál es la relevancia de un intervalo de confianza?
El intervalo de confianza es importante para indicar el margen de incertidumbre (o imprecisión) frente a un cálculo realizado. Este cálculo utiliza la muestra del estudio para estimar el tamaño real del resultado en la población de origen.
El cálculo de un intervalo de confianza es una estrategia que tiene en cuenta el muestreo de errores. El tamaño del resultado de su estudio y su intervalo de confianza caracterizan los valores asumidos para la población original.
Cuanto más estrecho sea el intervalo de confianza, mayor será la probabilidad de que el porcentaje de población de estudio representan el número real de la población de origen, dando mayor certeza en cuanto al resultado del objeto de estudio.
¿Cómo interpretar un intervalo de confianza?
La interpretación correcta del intervalo de confianza es probablemente el aspecto más desafiante de este concepto estadístico. Un ejemplo de la interpretación más común del concepto es el siguiente:
Existe una 95% de probabilidad que, en el futuro, el valor real del parámetro de población (por ejemplo, la media) cae dentro del rango X (límite inferior) y Y (Limite superior).
Por tanto, el intervalo de confianza se interpreta de la siguiente manera: tiene un 95% de confianza en que el rango entre X (límite inferior) e Y (límite superior) contiene el valor real del parámetro de población.
Sería totalmente incorrecto establezca que: hay un 95% de probabilidad de que el intervalo entre X (límite inferior) e Y (límite superior) contenga el valor real del parámetro de población.
La afirmación anterior es el error más común sobre el intervalo de confianza. Una vez calculado el rango estadístico, solo puede contener el parámetro de población o no.
Sin embargo, los rangos pueden variar entre muestras, mientras que el parámetro de población real es el mismo independientemente de la muestra.
Por lo tanto, la declaración de probabilidad relativa al intervalo de confianza sólo se puede realizar en el caso de que los intervalos de confianza se vuelvan a calcular para el número de muestras.
Los pasos para calcular el intervalo de confianza
El rango se calcula mediante los siguientes pasos:
- Reúna datos de muestra: No;
- Calcular la media muestral X;
- Determine si una desviación estándar de la población (σ) es conocido o desconocido;
- Si se conoce una desviación estándar de la población, se puede utilizar un punto. z para el nivel de confianza correspondiente;
- Si se desconoce una desviación estándar de la población, podemos usar una estadística t para el nivel de confianza correspondiente;
- Así, los límites inferior y superior del intervalo de confianza se encuentran utilizando las siguientes fórmulas:
La) Desviación estándar de una población conocida:
Fórmula para calcular la desviación estándar de una población conocida.
B) Desviación estándar de una población desconocida:
Fórmula para calcular la desviación estándar de una población desconocida.
Ejemplo práctico de intervalo de confianza
Un estudio clínico evaluó la asociación entre la presencia de asma y el riesgo de desarrollar apnea obstructiva del sueño en adultos.
Algunos adultos fueron reclutados al azar de una lista de funcionarios públicos estatales a los que se les dio seguimiento durante cuatro años.
Los participantes con asma, en comparación con los que no lo tenían, tenían un mayor riesgo de desarrollar apnea en cuatro años.
Al realizar ensayos clínicos como este ejemplo, normalmente se recluta un subconjunto de la población de interés para aumentar la eficiencia del estudio (menos costo y menos tiempo).
Este subgrupo de individuos, la población estudiada, está conformado por aquellos que cumplen con los criterios de inclusión y aceptan participar en el estudio, como se muestra en la imagen a continuación.
Gráfico explicativo de la población estudiada en el ejemplo.
Luego, se completa el estudio y se calcula el tamaño del efecto (por ejemplo: una diferencia media o uno riesgo relativo) para responder a la pregunta de la encuesta.
Este proceso, llamado inferencia, implica el uso de datos recopilados de la población de estudio para estimar el tamaño del efecto real en la población de interés, es decir, la población de origen.
En el ejemplo dado, los investigadores reclutaron una muestra aleatoria de empleados estatales (población de origen) que eran elegibles y aceptó participar en el estudio (población de estudio) e informó que el asma aumenta el riesgo de desarrollar apnea en la población estudió.
Para tener en cuenta un error de muestreo debido a la contratación de sólo un subconjunto de la población de interés, también calcularon un Intervalo de confianza del 95% (alrededor de la estimación) de 1.06 - 1.82, lo que indica una probabilidad de 95% que el verdadero riesgo relativo en la población de origen estaría entre 1.06 y 1.82.
Intervalo de confianza para el promedio
Cuando tiene información sobre la desviación estándar de una población, puede calcular un intervalo de confianza para la media o la media de esa población.
Cuando una característica estadística que se mide (como ingresos, coeficiente intelectual, precio, altura, cantidad o peso) es numérica, en la mayoría de los casos se estima que se encuentra el valor medio de la población.
Por lo tanto, buscamos encontrar la media poblacional (μ) utilizando una media muestral (X), con un margen de error. El resultado de este cálculo se llama intervalo de confianza para la media poblacional.
Cuando se conoce la desviación estándar de la población, la fórmula para un intervalo de confianza (IC) para una media poblacional es:
Dónde:
- X es la media muestral;
- σ es la desviación estándar de la población;
- Noes el tamaño de la muestra;
- Ζ* representa el valor apropiado de la distribución normal estándar para su nivel de confianza deseado.
A continuación se muestran los valores para los distintos niveles de confianza (Ζ*):
Nivel de confianza | Valor Z * - |
---|---|
80% | 1.28 |
90% | 1.645 (convencional) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
La tabla anterior muestra los valores z * para los niveles de confianza dados. Tenga en cuenta que estos valores se toman de la distribución normal estándar (Z-).
El área entre cada valor z * y el negativo de ese valor es el porcentaje de confianza (aproximado). Por ejemplo, el área entre z * = 1,28 yz = -1,28 es aproximadamente 0,80. Por lo tanto, esta tabla también se puede ampliar a otros porcentajes de confianza. La tabla solo muestra los porcentajes de confianza más utilizados.
Véase también el significado de Hipótesis.