Il s'agit d'une estimation d'un intervalle utilisé dans les statistiques, qui contient un paramètre de population. Ce paramètre de population inconnu est trouvé à travers un exemple de modèle calculé à partir des données collectées.
Exemple: la moyenne d'un échantillon collecté x̅ peut coïncider ou non avec la vraie moyenne de la population μ. Pour cela, il est possible de considérer une gamme de moyennes d'échantillons où cette moyenne de population peut être contenue. Plus cet intervalle est long, plus il est probable qu'il le fasse.
L'intervalle de confiance est exprimé en pourcentage, appelé niveau de confiance, 90 %, 95 % et 99 % étant les plus appropriés. Dans l'image ci-dessous, par exemple, nous avons un intervalle de confiance de 90 % entre ses limites supérieure et inférieure (o et -a).
Exemple Intervalle de confiance à 90 % entre vos limites supérieure (a) et inférieure (-a).
L'intervalle de confiance est l'un des concepts les plus importants dans les tests d'hypothèses statistiques, car il est utilisé comme mesure de l'incertitude. Le terme a été introduit par le mathématicien et statisticien polonais
Jerzy Neyman en 1937.Quelle est la pertinence d'un intervalle de confiance ?
L'intervalle de confiance est important pour indiquer la marge d'incertitude (ou d'imprécision) devant un calcul effectué. Ce calcul utilise l'échantillon de l'étude pour estimer la taille réelle du résultat dans la population source.
Le calcul d'un intervalle de confiance est une stratégie qui prend en compte les erreurs d'échantillonnage. La taille de votre résultat d'étude et son intervalle de confiance caractérisent les valeurs supposées pour la population d'origine.
Plus l'intervalle de confiance est étroit, plus la probabilité que le pourcentage de population de étude représentent le nombre réel de la population d'origine, donnant une plus grande certitude quant au résultat de l'objet de étude.
Comment interpréter un intervalle de confiance?
L'interprétation correcte de l'intervalle de confiance est probablement l'aspect le plus difficile de ce concept statistique. Voici un exemple de l'interprétation la plus courante du concept :
Il existe une 95% de probabilité qu'à l'avenir, la vraie valeur du paramètre de population (par exemple, la moyenne) se situe dans la plage X (limite inférieure) et Oui (limite supérieure).
Ainsi, l'intervalle de confiance s'interprète comme suit: il est sûr à 95 % que la plage entre X (limite inférieure) et Y (limite supérieure) contient la vraie valeur du paramètre de population.
Serait totalement incorrect indiquer que: il y a une probabilité de 95 % que l'intervalle entre X (limite inférieure) et Y (limite supérieure) contienne la valeur réelle du paramètre de population.
La déclaration ci-dessus est l'idée fausse la plus courante sur l'intervalle de confiance. Une fois la plage statistique calculée, elle ne peut contenir que le paramètre de population ou non.
Cependant, les plages peuvent varier entre les échantillons, tandis que le véritable paramètre de population est le même quel que soit l'échantillon.
Par conséquent, l'énoncé de probabilité concernant l'intervalle de confiance ne peut être fait que dans le cas où les intervalles de confiance sont recalculés pour le nombre d'échantillons.
Les étapes de calcul de l'intervalle de confiance
La plage est calculée selon les étapes suivantes :
- Recueillir des exemples de données: non;
- Calculer la moyenne de l'échantillon X;
- Déterminer si un écart type de population (σ) est connue ou inconnue ;
- Si un écart type de population est connu, un point peut être utilisé. z pour le niveau de confiance correspondant ;
- Si un écart type de population est inconnu, nous pouvons utiliser une statistique t pour le niveau de confiance correspondant ;
- Ainsi, les bornes inférieure et supérieure de l'intervalle de confiance se trouvent à l'aide des formules suivantes :
Le) Écart-type d'une population connue:
Formule de calcul de l'écart type d'une population connue.
B) Écart-type d'une population inconnue:
Formule de calcul de l'écart type d'une population inconnue.
Exemple pratique d'un intervalle de confiance
Une étude clinique a évalué l'association entre la présence d'asthme et le risque de développer une apnée obstructive du sommeil chez l'adulte.
Certains adultes ont été recrutés au hasard sur une liste de fonctionnaires de l'État à suivre pendant quatre ans.
Les participants souffrant d'asthme, par rapport à ceux qui n'en souffrent pas, présentaient un risque plus élevé de développer une apnée dans les quatre ans.
Lors de la conduite d'essais cliniques comme cet exemple, on recrute généralement un sous-ensemble de la population d'intérêt pour augmenter l'efficacité de l'étude (moins de coût et moins de temps).
Ce sous-groupe d'individus, la population étudiée, est composé de ceux qui répondent aux critères d'inclusion et acceptent de participer à l'étude, comme le montre l'image ci-dessous.
Graphique explicatif de la population étudiée dans l'exemple.
Ensuite, l'étude est terminée et une taille d'effet est calculée (par exemple: une différence moyenne ou une risque relatif) pour répondre à la question du sondage.
Ce processus, appelé inférence, consiste à utiliser des données recueillies auprès de la population étudiée pour estimer la taille réelle de l'effet dans la population d'intérêt, c'est-à-dire la population source.
Dans l'exemple donné, les chercheurs ont recruté un échantillon aléatoire de fonctionnaires (population source) éligibles et a accepté de participer à l'étude (population étudiée) et a signalé que l'asthme augmente le risque de développer une apnée dans la population étudié.
Pour tenir compte d'une erreur d'échantillonnage due au recrutement d'un sous-ensemble de la population d'intérêt, ils ont également calculé un Intervalle de confiance à 95% (autour de l'estimation) de 1,06 - 1,82, indiquant une probabilité de 95% que le vrai risque relatif dans la population d'origine serait compris entre 1,06 et 1,82.
Intervalle de confiance pour la moyenne
Lorsque vous disposez d'informations sur l'écart type d'une population, vous pouvez calculer un intervalle de confiance pour la moyenne ou la moyenne de cette population.
Lorsqu'une caractéristique statistique mesurée (comme le revenu, le QI, le prix, la taille, la quantité ou le poids) est numérique, dans la plupart des cas, la valeur moyenne de la population est estimée être trouvée.
Ainsi, nous cherchons à trouver la moyenne de la population (μ) en utilisant une moyenne d'échantillon (X), avec une marge d'erreur. Le résultat de ce calcul est appelé intervalle de confiance pour la moyenne de la population.
Lorsque l'écart type de la population est connu, la formule d'un intervalle de confiance (IC) pour une moyenne de population est:
Où:
- X est la moyenne de l'échantillon;
- σ est l'écart type de la population;
- nonest la taille de l'échantillon;
- Ζ* représente la valeur appropriée de la distribution normale standard pour le niveau de confiance souhaité.
Vous trouverez ci-dessous les valeurs des différents niveaux de confiance (Ζ*):
Niveau de confiance | Valeur Z*- |
---|---|
80% | 1.28 |
90% | 1 645 (conventionnel) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
Le tableau ci-dessus montre les valeurs z* pour les niveaux de confiance donnés. Notez que ces valeurs sont tirées de la distribution normale standard (Z-).
La zone entre chaque valeur z * et le négatif de cette valeur est le pourcentage de confiance (approximatif). Par exemple, la zone entre z * = 1,28 et z = -1,28 est d'environ 0,80. Par conséquent, ce tableau peut également être étendu à d'autres pourcentages de confiance. Le tableau ne montre que les pourcentages de confiance les plus utilisés.
Voir aussi la signification de Hypothèse.