Este o estimare a unui interval utilizat în statistici, care conține un parametru al populației. Acest parametru de populație necunoscut se găsește printr-un model de eșantion calculat din datele colectate.
Exemplu: media unui eșantion colectat x̅ poate coincide sau nu cu media reală a populației μ. Pentru aceasta, este posibil să se ia în considerare o gamă de mijloace de eșantionare în care poate fi conținută această medie a populației. Cu cât acest interval este mai lung, cu atât este mai probabil să o facă.
Intervalul de încredere este exprimat ca procent, numit nivelul de încredere, 90%, 95% și 99% fiind cel mai potrivit. În imaginea de mai jos, de exemplu, avem un interval de încredere de 90% între limitele sale superioare și inferioare (o și -a).
Exemplu 90% Interval de încredere între limitele superioare (a) și inferioare (-a).
Intervalul de încredere este unul dintre cele mai importante concepte în testarea statistică a ipotezelor, deoarece este utilizat ca măsură a incertitudinii. Termenul a fost introdus de matematicianul și statisticianul polonez Jerzy Neyman în 1937.
Care este relevanța unui interval de încredere?
Intervalul de încredere este important pentru a indica marja de incertitudine (sau imprecizie) în fața unui calcul făcut. Acest calcul utilizează eșantionul studiat pentru a estima dimensiunea reală a rezultatului în populația sursă.
Calculul unui interval de încredere este o strategie care ține cont de eșantionarea erorilor. Mărimea rezultatului studiului dvs. și intervalul său de încredere caracterizează valorile asumate pentru populația inițială.
Cu cât intervalul de încredere este mai restrâns, cu atât este mai mare probabilitatea procentului populației de studiu reprezintă numărul real al populației de origine, oferind o mai mare certitudine cu privire la rezultatul obiectului studiu.
Cum se interpretează un interval de încredere?
Interpretarea corectă a intervalului de încredere este probabil cel mai provocator aspect al acestui concept statistic. Un exemplu al celei mai comune interpretări a conceptului este următorul:
Există unul 95% probabilitate că, în viitor, adevărata valoare a parametrului populației (de exemplu, medie) se încadrează în interval X (limita inferioară) și Da (Limita superioară).
Astfel, intervalul de încredere este interpretat după cum urmează: este 95% sigur că intervalul dintre X (limita inferioară) și Y (limita superioară) conține adevărata valoare a parametrului populației.
Va fi total incorect afirmați că: există o probabilitate de 95% ca intervalul dintre X (limita inferioară) și Y (limita superioară) să conțină valoarea reală a parametrului populației.
Afirmația de mai sus este cea mai comună concepție greșită despre intervalul de încredere. După calcularea intervalului statistic, acesta poate conține doar parametrul populației sau nu.
Cu toate acestea, intervalele pot varia între eșantioane, în timp ce parametrul adevărat al populației este același indiferent de eșantion.
Prin urmare, declarația de probabilitate referitoare la intervalul de încredere poate fi făcută numai în cazul în care intervalele de încredere sunt recalculate pentru numărul de eșantioane.
Pașii de calcul al intervalului de încredere
Intervalul este calculat utilizând următorii pași:
- Adunați eșantion de date: Nu;
- Calculați media eșantionului X;
- Determinați dacă o abatere standard a populației (σ) este cunoscut sau necunoscut;
- Dacă se cunoaște o abatere standard a populației, se poate utiliza un punct. z pentru nivelul de încredere corespunzător;
- Dacă nu se cunoaște o abatere standard a populației, putem folosi o statistică t pentru nivelul de încredere corespunzător;
- Astfel, limitele inferioare și superioare ale intervalului de încredere se găsesc folosind următoarele formule:
) Abaterea standard a unei populații cunoscute:
Formula pentru calcularea deviației standard a unei populații cunoscute.
B) Abaterea standard a unei populații necunoscute:
Formula pentru calcularea deviației standard a unei populații necunoscute.
Exemplu practic de interval de încredere
Un studiu clinic a evaluat asocierea dintre prezența astmului și riscul de a dezvolta apnee obstructivă în somn la adulți.
Unii adulți au fost recrutați aleatoriu dintr-o listă a funcționarilor publici de stat care urmează să fie urmăriți pe parcursul a patru ani.
Participanții cu astm, comparativ cu cei fără, au avut un risc mai mare de a dezvolta apnee în termen de patru ani.
Când se efectuează studii clinice precum acest exemplu, se recrutează de obicei un subgrup al populației de interes pentru a crește eficiența studiului (costuri mai mici și timp mai mic).
Acest subgrup de indivizi, populația studiată, este alcătuit din cei care îndeplinesc criteriile de includere și sunt de acord să participe la studiu, așa cum se arată în imaginea de mai jos.
Grafic explicativ al populației studiate în exemplu.
Apoi, studiul este finalizat și se calculează o dimensiune a efectului (de exemplu: o diferență medie sau unul risc relativ) pentru a răspunde la întrebarea sondajului.
Acest proces, numit inferență, implică utilizarea datelor colectate de la populația studiată pentru a estima dimensiunea efectului efectiv în populația de interes, adică populația sursă.
În exemplul dat, cercetătorii au recrutat un eșantion aleatoriu de angajați ai statului (populația sursă) care erau eligibili și au fost de acord să participe la studiu (populația din studiu) și a raportat că astmul crește riscul de apnee în populație studiat.
Pentru a ține cont de o eroare de eșantionare datorată recrutării doar a unui subset din populația de interes, aceștia au calculat și un 95% interval de încredere (în jurul estimării) de 1,06 - 1,82, indicând o probabilitate de 95% că adevăratul risc relativ în populația de origine ar fi între 1,06 și 1,82.
Interval de încredere pentru medie
Când aveți informații despre abaterea standard a unei populații, puteți calcula un interval de încredere pentru media sau media acelei populații.
Când se măsoară o caracteristică statistică (cum ar fi venitul, IQ-ul, prețul, înălțimea, cantitatea sau greutatea) este numerică, în majoritatea cazurilor se estimează că se găsește valoarea medie pentru populație.
Astfel, căutăm să găsim media populației (μ) folosind un eșantion mediu (X), cu o marjă de eroare. Rezultatul acestui calcul este numit intervalul de încredere pentru media populației.
Când se cunoaște abaterea standard a populației, formula pentru un interval de încredere (CI) pentru o medie a populației este:
Unde:
- X este media eșantionului;
- σ este deviația standard a populației;
- Nueste dimensiunea eșantionului;
- Ζ* reprezintă valoarea adecvată a distribuției normale standard pentru nivelul de încredere dorit.
Mai jos sunt valorile pentru diferitele niveluri de încredere (Ζ*):
Nivel de încredere | Valoare Z * - |
---|---|
80% | 1.28 |
90% | 1.645 (convențional) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
Tabelul de mai sus prezintă valorile z * pentru nivelurile de încredere date. Rețineți că aceste valori sunt preluate din distribuția normală standard (Z-).
Zona dintre fiecare valoare z * și negativul acestei valori este procentul de încredere (aproximativ). De exemplu, aria dintre z * = 1,28 și z = -1,28 este de aproximativ 0,80. Prin urmare, acest tabel poate fi extins și la alte procente de încredere. Tabelul arată doar cele mai utilizate procente de încredere.
Vezi și semnificația Ipoteză.