これは、統計で使用される間隔の推定値であり、母集団パラメーターが含まれています。 この未知の母集団パラメータは、 収集したデータから計算されたサンプルモデル.
例:収集されたサンプルの平均x̅は、真の母平均μと一致する場合と一致しない場合があります。 このために、この母平均を含めることができるサンプル平均の範囲を検討することができます。 この間隔が長いほど、そうなる可能性が高くなります。
信頼区間は、信頼水準と呼ばれるパーセンテージで表され、90%、95%、99%が最適です。 たとえば、下の画像では、上限と下限の間に90%の信頼区間があります(oおよび-a).
例上限(a)と下限(-a)の間の90%信頼区間。
信頼区間は、不確実性の尺度として使用されるため、統計的仮説検定で最も重要な概念の1つです。 この用語は、ポーランドの数学者および統計学者によって導入されました イェジ・ネイマン 1937年。
信頼区間の関連性は何ですか?
信頼区間は、計算の前に不確実性(または不正確さ)のマージンを示すために重要です。 この計算では、調査サンプルを使用して、ソース母集団の結果の実際のサイズを推定します。
信頼区間の計算は、エラーサンプリングを考慮に入れた戦略です。 調査結果のサイズとその信頼区間は、元の母集団の想定値を特徴づけます。
信頼区間が狭いほど、母集団の割合が高くなる可能性が高くなります。 研究は、起源の母集団の実数を表し、の目的の結果に関してより確実になります。 調査。
信頼区間を解釈する方法は?
信頼区間の正しい解釈は、おそらくこの統計的概念の最も難しい側面です。 概念の最も一般的な解釈の例は次のとおりです。
ここに一つ 95%の確率 将来的には、母集団パラメータの真の値(平均など)が範囲内に収まるようになります バツ (下限)と Y (上限)。
したがって、信頼区間は次のように解釈されます。 X(下限)とY(上限)の間の範囲に母集団パラメーターの真の値が含まれていることは95%の信頼度です。
だろう 完全に間違っている 次のように述べます。X(下限)とY(上限)の間の間隔に母集団パラメーターの実際の値が含まれる確率は95%です。
上記のステートメントは、信頼区間に関する最も一般的な誤解です。 統計範囲が計算された後は、母集団パラメーターのみを含めることができます。
ただし、範囲はサンプル間で異なる可能性がありますが、実際の母集団パラメーターはサンプルに関係なく同じです。
したがって、信頼区間に関する確率ステートメントは、信頼区間がサンプル数に対して再計算された場合にのみ作成できます。
信頼区間を計算する手順
範囲は、次の手順を使用して計算されます。
- サンプルデータを収集します。 番号;
- サンプル平均を計算する バツ;
- 母標準偏差(σ)既知または不明。
- 母標準偏差がわかっている場合は、ポイントを使用できます。 z 対応する信頼水準について;
- 母標準偏差が不明な場合は、統計を使用できます t 対応する信頼水準について;
- したがって、信頼区間の下限と上限は、次の式を使用して求められます。
) 既知の母集団の標準偏差:
既知の母集団の標準偏差を計算するための式。
B) 未知の母集団の標準偏差:
未知の母集団の標準偏差を計算するための式。
信頼区間の実際的な例
臨床研究では、喘息の存在と成人の閉塞性睡眠時無呼吸症を発症するリスクとの関連を評価しました。
一部の成人は、州の公務員のリストからランダムに採用され、4年間追跡されました。
喘息のある参加者は、喘息のない参加者と比較して、4年以内に無呼吸を発症するリスクが高かった。
この例のような臨床試験を実施する場合、通常、関心のある母集団のサブセットを採用して、研究の効率を高めます(コストと時間の削減)。
下の画像に示すように、この個人のサブグループである調査対象の母集団は、選択基準を満たし、調査への参加に同意した人々で構成されています。
例で調査した母集団の説明グラフ。
次に、調査が完了し、効果量が計算されます(例: 平均差 または1つ 相対危険度)調査の質問に答えます。
このプロセスは、 推論は、調査母集団から収集されたデータを使用して、対象の母集団、つまりソース母集団の実際の効果量を推定することを含みます。
与えられた例では、研究者は適格であり、 研究への参加に同意し(研究集団)、喘息が集団で無呼吸を発症するリスクを高めることを報告しました 勉強した。
関心のある母集団のサブセットのみを採用することによるサンプリングエラーを説明するために、彼らはまた、 95%信頼区間 (推定値付近)1.06〜1.82であり、 原産地の母集団における真の相対リスクは1.06から1.82の間であるという95%.
平均の信頼区間
母集団の標準偏差に関する情報がある場合は、その母集団の平均または平均の信頼区間を計算できます。
測定されている統計的特性(収入、IQ、価格、身長、数量、体重など)が数値である場合、ほとんどの場合、母集団の平均値が見つかると推定されます。
したがって、母平均を求めます(μ)サンプル平均を使用する(バツ)、許容誤差あり。 この計算の結果はと呼ばれます 母平均の信頼区間.
母標準偏差がわかっている場合、母平均の信頼区間(CI)の式は次のとおりです。
どこ:
- バツ サンプル平均です。
- σ 母標準偏差です。
- 番号サンプルサイズです。
- Ζ* 希望する信頼水準に対する標準正規分布の適切な値を表します。
以下は、さまざまな信頼水準の値です(Ζ*):
信頼レベル | Z値*- |
---|---|
80% | 1.28 |
90% | 1,645(従来型) |
95% | 1.96 |
98% | 2.33 |
99% | 2.58 |
上の表は、特定の信頼水準のz *値を示しています。 これらの値は、標準正規分布(Z-)から取得されていることに注意してください。
各z *値とその値の負の値の間の領域は、パーセント信頼度(概算)です。 たとえば、z * = 1.28とz = -1.28の間の領域は約0.80です。 したがって、このテーブルは他の信頼度に拡張することもできます。 この表には、最も使用されている信頼度のパーセンテージのみが示されています。
の意味も参照してください 仮説.