THE 統計 数学の分野です 事実と数字を一覧表示する データを収集して分析することを可能にする一連のメソッドがあり、それによってそれらの解釈を実行することが可能になります。 統計は2つの部分に分かれています。 記述的 そして 推論。 記述統計は、データの編成、分析、および表示によって特徴付けられますが、推論統計には次のような特徴があります。 特徴として、特定の母集団のサンプルの研究と、それに基づいた分析の実行と サイコロ。
あまりにも読んでください: 調査の許容誤差はどれくらいですか?
統計の原則
次に、統計の主な概念と原則を見ていきます。 それらに基づいて、より洗練された概念を定義することが可能になります。
母集団または統計的世界
母集団または統計的宇宙は すべての要素によって形成されたセット 特定の研究トピックに参加している人。
統計ユニバースの例
a)都市では、すべての住民は統計的宇宙に属しています。
b)6面のサイコロでは、人口は面の数によって与えられます。
{1, 2, 3, 4, 5, 6}
統計データ
統計データは 全体として人口に属する要素、明らかに、このデータは研究トピックに関係している必要があります。
人口 |
統計データ |
六面サイコロ |
4 |
ブラジルのマウンテンバイクチャンピオン |
エンリケ・アヴァンチーニ |
サンプル
サンプルを 統計的世界に基づいて形成されたサブセット. サンプルは、母集団が非常に大きいか無限である場合に使用されます。 統計的世界からすべての情報を収集することが財政的またはロジスティック上の理由で実行不可能な場合は、サンプルを使用する必要もあります。
サンプルの選択は研究にとって非常に重要であり、母集団を確実に表す必要があります。 調査でのサンプルの使用の典型的な例は、 人口動態調査 私たちの国の。
変数
統計では、変数は調査の対象です。つまり、 研究が研究しようとしているトピック. たとえば、都市の特性を研究する場合、住民の数は変数になる可能性があります。 一定期間の雨量や輸送用バスの数さえも 公衆。 統計における変数の概念は、研究の文脈に依存していることに注意してください。
統計におけるデータの編成は、 フェーズ、他の組織プロセスと同様に。 まず、調査するトピックを選択し、次に調査データの収集方法を考え、3番目のステップは収集を実行することです。 この最後のステップの終了後、収集されたものの分析が実行され、したがって、解釈に基づいて結果が求められます。 ここで、データ編成に必要ないくつかの重要な概念を見ていきます。
今やめないで... 広告の後にもっとあります;)
役割
データを数値で表すことができる場合、つまり変数が量的である場合、 これらのデータの編成. 名簿は昇順または降順にすることができます。 変数が定量的でない場合、つまり定性的である場合、たとえば、データが特定の製品に関する感情である場合、リストを使用することはできません。
例
教室では、生徒の身長をメートル単位で収集しました。 それらは:1.70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.
リストは昇順または降順で整理できるため、次のようになります。
rol:(1.60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
ロールがすでに組み立てられていると、データをより簡単に見つけることができることに注意してください。
度数分布表
リストに多くの要素があり、データの繰り返しが多い場合、これらのデータの編成は実行不可能であるため、リストは廃止されます。 これらの場合、テーブルと 頻度分布 それらは優れた組織ツールとして機能します。
の度数分布表で 絶対頻度、 各データが表示される頻度、つまりデータが表示される回数を指定する必要があります。
の度数分布表を作成しましょう 絶対頻度 特定のクラスの生徒の年齢(年単位)。
絶対度数分布 | |
年齢 |
頻度(F) |
8 |
2 |
9 |
12 |
10 |
12 |
11 |
14 |
12 |
1 |
合計(FT) |
41 |
表から、次の情報を得ることができます。クラスには、8、12歳の2人の生徒がいます。 9歳の生徒、さらに12人の10歳の生徒など、合計41人に達しました。 学生。 の度数分布表で 累積頻度、前の行(絶対度数分布表)の度数を追加する必要があります。
前の例と同じクラスの年齢の累積度数分布表を作成しましょう。以下を参照してください。
累積度数分布 | |
年齢 |
頻度(F) |
8 |
2 |
9 |
14 |
10 |
26 |
11 |
40 |
12 |
41 |
合計(FT) |
41 |
の表で 相対度数分布、 各データが表示されるパーセンテージが使用されます。 ここでも、絶対度数分布表に基づいて計算を行います。 41はクラスの生徒の100%に対応することがわかっているので、 パーセンテージ 各年齢について、年齢の頻度を41で割り、その結果に100を掛けるだけで、パーセンテージで表すことができます。
2: 41 = 0,048 · 100 → 4,8%
12: 41 = 0,292 · 100 → 29,2%
12: 41 = 0,292 · 100 → 29,2%
14: 41 = 0,341 · 100 → 34,1%
1: 41 = 0,024 · 100 → 2,4%
相対度数分布 | |
年齢 |
頻度(F) |
8 |
4,8% |
9 |
29,2% |
10 |
29,2% |
11 |
34,1% |
12 |
2,4% |
合計(FT) |
100% |
あまりにも読んでください:の適用 そして統計: f周波数 ザ・絶対と f相対頻度
クラス
変数が連続している場合、つまり複数の値がある場合は、それらをグループ化する必要があります。 実際の間隔. 統計では、これらの間隔はクラスと呼ばれます。.
のテーブルを作成するには クラスの度数分布、 間隔を適切なタイトルで左側の列に配置し、右側の列に間隔を配置する必要があります。 各間隔の絶対頻度、つまり、それぞれに属する要素の数を入力します 彼らの。
例
高校3年生の学校の生徒の身長。
クラスの度数分布 | |
高さ(メートル) |
絶対周波数(F) |
[1,40; 1,50[ |
1 |
[1,50; 1,60[ |
4 |
[1,60; 1,70[ |
8 |
[1,70; 1,80[ |
2 |
[1,80; 1,90[ |
1 |
合計(FT) |
16 |
クラスの度数分布表を分析すると、3年目のクラスには1人の生徒がいることがわかります。 高さが1.50〜1.60 mの生徒が4人いるのと同じように、高さが1.40 m〜1.50mの生徒がいます。 続けて。 また、生徒の身長は1.40mから1.90mであることがわかります。これらの測定値の差、つまりサンプルの最高の高さと最低の高さの差は、 振幅.
クラスの上限と下限の違いは、 クラスの幅したがって、高さが1.50メートル(含まれる)から1.60メートル(含まれない)の4人の生徒がいる2番目の生徒の範囲は、次のとおりです。
1,60 – 1,50
0.10メートル
も参照してください: 分散測定:振幅と偏差
位置測定
位置測定は、データまたは度数分布表を使用して数値ロールを作成できる場合に使用されます。 これらの測定値は、名簿に対する要素の位置を示しています。 位置の3つの主な尺度は次のとおりです。
平均
要素を含むリストを検討してください(a1、2、3、4、…、番号)、これらのn個の要素の算術平均は次の式で与えられます。

例
ダンスグループでは、メンバーの年齢が収集され、次のリストに表示されました。
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
このダンスグループのメンバーの平均年齢を調べてみましょう。
式に従って、次のように、すべての要素を追加し、この結果をリスト内の要素の数で割る必要があります。

したがって、メンバーの平均年齢は22歳です。
この位置測定の詳細については、テキストをお読みください。 Mé朝.
中央値
中央値は、奇数の要素を持つ名簿の中央要素によって与えられます。 リストに偶数の要素がある場合、2つの中心的な要素を考慮し、それらの間の算術平均を計算する必要があります。
例
次のリストを検討してください。
(2, 2, 3, 3,4, 5, 6, 7, 9)
要素4は、役割を2つの等しい部分に分割するため、中心的な要素であることに注意してください。
例
ダンスグループの年齢の中央値を計算します。
このダンスグループの年齢のリストは次の人によって与えられることを忘れないでください:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
このリストの要素数は10に等しいため、リストを2つの等しい部分に分割することはできません。 したがって、2つの中心的な要素を取り、これらの値の算術平均を実行する必要があります。

この位置測定の詳細については、テキストを参照してください。 Mエディアン.
ファッション
ファッションを最も頻度の高い役割の要素、つまりその中で最も出現する要素と呼びます。
例
ダンスグループの年齢ロールのファッションを決定しましょう。
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
最も多く表示される要素は21であるため、モードは21に等しくなります。
分散対策
分散対策は 平均がもはや十分でない場合に使用されます. たとえば、2台の車が平均40,000キロメートルを走行したとします。 平均についての知識がなければ、2台の車がそれぞれ決定可能なキロメートルを歩いたと言えますよね?
ただし、1台の車が79,000キロメートルをカバーし、他の1,000台が走行したと想像してください。 キロメートル、平均に関する情報だけでステートメントを作成することはできないことに注意してください 精度。
で 分散対策 数値リストの要素が算術平均からどれだけ離れているかを教えてくれます。 分散には2つの重要な尺度があります。
分散(σ2)
ロール内の各要素間の差の二乗の算術平均とそのロールの算術平均を分散と呼びましょう。 分散は次の式で表されます。σ2.
名簿を検討してください(x1、 バツ2、 バツ3、 …、 バツ番号)そしてそれは算術平均を持っていることバツ. 分散は次の式で与えられます。

標準偏差(σ)
標準偏差は分散の根によって与えられ、平均に対して要素がどれだけ分散しているかを示します。 標準偏差はσで表されます。
例
データセットの標準偏差を決定します(4、7、10)。 このためには、最初に分散を決定する必要があり、そのためには、最初にこれらのデータの平均を計算する必要があることに注意してください。

これらのデータを分散式に置き換えると、次のようになります。

標準偏差を決定するには、分散の根を抽出する必要があります。

続きを読む: 分散測定:分散と標準偏差
統計とは何ですか?
統計がに関連していることがわかりました カウントまたはデータ編成の問題. さらに、テーブルなどのデータを整理するプロセスを可能にするツールの開発において重要な役割を果たします。 統計はまた存在します 科学のさまざまな分野、データの収集と処理に基づいて、調査対象の領域でのさらなる開発を可能にする数学的モデルを使用することが可能です。 統計学が基本となるいくつかの分野:経済学、気象学、マーケティング、スポーツ、社会学、地球科学。
たとえば気象学では、データは特定の期間に収集され、整理された後、処理されます。 それらに基づいて、前日の気候についてより大きな程度で主張することを可能にする数学的モデルが構築されます 信頼性。 統計は、ある程度の信頼性を持って発言することを可能にする科学の一分野ですが、100%確実ではありません。
統計区分
統計は、記述統計と推論の2つの部分に分けられます。 1つ目は、研究に関係する要素のカウントに関連しており、これらの要素は1つずつカウントされます。 で 記述統計、 私たちの主なツールは、平均、中央値、最頻値などの位置測定と 分散や標準偏差などの分散測定値、度数分布表、 グラフィック。
記述統計では、非常に明確に定義された方法論があります。 かなりの信頼性を備えたデータの提示 これは、編成と収集、要約、解釈と表現、そして最後にデータ分析を経ます。 記述統計の使用の典型的な例は、ブラジル地理統計資料院(10年ごと)による人口調査で発生します。IBGE).
THE 推論統計、 次に、母集団の要素から1つずつデータを収集するのではなく、 この母集団のサンプルの分析、結論の引き出し 彼女について。 推論統計では、母集団を非常によく表す必要があるため、サンプルを選択する際には注意が必要です。 希望と呼ばれる推論統計における平均化などのいくつかの初期結果は、記述統計の知識に基づいて推定されます。
推論統計は、たとえば選挙人投票で使用されます。 母集団のサンプルがそれを表す方法で選択され、したがって調査が実行されます。 この母集団をあまりよく表していないサンプルを選択する場合、調査は 偏った したがって、信頼性がありません。

解決された演習
質問1 –(U。 F。 Juiz de Fora – MG)物理の教師が、22人の生徒に100ポイント相当のテストを適用し、その結果、次の表に示す成績の分布を取得しました。
40 |
20 |
10 |
20 |
70 |
60 |
90 |
80 |
30 |
50 |
50 |
70 |
50 |
20 |
50 |
50 |
10 |
40 |
30 |
20 |
60 |
60 |
– |
– |
次のデータ処理を実行します。
a)これらのメモのリストを書きます。
b)最高音の相対頻度を決定します。
解決
a)これらのメモのリストを作成するには、昇順または降順で書き込む必要があります。 したがって、次のことを行う必要があります。
10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90
b)ロールを見ると、最高音が90に等しく、絶対周波数が1に等しいことがわかります。これは、1回しか表示されないためです。 相対度数を決定するには、その音符の絶対度数を合計度数で割る必要があります。この場合は22になります。 したがって:
相対頻度

この数値をパーセンテージで渡すには、100を掛ける必要があります。
0,045 · 100
4,5%
質問2–(エネム) 面番号が1から6の立方体のサイコロを10回連続して転がした後、 各移動で得られた数、次の分布表に注意してください。 周波数。
得られた数 |
周波数 |
1 |
4 |
2 |
1 |
4 |
2 |
5 |
2 |
6 |
1 |
この度数分布の平均、中央値、最頻値は、それぞれ次のとおりです。
a)3、2、1
b)3、3、1
c)3、4、2
d)5、4、2
e)6、2、4
解決
代替案B。
平均を決定するために、取得された数値が繰り返されることに注意してください。そのため、加重算術平均を使用します。

中央値を決定するには、名簿を昇順または降順で配置する必要があります。 頻度は顔が現れる回数であることを忘れないでください。
1, 1, 1, 1, 2, 4, 4, 5, 5, 6
名簿内の要素の数は偶数であるため、次のように、名簿を半分に分割する中央要素の算術平均を計算して中央値を決定する必要があります。

モードは、最も出現する要素によって与えられます。つまり、最も頻度が高いため、モードは1に等しくなります。
したがって、平均、中央値、最頻値はそれぞれ次のようになります。
3、3、1
ロブソンルイス
数学の先生
人々のグループでは、年齢は10、12、15、17歳です。 16歳の子供がグループに参加した場合、グループの平均年齢はどうなりますか?
その会社の平均給与を計算します。