통계: 원칙, 중요성, 예

protection click fraud

그만큼 통계량 수학 분야는 사실과 수치를 나열하다 여기에는 데이터를 수집하고 분석 할 수있는 일련의 방법이있어 데이터에 대한 일부 해석을 수행 할 수 있습니다. 통계는 두 부분으로 나뉩니다. 설명추론. 기술 통계는 데이터의 구성, 분석 및 표시로 특징 지어지는 반면 추론 통계는 특성으로 주어진 모집단의 표본에 대한 연구와이를 기반으로 분석의 수행 및 프레젠테이션 주사위.

읽기: 설문 조사의 오차 한계는 무엇입니까?

통계의 원리

다음으로 통계의 주요 개념과 원리를 살펴 보겠습니다. 이를 바탕으로보다 정교한 개념을 정의 할 수 있습니다.

  • 인구 또는 통계적 우주

인구 또는 통계적 세계는 모든 요소에 의해 형성된 세트 특정 연구 주제에 참여합니다.

통계적 유니버스의 예

a) 도시에서 모든 주민은 통계적 우주에 속합니다.

b) 6면 주사위에서 인구는 얼굴의 수로 주어집니다.

{1, 2, 3, 4, 5, 6}

  • 통계 자료

통계 데이터는 전체 인구에 속하는 요소, 분명히이 데이터는 연구 주제와 관련되어야합니다.

인구

통계 자료

6면 주사위

4

브라질 산악 자전거 챔피언

Henrique Avancini

  • 견본

우리는 샘플을 통계적 유니버스를 기반으로 형성된 하위 집합. 표본은 모집단이 매우 크거나 무한 할 때 사용됩니다. 재정적 또는 물류상의 이유로 통계적 세계에서 모든 정보를 수집 할 수없는 경우에도 샘플을 사용해야합니다.

샘플 선택은 연구에 매우 중요하며 인구를 안정적으로 나타내야합니다. 설문 조사에서 샘플 사용의 전형적인 예는 인구 조사 우리 나라의.

  • 변하기 쉬운

통계에서 변수는 연구 대상입니다. 연구가 연구하려는 주제. 예를 들어 도시의 특성을 연구 할 때 주민 수는 변수가 될 수 있습니다. 특정 기간 동안의 비의 양 또는 운송을위한 버스의 수도 공공의. 통계에서 변수의 개념은 연구 컨텍스트에 따라 다릅니다.

통계 데이터의 구성은 단계, 모든 조직 프로세스에서와 같이. 처음에는 연구 할 주제를 선택하고 연구 데이터를 수집하는 방법을 생각하고 세 번째 단계는 수집을 수행하는 것입니다. 이 마지막 단계가 끝나면 수집 된 내용에 대한 분석이 수행되어 해석을 바탕으로 결과를 모색합니다. 이제 데이터 구성에 필요한 몇 가지 중요하고 필요한 개념을 살펴 보겠습니다.

instagram story viewer

지금 멈추지 마세요... 광고 후 더 있습니다;)

  • 역할

데이터를 숫자로 표현할 수있는 경우, 즉 변수가 양적 일 때 이러한 데이터의 구성. 명단은 오름차순 또는 내림차순이 될 수 있습니다. 변수가 정량적이지 않은 경우, 즉 정 성적이면 목록을 사용할 수 없습니다 (예: 데이터가 특정 제품에 대한 감정인 경우).

교실에서 학생들의 키를 미터 단위로 수집했습니다. 1.70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.

목록은 오름차순 또는 내림차순으로 구성 할 수 있으므로 다음과 같습니다.

rol: (1.60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}

롤이 이미 조립되어 있으면 데이터를 더 쉽게 찾을 수 있습니다.

  • 주파수 분포표

목록에 많은 요소가 있고 데이터가 여러 번 반복되는 경우 이러한 데이터를 구성 할 수 없기 때문에 목록이 쓸모 없게됩니다. 이 경우 테이블과 주파수 분포 그들은 훌륭한 조직 도구 역할을합니다.

배포 테이블에서 절대 주파수, 각 데이터가 나타나는 빈도, 즉 데이터가 나타나는 횟수를 입력해야합니다.

배포 테이블을 만들어 보겠습니다. 절대 주파수 주어진 반에있는 학생들의 나이 (년).

절대 주파수 분포

나이

주파수 (F)

8

2

9

12

10

12

11

14

12

1

합계 (F)

41

표에서 우리는 다음 정보를 얻을 수 있습니다: 수업에는 8, 12 세의 학생 2 명이 있습니다. 9 세 학생, 10 세 학생 12 명 등 총 41 명 재학생. 배포 테이블에서 누적 주파수, 이전 행의 빈도를 추가해야합니다 (절대 빈도 분포 테이블에 있음).

이전 예에서와 같은 등급의 연령에 대한 누적 빈도 분포 테이블을 작성해 보겠습니다. 다음을 참조하십시오.

누적 된 주파수 분포

나이

주파수 (F)

8

2

9

14

10

26

11

40

12

41

합계 (F)

41

테이블에서 상대 주파수 분포, 각 데이터가 나타나는 비율이 사용됩니다. 다시 절대 주파수 분포표를 기반으로 계산을 수행합니다. 우리는 41 명이 반 학생의 100 %에 해당한다는 것을 알고 있습니다. 백분율 각 연령의 빈도를 41로 나누고 결과에 100을 곱하여 백분율로 쓸 수 있습니다.

2: 41 = 0,048 · 100 → 4,8%

12: 41 = 0,292 · 100 → 29,2%

12: 41 = 0,292 · 100 → 29,2%

14: 41 = 0,341 · 100 → 34,1%

1: 41 = 0,024 · 100 → 2,4%

상대 주파수 분포

나이

주파수 (F)

8

4,8%

9

29,2%

10

29,2%

11

34,1%

12

2,4%

합계 (F)

100%

읽기 :신청 통계: 에프회수 그만큼절대적이고 에프상대 빈도

  • 클래스

변수가 연속적인 경우, 즉 값이 여러 개인 경우 그룹화해야합니다. 실제 간격. 통계에서 이러한 간격을 클래스라고합니다..

테이블을 구축하려면 클래스의 주파수 분포, 적절한 제목과 함께 왼쪽 열에 간격을 배치하고 오른쪽 열에 간격을 넣어야합니다. 각 간격의 절대 빈도, 즉 각 간격에 속하는 요소 수를 입력하십시오. 그들의.

고등학교 3 학년 학생의 키.

클래스의 주파수 분포

높이 (미터)

절대 주파수 (F)

[1,40; 1,50[

1

[1,50; 1,60[

4

[1,60; 1,70[

8

[1,70; 1,80[

2

[1,80; 1,90[

1

합계 (F)

16

수업의 도수 분포표를 분석 해보면 3 학년 때 1 명의 학생이 있음을 알 수 있습니다. 1.40m에서 1.50m 사이의 높이를 가지고 있습니다. 우리가 1.50에서 1.60m 사이의 높이를 가진 4 명의 학생이있는 것처럼 연속적으로. 학생들의 높이가 1.40m에서 1.90m 사이 인 것을 관찰 할 수 있습니다. 이러한 측정 값의 차이, 즉 샘플의 가장 높은 높이와 가장 낮은 높이 사이의 차이를 진폭.

클래스의 상한과 하한의 차이를 학급 폭따라서 높이가 1.50m (포함)에서 1.60m (포함되지 않음) 인 4 명의 학생이있는 두 번째 학생은 다음과 같은 범위를 갖습니다.

1,60 – 1,50

0.10 미터

참조: 분산 측정: 진폭 및 편차

위치 측정

위치 측정은 데이터 또는 빈도 표로 숫자 롤을 작성할 수있는 경우에 사용됩니다. 이 측정은 명단과 관련된 요소의 위치를 ​​나타냅니다. 위치의 세 가지 주요 척도는 다음과 같습니다.

  • 평균

요소가있는 목록을 고려하십시오 (a1, ㅏ2, ㅏ3, ㅏ4,…,아니), 이러한 n 요소의 산술 평균은 다음과 같이 제공됩니다.

댄스 그룹에서 멤버의 나이를 수집하여 다음 목록에 표시했습니다.

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

이 댄스 그룹 멤버들의 평균 연령을 결정합시다.

공식에 따라 다음과 같이 모든 요소를 ​​추가하고이 결과를 목록의 요소 수로 나누어야합니다.

따라서 회원들의 평균 연령은 22 세입니다.

이 위치 측정에 대해 자세히 알아 보려면 텍스트를 읽으십시오. 미디엄é아침.

  • 중앙값

중앙값은 요소 수가 홀수 인 명단의 중앙 요소에 의해 제공됩니다. 목록에 짝수 개의 요소가있는 경우 두 개의 중심 요소를 고려하고 그 사이의 산술 평균을 계산해야합니다.

다음 목록을 고려하십시오.

(2, 2, 3, 3,4, 5, 6, 7, 9)

요소 4는 역할을 두 개의 동일한 부분으로 나누므로 중심 요소입니다.

댄스 그룹의 평균 연령을 계산하십시오.

이 댄스 그룹의 연령 목록은 다음과 같습니다.

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

이 목록의 요소 수는 10 개이므로 목록을 동일한 두 부분으로 나눌 수 없습니다. 따라서 우리는 두 개의 중심 요소를 취하고이 값의 산술 평균을 수행해야합니다.

이 위치 측정에 대한 자세한 내용은 텍스트에서 확인하세요. 미디엄에디 안.

  • 패션

우리는 패션을 가장 빈도가 높은 역할의 요소, 즉 가장 많이 나타나는 요소라고 부를 것입니다.

댄스 그룹의 연령대 패션을 결정합시다.

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

가장 많이 나타나는 요소는 21이므로 모드는 21과 같습니다.

분산 대책

분산 조치는 평균이 더 이상 충분하지 않은 경우에 사용. 예를 들어, 두 대의 자동차가 평균 40,000km를 주행했다고 가정 해보십시오. 평균에 대한 지식이 있어야 두 차가 각각 결정 가능한 킬로미터를 걸었다 고 말할 수 있습니까?

그러나 한 대의 자동차가 79,000km를 주행하고 다른 자동차는 킬로미터, 평균에 대한 정보만으로는 진술을 할 수 없습니다. 정도.

에서 분산 조치 숫자 목록의 요소가 산술 평균에서 얼마나 멀리 떨어져 있는지 알려줍니다. 분산의 두 가지 중요한 척도가 있습니다.

  • 분산 (σ2)

롤의 각 요소 간의 차이 제곱의 산술 평균과 해당 롤의 산술 평균을 분산이라고합시다. 분산은 다음으로 표시됩니다. σ2.

목록 (x1, x2, x3,…, x아니) 및 산술 평균이 있음엑스. 분산은 다음과 같이 지정됩니다.

  • 표준 편차 (σ)

표준 편차는 분산의 근으로 주어지며, 평균과 관련하여 요소가 얼마나 분산되어 있는지 알려줍니다. 표준 편차는 σ로 표시됩니다.

데이터 세트 (4, 7, 10)의 표준 편차를 결정합니다. 이를 위해서는 먼저 분산을 결정해야하며, 이를 위해 먼저 이러한 데이터의 평균을 계산해야합니다.

분산 공식에서 이러한 데이터를 대체하면 다음과 같습니다.

표준 편차를 결정하려면 분산의 근을 추출해야합니다.

더 읽어보기: 분산 측정: 분산 및 표준 편차

통계 란 무엇입니까?

우리는 통계가 계산 또는 데이터 구성 문제. 또한 테이블과 같은 데이터를 구성하는 프로세스를 가능하게하는 도구 개발에 중요한 역할을합니다. 통계는 또한 다양한 과학 분야, 데이터 수집 및 처리를 기반으로 연구 영역에서 추가 개발을 허용하는 수학적 모델로 작업 할 수 있습니다. 통계가 기본이되는 일부 분야: 경제학, 기상학, 마케팅, 스포츠, 사회학 및 지구과학.

예를 들어 기상학에서 데이터는 특정 기간에 수집되고, 조직 된 후 처리됩니다. 이를 바탕으로 전날의 기후에 대해 더 큰 수준으로 주장 할 수있는 수학적 모델이 구축됩니다. 신뢰할 수 있음. 통계는 우리가 어느 정도의 신뢰성을 가지고 진술을 할 수있게 해주는 과학의 한 분야이지만 결코 100 % 확실하지는 않습니다.

통계 부문

통계는 설명과 추론의 두 부분으로 나뉩니다. 첫 번째는 연구에 포함 된 요소를 세는 것과 관련이 있으며 이러한 요소는 하나씩 계산됩니다. 에서 기술 통계, 우리의 주요 도구는 평균, 중앙값 및 모드와 같은 위치 측정뿐 아니라 분산 및 표준 편차와 같은 분산 측정, 주파수 테이블 및 제도법.

여전히 기술 통계에서 우리는 매우 잘 정의 된 방법론을 가지고 있습니다. 상당한 수준의 신뢰성을 가진 데이터 표현 조직 및 수집, 요약, 해석 및 표현, 마지막으로 데이터 분석을 거칩니다. 기술 통계 사용의 고전적인 예는 브라질 지리 통계 연구소 (Brazil Institute of Geography and Statistics)의 인구 조사 (10 년마다)에서 발생합니다.IBGE).

그만큼 추론 통계, 차례로, 그것은 인구의 요소에서 데이터를 하나씩 수집하는 것이 아니라 이 모집단의 표본 분석, 결론 도출 그녀에 대해. 추론 통계에서는 모집단을 잘 나타내야하므로 표본을 선택할 때주의해야합니다. 평균화와 같은 일부 초기 결과는 희망이라는 추론 통계에서 기술 통계에 대한 지식을 기반으로 추론됩니다.

예를 들어 선거인 투표에서는 추론 통계가 사용됩니다. 인구 표본을 대표하는 방식으로 선택하여 연구가 수행됩니다. 이 모집단을 잘 대표하지 않는 표본을 선택할 때 우리는 연구가 치우친 따라서 신뢰할 수 없습니다.

데이터 계산 및 구성을 담당하는 수학 영역.
데이터 계산 및 구성을 담당하는 수학 영역.

해결 된 운동

질문 1 – (U. 에프. Juiz de Fora – MG) 한 물리학 교사가 자신의 22 명의 학생에게 100 점에 해당하는 시험을 적용하고 그 결과 다음 표와 같은 성적 분포를 얻었습니다.

40

20

10

20

70

60

90

80

30

50

50

70

50

20

50

50

10

40

30

20

60

60

다음 데이터 처리를 수행하십시오.

a)이 메모 목록을 작성하십시오.

b) 가장 높은 음표의 상대 주파수를 결정합니다.

해결

a)이 메모의 목록을 만들려면 오름차순 또는 내림차순으로 작성해야합니다. 따라서 다음을 수행해야합니다.

10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90

b) 롤을 보면 가장 높은 음은 90과 같고 절대 주파수는 1과 같다는 것을 알 수 있습니다. 상대 주파수를 결정하려면 해당 음표의 절대 주파수를 총 주파수로 나눠야합니다.이 경우에는 22입니다. 그러므로:

상대 빈도

이 숫자를 백분율로 전달하려면 100을 곱해야합니다.

0,045 · 100

4,5%

질문 2 – (Enem) 면이 1에서 6까지 번호가 매겨진 입방체 모양의 주사위를 10 번 연속으로 굴린 후 각 이동에서 얻은 수를 기록하십시오. 주파수.

획득 한 수

회수

1

4

2

1

4

2

5

2

6

1

이 빈도 분포의 평균, 중앙값 및 최빈값은 각각 다음과 같습니다.

a) 3, 2 및 1

b) 3, 3 및 1

c) 3, 4 및 2

d) 5, 4 및 2

e) 6, 2 및 4

해결

대안 B.

평균을 결정하기 위해 얻은 숫자의 반복이 있으므로 가중 산술 평균을 사용합니다.

중앙값을 결정하려면 명단을 오름차순 또는 내림차순으로 정렬해야합니다. 빈도는 얼굴이 나타나는 횟수입니다.

1, 1, 1, 1, 2, 4, 4, 5, 5, 6

명단의 요소 수가 짝수이므로 다음과 같이 명단을 반으로 나누는 중앙 요소의 산술 평균을 계산하여 중앙값을 결정해야합니다.

최빈값은 가장 많이 나타나는 요소, 즉 가장 높은 주파수를 갖는 요소에 의해 제공되므로 최빈값은 1입니다.

따라서 평균, 중앙값 및 최빈값은 각각 다음과 같습니다.

3, 3, 1

작성자: Robson Luiz
수학 선생님

그룹의 연령은 10, 12, 15 및 17 세입니다. 16 세가 그룹에 가입하면 그룹의 평균 연령은 어떻게됩니까?

해당 회사의 평균 급여를 계산하십시오.

Teachs.ru

통계 적용: 절대 주파수와 상대 주파수

통계는 사회의 다양한 분야에서 널리 사용되는 수학적 도구로, 연구 데이터를 구성하고 명확하고 객관적인 정보를 제공합니다. 예제를 사용하여 변수의 절대 빈도 및 상대 빈도 테...

read more
변화. 모집단의 분산은 어떻게 계산됩니까?

변화. 모집단의 분산은 어떻게 계산됩니까?

통계 내에서 각 경우의 필요에 따라 데이터 세트를 분석하는 여러 가지 방법이 있습니다. 코치가 각 러닝 운동에서 각 선수가 보낸 시간을 기록한 다음 일부 주자의 타이밍이 상당...

read more
상대 주파수와 관련된 백분율 계산

상대 주파수와 관련된 백분율 계산

백분율은 주어진 상황에서 값을 비교하는 데 사용되는 백분위 비율입니다. 상대 빈도는 이벤트와 이벤트가 속한 샘플 공간 간의 비교에서 파생된 백분율 숫자로 표시됩니다. 예를 들...

read more
instagram viewer