Статистика: принципи, важливість, приклади

THE статистика це область математики, яка перелічіть факти та цифри в якому існує набір методів, які дозволяють нам збирати дані та аналізувати їх, тим самим даючи можливість виконати їх певну інтерпретацію. Статистика розділена на дві частини: описовий і вивідний. Дескриптивна статистика характеризується організацією, аналізом та поданням даних, тоді як інференційна статистика має як характеристика вивчення вибірки даної сукупності і на її основі виконання аналізів та представлення Кістки.

Читайте також: Що таке похибка опитування?

Принципи статистики

Далі ми побачимо основні поняття та принципи статистики. На їх основі можна буде визначити більш складні концепції.

  • населення або статистичний всесвіт

Населення або статистичний всесвіт - це набір, утворений усіма елементами які беруть участь у певній досліджуваній темі.

Приклади статистичного всесвіту

а) У місті всі жителі належать до статистичного всесвіту.

б) На шестигранній плашці населення визначається кількістю граней.

{1, 2, 3, 4, 5, 6}

  • статистичні дані

Статистичні дані є a елемент, що належить населенню в цілому, очевидно, ці дані повинні бути залучені до теми дослідження.

Населення

статистичні дані

шестигранні кубики

4

Чемпіони Бразилії з гірських велосипедів

Анріке Аванчіні

  • Зразок

Зразок ми називаємо підмножина, сформована на основі статистичного всесвіту. Вибірка використовується, коли популяція дуже велика або нескінченна. У випадках, коли збір усієї інформації зі статистичного всесвіту неможливий з фінансових або логістичних причин, також необхідно використовувати зразки.

Вибір вибірки надзвичайно важливий для дослідження, і він повинен надійно відображати сукупність. Класичний приклад використання зразків під час опитування - це проведення демографічний перепис нашої країни.

  • Змінна

У статистиці змінна є об'єктом дослідження, тобто тему, яку дослідження має намір вивчити. Наприклад, при вивченні характеристик міста кількість жителів може бути змінною, а також обсяг дощу за певний період або навіть кількість автобусів для транспорту громадськості. Зверніть увагу, що поняття змінної в статистиці залежить від контексту дослідження.

Організація даних у статистиці відбувається в Росії фази, як і в будь-якому процесі організації. Спочатку вибирається тема, яку слід дослідити, потім продумується метод збору даних дослідження, а третім етапом є проведення збору. Після закінчення цього останнього кроку проводиться аналіз того, що було зібрано, і таким чином, на основі інтерпретації, шукаються результати. Зараз ми побачимо деякі важливі та необхідні концепції організації даних.

Не зупиняйтесь зараз... Після реклами є ще щось;)

  • роль

У випадках, коли дані можуть бути представлені цифрами, тобто коли змінна є кількісною, перелік для організація цих даних. Реєстр може бути висхідним або низхідним. Якщо змінна не є кількісною, тобто якщо вона є якісною, неможливо скористатися переліком, наприклад, якщо дані є почуттями щодо певного товару.

Приклад

У класі було зібрано висоту учнів у метрах. Вони становлять: 1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.

Оскільки список може бути організований за зростанням або за спаданням, з цього випливає, що:

рол: (1,60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}

Зверніть увагу, що, якщо рулон вже зібраний, можна легше знаходити дані.

  • Таблиця розподілу частоти

У випадках, коли в списку багато елементів і багато повторень даних, список стає застарілим, оскільки організація цих даних недоцільна. У цих випадках таблиці та розподіл частоти вони служать чудовим організаційним інструментом.

У таблиці розподілу абсолютна частота, ми повинні встановити частоту, з якою з’являються кожні дані, тобто кількість разів, коли вони з’являються.

Побудуємо таблицю розподілу для абсолютна частота вік учнів у даному класі в роках.

Абсолютний розподіл частоти

Вік

Частота (F)

8

2

9

12

10

12

11

14

12

1

Всього (FТ)

41

З таблиці ми можемо отримати таку інформацію: у класі у нас 2 учні віком 8, 12 років 9-річних студентів та ще 12 10-річних студентів тощо, досягнувши в цілому 41 студентів. У таблиці розподілу накопичені частоти, ми повинні додати частоту з попереднього рядка (у таблиці розподілу абсолютних частот).

Давайте побудуємо сукупну таблицю розподілу частоти для віків того ж класу, що і в попередньому прикладі, див .:

Накопичений розподіл частоти

Вік

Частота (F)

8

2

9

14

10

26

11

40

12

41

Всього (FТ)

41

У таблиці розподіл відносних частот, використовується відсоток, у якому відображаються кожні дані. Знову ми проведемо обчислення на основі таблиці розподілу абсолютних частот. Ми знаємо, що 41 відповідає 100% учнів у класі, тому для визначення процент кожного віку ми просто ділимо частоту віку на 41 і множимо результат на 100, щоб ми могли записати це у відсотках.

2: 41 = 0,048 · 100 → 4,8%

12: 41 = 0,292 · 100 → 29,2%

12: 41 = 0,292 · 100 → 29,2%

14: 41 = 0,341 · 100 → 34,1%

1: 41 = 0,024 · 100 → 2,4%

Відносний розподіл частоти

Вік

Частота (F)

8

4,8%

9

29,2%

10

29,2%

11

34,1%

12

2,4%

Всього (FТ)

100%

Читайте також:Застосування істатистика: fчастота абсолютний і fвідносна частота

  • Заняття

У випадках, коли змінна є безперервною, тобто коли вона має кілька значень, необхідно згрупувати їх реальні інтервали. У статистиці ці інтервали називаються класами..

Для побудови таблиці розподіл частоти по класах, ми повинні розміщувати інтервали в лівій колонці з відповідним заголовком, а в правій колонці ми повинні поставити абсолютну частоту кожного з інтервалів, тобто скільки елементів належить кожному їх.

Приклад

Зростання учнів 3 курсу середньої школи в школі.

Розподіл частоти в класах

висота (метри)

Абсолютна частота (F)

[1,40; 1,50[

1

[1,50; 1,60[

4

[1,60; 1,70[

8

[1,70; 1,80[

2

[1,80; 1,90[

1

Всього (FТ)

16

Аналізуючи таблицю розподілу частоти в класах, ми можемо побачити, що на третьому курсі у нас є 1 студент який має висоту від 1,40 м до 1,50 м, так само, як ми маємо 4 учнів з висотою від 1,50 до 1,60 м, і так послідовно. Ми також можемо спостерігати, що студенти мають висоту від 1,40 до 1,90 м, різниця між цими вимірами, тобто між найвищою та найнижчою висотою вибірки, називається амплітуда.

Різниця між верхньою та нижньою межами класу називається ширина класу, отже, другий, який має 4 учнів з висотою від 1,50 метра (включено) до 1,60 метра (не включено), має діапазон:

1,60 – 1,50

0,10 метра

Дивіться також: Міри дисперсії: амплітуда та відхилення

вимірювання положення

Вимірювачі положення використовуються у випадках, коли можливо побудувати числовий перелік з даними або таблицею частот. Ці вимірювання вказують на розташування елементів по відношенню до реєстру. Три основні міри позиції:

  • Середній

Розгляньте список із елементами (a1, a2, a3, a4,..., Theнемає), середнє арифметичне цих n елементів визначається як:

Приклад

У танцювальному колективі вік учасників був зібраний та представлений у наступному списку:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Давайте визначимо середній вік учасників цього танцювального колективу.

Відповідно до формули, ми повинні додати всі елементи і розділити цей результат на кількість елементів у списку, наприклад:

Отже, середній вік членів - 22 роки.

Щоб дізнатись більше про цей показник положення, прочитайте наш текст: Мéвранці.

  • медіана

Медіана задається центральним елементом реєстру, який має непарну кількість елементів. Якщо список має парну кількість елементів, ми повинні врахувати два центральні елементи і розрахувати середнє арифметичне між ними.

Приклад

Розглянемо наступний перелік.

(2, 2, 3, 3,4, 5, 6, 7, 9)

Зверніть увагу, що елемент 4 ділить роль на дві рівні частини, тому він є центральним елементом.

Приклад

Обчисліть середній вік танцювальної групи.

Пам'ятайте, що перелік вікових категорій для цього танцювального колективу наведено:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Зверніть увагу, що кількість елементів у цьому списку дорівнює 10, тому розділити список на дві рівні частини неможливо. Отже, ми повинні взяти два центральних елементи і виконати середнє арифметичне цих значень.

Детальніше про цей показник позиції дивіться у нашому тексті: Медіан.

  • Мода

Ми будемо називати моду елементом ролі, що має найвищу частоту, тобто елементом, який найбільше в ньому проявляється.

Приклад

Давайте визначимо моду вікового переліку танцювальної групи.

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Елемент, який виявляється найбільше - 21, тому режим дорівнює 21.

Заходи дисперсії

Заходи дисперсії є застосовується у випадках, коли середнє значення вже недостатнє. Наприклад, уявіть, що дві машини в середньому подолали 40 000 кілометрів. Тільки знаючи про середні показники, ми можемо сказати, що дві машини пройшли певний кілометр, правда?

Однак уявіть, що одна з машин подолала 79 000 кілометрів, а інша 1000 кілометрів, зауважте, що лише з інформацією про середній показник неможливо робити заяви точність.

В дисперсійні заходи скаже нам, наскільки елементи числового списку знаходяться від середнього арифметичного. У нас є два важливі заходи розпорошення:

  • Дисперсія (σ2)

Назвемо як дисперсію середнє арифметичне квадратів різниці між кожним елементом у рулоні та середнім арифметичним цього рулону. Дисперсія представлена: σ2.

Розглянемо список (x1, х2, х3,…, Xнемає) і що воно має середнє арифметичнех. Дисперсія визначається:

  • Стандартне відхилення (σ)

Стандартне відхилення дається коренем дисперсії, воно говорить нам, наскільки елемент розсіяний по відношенню до середнього. Стандартне відхилення позначається σ.

Приклад

Визначте стандартне відхилення набору даних (4, 7, 10). Зауважте, що для цього спочатку необхідно визначити дисперсію, а для цього спочатку потрібно обчислити середнє значення цих даних.

Замінюючи ці дані у формулі дисперсії, маємо:

Щоб визначити стандартне відхилення, ми повинні витягти корінь дисперсії.

Детальніше: Міри дисперсії: дисперсія та середнє відхилення

Для чого потрібна статистика?

Ми побачили, що статистика пов’язана з Проблеми з підрахунком або організацією даних. Крім того, він відіграє важливу роль у розробці інструментів, що забезпечують процес організації даних, наприклад у таблицях. Статистика також присутня в різні галузі наукина основі збору та обробки даних можна працювати з математичними моделями, які дозволяють подальший розвиток у досліджуваній галузі. Деякі галузі, в яких статистика є фундаментальною: економіка, метеорологія, маркетинг, спорт, соціологія та геонауки.

Наприклад, в метеорології дані збираються за певний період, після їх організації їх обробляють, і так, з на їх основі побудована математична модель, яка дозволяє стверджувати про клімат попередніх днів з більшим ступенем надійність. Статистика - це галузь науки, яка дозволяє робити твердження з певною мірою достовірності, але ніколи не на 100% впевненості.

Статистичні підрозділи

Статистика поділяється на дві частини, описову та висновкову. Перший пов’язаний з підрахунком елементів, що беруть участь у дослідженні, ці елементи підраховуються по одному. В Описова статистика, нашими основними інструментами є міри позиції, такі як середнє, медіана та режим, а також вимірювання дисперсії, такі як дисперсія та стандартне відхилення, ми також маємо таблиці частот та графіки.

Досі в описовій статистиці ми маємо дуже чітко визначену методологію для подання даних із значним ступенем надійності що проходить через організацію та збір, резюме, інтерпретацію та представлення і, нарешті, аналіз даних. Класичний приклад використання описової статистики зустрічається під час перепису населення (кожні 10 років) Бразильським інститутом географії та статистики (IBGE).

THE висновки статистики, в свою чергу, він характеризується не збиранням даних по елементам сукупності по одному, а шляхом проведення аналіз вибірки цієї сукупності, висновки про неї. У статистиці висновків слід бути обережним при виборі вибірки, оскільки вона повинна дуже добре відображати сукупність. Деякі початкові результати, такі як усереднення, у вивідній статистиці, яка називається надією, виводяться на основі знань описової статистики.

Інференційна статистика використовується, наприклад, у виборчих дільницях. Вибір вибірки сукупності обирається таким чином, що її представляє, і таким чином проводиться дослідження. Вибираючи вибірку, яка не дуже добре відображає цю сукупність, ми говоримо, що дослідження є упереджений і тому ненадійний.

Область математики, відповідальна за підрахунок та упорядкування даних.
Область математики, відповідальна за підрахунок та упорядкування даних.

розв’язані вправи

питання 1 - (У. Ф. Джуїз де Фора - М.Г.) Вчитель фізики застосував до своїх 22 учнів тест на 100 балів і отримав, як результат, розподіл оцінок, видно з наступної таблиці:

40

20

10

20

70

60

90

80

30

50

50

70

50

20

50

50

10

40

30

20

60

60

Виконайте такі процедури обробки даних:

а) Напишіть список цих приміток.

б) Визначте відносну частоту найвищої ноти.

Дозвіл

а) Щоб скласти список цих приміток, ми повинні писати їх за зростанням або за спаданням. Отже, ми маємо:

10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90

б) Переглядаючи рулон, ми бачимо, що найвища нота дорівнювала 90 і що її абсолютна частота дорівнює 1, оскільки вона з’являється лише один раз. Щоб визначити відносну частоту, ми повинні розділити абсолютну частоту цієї ноти на загальну частоту, в даному випадку дорівнює 22. Отже:

відносна частота

Щоб передати це число у відсотках, ми повинні помножити його на 100.

0,045 · 100

4,5%

Питання 2 - (Enem) Після прокатки кубоподібної плашки з гранями, пронумерованими від 1 до 6, 10 разів поспіль, і зверніть увагу на число, отримане в кожному ході, у наступній таблиці розподілу частоти.

Отримане число

Частота

1

4

2

1

4

2

5

2

6

1

Середнє, медіана та режим цього розподілу частоти становлять відповідно:

а) 3, 2 і 1

б) 3, 3 і 1

в) 3, 4 і 2

г) 5, 4 і 2

д) 6, 2 і 4

Дозвіл

Альтернатива Б.

Для визначення середнього значення зауважте, що отримані числа повторюються, тому ми будемо використовувати зважене середнє арифметичне.

Щоб визначити медіану, ми повинні розташувати список за зростанням або за спаданням. Пам'ятайте, що частота - це кількість показів обличчя.

1, 1, 1, 1, 2, 4, 4, 5, 5, 6

Оскільки число елементів у реєстрі парне, ми повинні розрахувати середнє арифметичне центральних елементів, які ділять список навпіл, щоб визначити медіану, як це:

Режим задається елементом, який виявляється найбільше, тобто він має найвищу частоту, тому маємо, що режим дорівнює 1.

Таким чином, середнє, медіана та мода відповідно дорівнюють:

3, 3 та 1

Робсон Луїс
Вчитель математики

У групі людей вік: 10, 12, 15 і 17 років. Якщо 16-річний хлопець приєднується до групи, що відбувається із середнім віком групи?

Обчисліть середню зарплату для цієї компанії.

Стандартне відхилення: що це, формула, як розрахувати і вправи

Стандартне відхилення: що це, формула, як розрахувати і вправи

Стандартне відхилення - це міра, яка виражає ступінь розпорошеності набору даних. Тобто стандартн...

read more

Статистика: поняття та етапи статистичного методу

Статистика - це точна наука, яка вивчає збір, організацію, аналіз та запис даних за зразками.Заст...

read more
Середнє значення, мода та медіана

Середнє значення, мода та медіана

Середнє значення, режим і медіана - це показники центральної тенденції, що використовуються в ста...

read more