У рамках статистики існує кілька способів аналізу набору даних, залежно від потреби в кожному конкретному випадку. Уявіть, що тренер записує час, проведений кожним з його спортсменів під час кожної бігової тренування, а потім зауважує, що Час деяких ваших бігунів демонструє значні коливання, що може призвести до поразки на змаганнях. офіційний. У цьому випадку цікаво, що тренер має якийсь спосіб перевірити дисперсію між часом кожного спортсмена.
Звичайно, статистика має відповідний інструмент для цього тренера! THE дисперсія є міра дисперсіїщо дозволяє визначити відстань, на якій час кожного спортсмена знаходиться від середнього значення. Припустимо, тренер зафіксував у таблиці час трьох спортсменів після проходження одного курсу в п’ять різних днів:
Перш ніж розрахувати дисперсію, необхідно знайти середнє арифметичне (х) часи кожного спортсмена. Для цього тренер зробив такі розрахунки:
Жоао → хJ = 63 + 60 + 59 + 55 + 62 = 299 = 59,8 хв.
5 5
Петро → хP = 54 + 59 + 60 + 57 + 61 = 291 = 58,2 хв.
5 5
рамки → хМ = 60 + 63 + 58 + 62 + 55 = 298 = 59,6 хв.
5 5
Тепер, коли тренер знає середній час кожного спортсмена, він може використовувати дисперсію, щоб отримати відстань періодів кожної гонки від цього середнього значення. Для розрахунку дисперсії для кожного коридору можна виконати наступний розрахунок:
Var = (День 1 - х) ² + (день 2 - х) ² + (день 3 - х) ² + (день 4 - х) ² + (день 5 - х)²
всього днів (5)
Для кожного спортсмена тренер розрахував дисперсію:
Жоао
Var (J) = (63 – 59,8)² + (60 – 59,8)² + (59 – 59,8)² + (55 – 59,8)² + (62 – 59,8)²
5
Var (J) = 10,24 + 0,04 + 0,64 + 23,04 + 4,84
5
Var (J) = 38,8
5
Var (J) = 7,76 хв
Петро
Var (P) = (54 – 58,2)² + (59 – 58,2)² + (60 – 58,2)² + (57 – 58,2)² + (61 – 58,2)²
5
Var (P) = 17,64 + 0,64 + 3,24 + 1,44 + 7,84
5
Var (P) = 30,8
5
Var (P) = 6,16 хв
рамки
Var (M) = (60 – 59,6)² + (63 – 59,6)² + (58 – 59,6)² + (62 – 59,6)² + (55 – 59,6)²
5
Var (M) = 0,16 + 11,56 + 2,56 + 5,76 + 21,16
5
Var (M) = 41,2
5
Var (M) = 8,24 хв
Згідно з дисперсійними розрахунками, спортсмен, який представляє час більш розпорошені середнього - Рамки. Вже зараз Петро представлені в рази ближче до середнього, ніж інші бігуни.
Як щодо того, щоб ми синтезували все, що ми бачили про дисперсію, на цьому прикладі?
Враховуючи набір даних, дисперсія є мірою дисперсії, яка показує, наскільки кожне значення в цьому наборі знаходиться від центрального (середнього) значення;
Чим менша дисперсія, тим ближче значення до середнього. Так само, чим він більший, тим далі значення від середнього.
Як і в цьому прикладі, ми обчислюємо дисперсію всі дні, коли спортсмени тренувались під наглядом тренера, ми говоримо, що розрахували дисперсія популяції. А тепер уявіть, що тренер хоче проаналізувати час цих спортсменів протягом року. Це буде багато даних, чи не так? У цьому випадку доцільно було б, щоб дослідник відібрав лише кілька часових записів, своєрідних зразків. Цей розрахунок буде мати значення дисперсія вибірки. Єдина різниця між дисперсією вибірки та проведеним нами розрахунком полягає в тому, що дільник - це кількість днів, віднятих з 1:
Var. зразок = (день до - х) ² + (день б - х) ² + (день c - х)² +... + (день n - х)²
(всього днів) - 1
Автор: Аманда Гонсалвес
Закінчив математику