При дослідженні Статистика, у нас є кілька стратегій, щоб перевірити, чи значення, представлені в наборі даних, розподілені чи ні, і наскільки вони можуть бути віддалені. Інструменти, що використовуються для цього, класифікуються як дисперсійні заходи і подзвонив дисперсія і стандартне відхилення. Давайте подивимося, що представляє кожен з них:
Дисперсія:
Враховуючи набір даних, дисперсія є мірою дисперсії, яка показує, наскільки кожне значення в цьому наборі знаходиться від центрального (середнього) значення.
Чим менша дисперсія, тим ближче значення до середнього; але чим він більший, тим далі значення від середнього.
-
Вважайте це х1, х2,…, Xнемаєвони є немає елементи a зразок чи це X та середнє арифметичне цих елементів. Розрахунок дисперсія вибірки Він дається:
Var. зразок = (х1 – х) ² + (x2 – х) ² + (x3 – х)² +... + (xнемає – х)²
n - 1 -
Якщо, з іншого боку, ми хочемо обчислити дисперсія популяції, ми розглянемо всі елементи сукупності, а не лише вибірку. У цьому випадку розрахунок має невелику різницю. Дивитися:
Var. населення = (х1 – х) ² + (x2 – х) ² + (x3 – х)² +... + (xнемає – х)²
немає
Стандартне відхилення:
Стандартне відхилення здатне ідентифікувати “помилку” в наборі даних, якщо ми хотіли замінити одне із зібраних значень середнім арифметичним.
-
Стандартне відхилення відображається поруч із середнім арифметичним, повідомляючи про те, наскільки надійним є це значення. Він представлений наступним чином:
середнє арифметичне (х) ± стандартне відхилення (sd)
-
Розрахунок стандартного відхилення проводиться з додатного квадратного кореня дисперсії. Тому:
dp = √var
Давайте тепер застосуємо розрахунок дисперсії та стандартного відхилення на прикладі:
В одній школі рада вирішила розглянути кількість учнів, які мають усі оцінки вище середнього з усіх предметів. Щоб краще проаналізувати його, директор Ана вирішила скласти таблицю із кількістю «блакитних» оцінок у вибірці з чотирьох класів протягом року. Дивіться нижче таблицю, організовану директором:
Перед обчисленням дисперсії необхідно перевірити середнє арифметичне(х) кількість учнів середнього класу в кожному класі:
6-й рік → х = 5 + 8 + 10 + 7 = 30 = 7,50.
4 4
7-й рік → х = 8 + 6 + 6 + 12 = 32 = 8,00.
4 4
8-й рік → х = 11 + 9 + 5 + 10 = 35 = 8,75.
4 4
9-й рік → х = 8 + 13 + 9 + 4 = 34 = 8,50.
4 4
Для обчислення дисперсії кількості учнів вище середньої в кожному класі ми використовуємо a зразок, тому ми використовуємо формулу дисперсія вибірки:
Var. зразок = (х1 – х) ² + (x2 – х) ² + (x3 – х)² +... + (xнемає – х)²
n - 1
6-й рік → Var = (5 – 7,50)² + (8 – 7,50)² + (10 – 7,50)² + (7 – 7,50)²
4 – 1
Var = (– 2,50)² + (0,50)² + (2,50)² + (– 0,50)²
3
Var = 6,25 + 0,25 + 6,25 + 0,25
3
Var = 13,00
3
Var = 4,33
7-й рік → Var = (8 – 8,00)² + (6 – 8,00)² + (6 – 8,00)² + (12 – 8,00)²
4 – 1
Var = (0,00)² + (– 2,00)² + (– 2,00)² + (4,00)²
3
Var = 0,00 + 4,00 + 4,00 + 16,00
3
Var = 24,00
3
Var = 8,00
8-й рік → Var = (11 – 8,75)² + (9 – 8,75)² + (5 – 8,75)² + (10 – 8,75)²
4 – 1
Var = (2,25)² + (0,25)² + (– 3,75)² + (1,25)²
3
Var = 5,06 + 0,06 + 14,06 + 1,56
3
Var = 20,74
3
Var = 6,91
9-й рік → Var = (8 – 8,50)² + (13 – 8,50)² + (9 – 8,50)² + (4 – 8,50)²
4 – 1
Var = (– 0,50)² + (4,50)² + (0,50)² + (– 4,50)²
3
Var = 0,25 + 20,25 + 0,25 + 20,25
3
Var = 41,00
3
Var = 13,66
Як тільки буде відома дисперсія кожного класу, давайте обчислимо стандартне відхилення:
6-й рік dp = √var |
7-й рік dp = √var |
8-й рік dp = √var |
9-й рік dp = √var |
На завершення свого аналізу директор може представити наступні значення, які вказують на середню кількість учнів, що перевищує середню в обстеженому класі:
6-й рік: 7,50 ± 2,08 студентів вище середнього за семестр;
7-й рік: 8,00 ± 2,83 студента вище середнього за два місяці;
8-й рік: 8,75 ± 2,63 студента вище середнього за два місяці;
9-й рік: 8,50 ± 3,70 студентів вище середнього за два місяці;
Ще одна міра дисперсії - коефіцієнт варіації. Дивись тут як це розрахувати!
Автор: Аманда Гонсалвес
Закінчив математику
Джерело: Бразильська школа - https://brasilescola.uol.com.br/matematica/medidas-dispersao-variancia-desvio-padrao.htm