I studiet af Statistik, vi har nogle strategier til at kontrollere, om værdierne i et datasæt er spredt eller ej, og hvor langt fra hinanden de kan være. De værktøjer, der bruges til at muliggøre dette, klassificeres som spredningsforanstaltninger og kaldte varians og standardafvigelse. Lad os se, hvad hver af dem repræsenterer:
Variant:
Givet et datasæt er varians et mål for spredning, der viser, hvor langt hver værdi i dette sæt er fra den centrale (gennemsnitlige) værdi.
Jo mindre variansen er, jo tættere er værdierne middelværdien; men jo større det er, jo længere er værdierne fra middelværdien.
-
Overvej det x1, x2, …, xingende er de ingen elementer i en prøve er det X og det aritmetiske gennemsnit af disse elementer. Beregningen af prøvevarians Det er givet af:
Var. prøve = (x1 – x) ² + (x2 – x) ² + (x3 – x)² +... + (xingen – x)²
n - 1 -
Hvis vi derimod ønsker at beregne populationsvarians, vil vi overveje alle elementer i befolkningen, ikke kun en prøve. I dette tilfælde har beregningen en lille forskel. Holde øje:
Var. befolkning = (x1 – x) ² + (x2 – x) ² + (x3 – x)² +... + (xingen – x)²
ingen
Standardafvigelse:
Standardafvigelsen er i stand til at identificere "fejlen" i et datasæt, hvis vi ønsker at erstatte en af de indsamlede værdier med det aritmetiske gennemsnit.
-
Standardafvigelsen vises ved siden af det aritmetiske gennemsnit og informerer om, hvor "pålidelig" denne værdi er. Det præsenteres som følger:
aritmetisk gennemsnit (x) ± standardafvigelse (sd)
-
Beregningen af standardafvigelsen foretages ud fra den positive kvadratrod af variansen. Derfor:
dp = √var
Lad os nu anvende varians- og standardafvigelsesberegningen i et eksempel:
På en skole besluttede bestyrelsen at se på antallet af studerende, der har alle karakterer over gennemsnittet i alle fag. For bedre at analysere det besluttede instruktør Ana at samle et bord med mængden af "blå" karakterer i en prøve på fire klasser over et år. Se nedenstående tabel organiseret af rektor:
Før variansen beregnes, er det nødvendigt at kontrollere aritmetisk gennemsnit(x) antallet af studerende over gennemsnittet i hver klasse:
6. år → x = 5 + 8 + 10 + 7 = 30 = 7,50.
4 4
7. år → x = 8 + 6 + 6 + 12 = 32 = 8,00.
4 4
8. år → x = 11 + 9 + 5 + 10 = 35 = 8,75.
4 4
9. år → x = 8 + 13 + 9 + 4 = 34 = 8,50.
4 4
For at beregne variansen af antallet af studerende over gennemsnittet i hver klasse bruger vi a prøve, derfor bruger vi formlen prøvevarians:
Var. prøve = (x1 – x) ² + (x2 – x) ² + (x3 – x)² +... + (xingen – x)²
n - 1
6. år → Var = (5 – 7,50)² + (8 – 7,50)² + (10 – 7,50)² + (7 – 7,50)²
4 – 1
Var = (– 2,50)² + (0,50)² + (2,50)² + (– 0,50)²
3
Var = 6,25 + 0,25 + 6,25 + 0,25
3
Var = 13,00
3
Var = 4,33
7. år → Var = (8 – 8,00)² + (6 – 8,00)² + (6 – 8,00)² + (12 – 8,00)²
4 – 1
Var = (0,00)² + (– 2,00)² + (– 2,00)² + (4,00)²
3
Var = 0,00 + 4,00 + 4,00 + 16,00
3
Var = 24,00
3
Var = 8,00
8. år → Var = (11 – 8,75)² + (9 – 8,75)² + (5 – 8,75)² + (10 – 8,75)²
4 – 1
Var = (2,25)² + (0,25)² + (– 3,75)² + (1,25)²
3
Var = 5,06 + 0,06 + 14,06 + 1,56
3
Var = 20,74
3
Var = 6,91
9. år → Var = (8 – 8,50)² + (13 – 8,50)² + (9 – 8,50)² + (4 – 8,50)²
4 – 1
Var = (– 0,50)² + (4,50)² + (0,50)² + (– 4,50)²
3
Var = 0,25 + 20,25 + 0,25 + 20,25
3
Var = 41,00
3
Var = 13,66
Når variansen for hver klasse er kendt, skal vi nu beregne standardafvigelsen:
6. år dp = √var |
7. år dp = √var |
8. år dp = √var |
9. år dp = √var |
For at afslutte hendes analyse kan rektor præsentere følgende værdier, der angiver det gennemsnitlige antal studerende over gennemsnittet pr. Undersøgte klasse:
6. år: 7,50 ± 2,08 studerende over gennemsnittet pr. Semester;
7. år: 8,00 ± 2,83 studerende over gennemsnittet pr. To måneder;
8. år: 8,75 ± 2,63 studerende over gennemsnittet pr. To måneder;
9. år: 8,50 ± 3,70 studerende over gennemsnittet pr. To måneder;
Et andet mål for spredning er variationskoefficient. Se på her hvordan man beregner det!
Af Amanda Gonçalves
Uddannet i matematik
Kilde: Brasilien skole - https://brasilescola.uol.com.br/matematica/medidas-dispersao-variancia-desvio-padrao.htm