Innen Statistikk er det flere måter å analysere et datasett på, avhengig av behovet i hvert tilfelle. Tenk deg at en trener skriver ned tiden som hver av idrettsutøverne bruker på hver løpetrening, og deretter observerer at Tidspunktet for noen av løperne dine viser betydelig variasjon, noe som kan føre til tap i en konkurranse. offisielt. I dette tilfellet er det interessant at treneren har en eller annen metode for å kontrollere spredningen mellom tidene til hver utøver.
Statistikk har selvfølgelig det rette verktøyet for denne treneren! DE forskjell er spredningstiltaksom gjør det mulig å identifisere avstanden der hver idrettsutøver er fra en gjennomsnittsverdi. Anta at treneren registrerte tidene til tre utøvere i en tabell etter å ha fullført samme løp på fem forskjellige dager:

Før du beregner avviket, er det nødvendig å finne aritmetisk gjennomsnitt (x) tiden til hver idrettsutøver. For å gjøre dette gjorde treneren følgende beregninger:
João → xJ = 63 + 60 + 59 + 55 + 62 = 299 = 59,8 min.
5 5
Peter → xP = 54 + 59 + 60 + 57 + 61 = 291 = 58,2 min.
5 5
rammer → xM = 60 + 63 + 58 + 62 + 55 = 298 = 59,6 min.
5 5
Nå som treneren kjenner hver idrettsutøveres gjennomsnittstid, kan han bruke avviket for å oppnå avstanden til hvert løps perioder fra denne gjennomsnittsverdien. For å beregne variansen til hver korridor, kan følgende beregning utføres:
Var = (Dag 1 - x) ² + (dag 2 - x) ² + (dag 3 - x) ² + (dag 4 - x) ² + (dag 5 - x)²
totalt antall dager (5)
For hver idrettsutøver beregnet treneren variansen:
João
Var (J) = (63 – 59,8)² + (60 – 59,8)² + (59 – 59,8)² + (55 – 59,8)² + (62 – 59,8)²
5
Ikke stopp nå... Det er mer etter annonseringen;)
Var (J) = 10,24 + 0,04 + 0,64 + 23,04 + 4,84
5
Var (J) = 38,8
5
Var (J) = 7,76 min
Peter
Var (P) = (54 – 58,2)² + (59 – 58,2)² + (60 – 58,2)² + (57 – 58,2)² + (61 – 58,2)²
5
Var (P) = 17,64 + 0,64 + 3,24 + 1,44 + 7,84
5
Var (P) = 30,8
5
Var (P) = 6,16 min
rammer
Var (M) = (60 – 59,6)² + (63 – 59,6)² + (58 – 59,6)² + (62 – 59,6)² + (55 – 59,6)²
5
Var (M) = 0,16 + 11,56 + 2,56 + 5,76 + 21,16
5
Var (M) = 41,2
5
Var (M) = 8,24 min
I følge variansberegningene, utøveren som presenterer tidene mer spredt av gjennomsnittet er Rammer. Allerede Peter presenterte tider nærmere gjennomsnittet enn de andre løperne.
Hva med at vi syntetiserer alt vi har sett om varians med dette eksemplet?
Gitt et sett med data, er varians et mål for spredning som viser hvor langt hver verdi i det settet er fra den sentrale (gjennomsnittlige) verdien;
Jo mindre avvik, jo nærmere verdiene er gjennomsnittet. På samme måte, jo større det er, jo lenger er verdiene fra gjennomsnittet.
Som i dette eksemplet beregner vi variansen av alle dagene da idrettsutøvere trente under veiledning av treneren, sier vi at vi har beregnet populasjonsavvik. Tenk deg nå at treneren ønsker å analysere disse idrettsutøvernes tid i løpet av et år. Det blir mye data, ikke sant? I dette tilfellet vil det være aktuelt for forskeren å velge bare noen få tidsregistreringer, et slags utvalg. Denne beregningen ville være av en prøvevarians. Den eneste forskjellen mellom prøvevariansen og beregningen vi utførte er at divisoren er antall dager trukket fra 1:
Var. prøve = (dag til - x) ² + (dag b - x) ² + (dag c - x)² +... + (dag n - x)²
(totalt antall dager) - 1
Av Amanda Gonçalves
Eksamen i matematikk