Inom statistik finns det flera sätt att analysera en uppsättning data, beroende på behovet i varje fall. Föreställ dig att en tränare skriver ner var och en av sina idrottare vid varje löpträning och sedan observerar att Tidpunkten för några av dina löpare visar stor variation, vilket kan leda till nederlag i en tävling. officiell. I det här fallet är det intressant att tränaren har någon metod för att kontrollera spridningen mellan varje idrottares tider.
Naturligtvis har statistik rätt verktyg för den här tränaren! DE variation är dispersionsmåttsom gör det möjligt att identifiera avståndet för varje idrottares tider från ett genomsnittligt värde. Anta att tränaren i en tabell registrerade tiderna för tre idrottare efter att ha avslutat samma kurs på fem olika dagar:
Innan du beräknar variansen är det nödvändigt att hitta aritmetiskt medelvärde (x) tiderna för varje idrottare. För att göra det gjorde tränaren följande beräkningar:
João → xJ = 63 + 60 + 59 + 55 + 62 = 299 = 59,8 min.
5 5
Peter → xP = 54 + 59 + 60 + 57 + 61 = 291 = 58,2 min.
5 5
ramar → xM = 60 + 63 + 58 + 62 + 55 = 298 = 59,6 min.
5 5
Nu när tränaren känner till varje idrottares genomsnittliga tid kan han använda variansen för att få avståndet för varje lopps perioder från detta genomsnittliga värde. För att beräkna variansen för varje korridor kan följande beräkning utföras:
Var = (Dag 1 - x) ² + (dag 2 - x) ² + (dag 3 - x) ² + (dag 4 - x) ² + (dag 5 - x)²
totalt antal dagar (5)
För varje idrottare beräknade tränaren variansen:
João
Var (J) = (63 – 59,8)² + (60 – 59,8)² + (59 – 59,8)² + (55 – 59,8)² + (62 – 59,8)²
5
Var (J) = 10,24 + 0,04 + 0,64 + 23,04 + 4,84
5
Var (J) = 38,8
5
Var (J) = 7,76 min
Peter
Var (P) = (54 – 58,2)² + (59 – 58,2)² + (60 – 58,2)² + (57 – 58,2)² + (61 – 58,2)²
5
Var (P) = 17,64 + 0,64 + 3,24 + 1,44 + 7,84
5
Var (P) = 30,8
5
Var (P) = 6,16 min
ramar
Var (M) = (60 – 59,6)² + (63 – 59,6)² + (58 – 59,6)² + (62 – 59,6)² + (55 – 59,6)²
5
Var (M) = 0,16 + 11,56 + 2,56 + 5,76 + 21,16
5
Var (M) = 41,2
5
Var (M) = 8,24 min
Enligt variansberäkningarna, idrottaren som presenterar tiderna mer spridda av genomsnittet är Ramar. Redan Peter presenterade tider närmare genomsnittet än andra löpare.
Vad sägs om att vi syntetiserar allt vi har sett om varians med detta exempel?
Med en uppsättning data är varians ett mått på spridning som visar hur långt varje värde i den uppsättningen är från det centrala (medelvärde);
Ju mindre varians, desto närmare är värdena medelvärdet. Ju större det är, desto längre är värdena från medelvärdet.
Som i detta exempel beräknar vi variansen av Allt de dagar då idrottare tränade under övervakning av tränaren säger vi att vi beräknade populationsvarians. Föreställ dig nu att tränaren vill analysera tiderna för dessa idrottare under ett år. Det kommer att bli mycket data, eller hur? I det här fallet skulle det vara lämpligt för forskaren att bara välja några få tidsposter, ett slags prov. Denna beräkning skulle vara av en provvarians. Den enda skillnaden mellan provvariansen och beräkningen som vi utförde är att delaren är antalet dagar subtraherade från 1:
Var. prov = (dag till - x) ² + (dag b - x) ² + (dag c - x)² +... + (dag n - x)²
(totalt antal dagar) - 1
Av Amanda Gonçalves
Examen i matematik