Standaarddeviatie is een maat die de mate van spreiding van een dataset uitdrukt. Dat wil zeggen, de standaarddeviatie geeft aan hoe uniform een dataset is. Hoe dichter bij 0 de standaarddeviatie, hoe homogener de gegevens.
Hoe de standaarddeviatie te berekenen?
De standaarddeviatie (SD) wordt berekend met de volgende formule:
Wezen,
∑: somsymbool. Geeft aan dat we alle termen moeten optellen, van de eerste positie (i=1) tot positie n
Xik: waarde in positie ik in de dataset
MDE: rekenkundig gemiddelde van de gegevens
n: hoeveelheid data
Voorbeeld
In een roeiteam hebben atleten de volgende lengtes: 1,55 m; 1.70m en 1.80m. Wat is het gemiddelde en de standaarddeviatie van de lengte van dit team?
Berekening van het gemiddelde, waarbij n = 3
Standaarddeviatieberekening
Lees ook over Dispersie maatregelen.
Variantie en standaarddeviatie
Variantie is een maatstaf voor spreiding en wordt ook gebruikt om uit te drukken hoe ver een dataset afwijkt van het gemiddelde.
Standaarddeviatie (SD) wordt gedefinieerd als de vierkantswortel van de variantie (V).
Het voordeel van het gebruik van standaarddeviatie in plaats van variantie is dat de standaarddeviatie wordt uitgedrukt in dezelfde eenheid als de gegevens, waardoor vergelijking gemakkelijker wordt.
variantie formule
meer weten over Variantie en standaarddeviatie.
Opgelost Oefeningen
1) ENEM - 2016
De procedure voor snel afvallen is gebruikelijk bij vechtsporters. Om deel te nemen aan een toernooi, werden vier atleten uit de 66 kg-categorie, vedergewicht, onderworpen aan uitgebalanceerde diëten en fysieke activiteiten. Ze voerden drie "wegingen" uit voor de start van het toernooi. Volgens het toernooireglement moet het eerste gevecht plaatsvinden tussen de meest regelmatige atleet en de minst regelmatige qua "gewichten". Informatie op basis van het gewicht van atleten staat op het bord.
Na de drie "wegingen" lieten de organisatoren van het toernooi de atleten weten wie van hen het eerste gevecht tegen elkaar zou opnemen.
Het eerste gevecht was tussen atleten
a) I en III.
b) I en IV.
c) II en III.
d) II en IV.
e) III en IV
Om de meest regelmatige sporters te vinden, gebruiken we de standaarddeviatie, omdat deze maat aangeeft hoeveel de waarde afweek van het gemiddelde.
Atleet III is degene met de kleinste standaarddeviatie (4,08), dus het is de meest regelmatige. De minst regelmatige is atleet II met de hoogste standaarddeviatie (8,49).
Correct alternatief c: II en III
2) ENEM – 2012
Een producent van geïrrigeerde koffie in Minas Gerais ontving een statistisch adviesrapport, inclusief, onder andere, de standaarddeviatie van de producties van een gewas van de percelen van zijn eigendom. De percelen hebben dezelfde oppervlakte van 30.000 m2 en de verkregen waarde voor de standaarddeviatie was 90 kg/plot. De producent moet de informatie over de productie en de afwijking van deze producties overleggen in zakken van 60 kg per hectare (10 000 m²).2). De variantie van de productie van de percelen uitgedrukt in (zakken/hectare)2 é:
a) 20.25
b) 4.50
c) 0,71
d) 0,50
e) 0,25.
Hoe de variantie zou moeten zijn (zakken/hectare)2, moeten we de meeteenheden transformeren.
Elk perceel is 30.000 m2 en elke hectare is 10.000 m2, dus we moeten de standaarddeviatie delen door 3. We vonden de waarde van 30 kg/hectare. Aangezien de variantie wordt gegeven in zakken van 60 kg per hectare, hebben we dat de standaarddeviatie 0,5 zakken/hectare zal zijn. De variantie zal gelijk zijn aan (0,5)2 .
Correct alternatief e: 0.25
3) ENEM – 2010
Marco en Paulo werden ingedeeld in een wedstrijd. Voor classificatie in de competitie moet de kandidaat een rekenkundig gemiddelde behalen dat gelijk is aan of groter is dan 14. In het geval van een gelijke stand in het gemiddelde, zou de gelijke stand in het voordeel zijn van een meer regelmatige score. De onderstaande tabel toont de punten behaald in de wiskunde-, Portugees- en algemene kennistests, het gemiddelde, de mediaan en de standaarddeviatie van de twee kandidaten.
Kandidaatgegevens in de competitie
De kandidaat met de meest regelmatige score, dus de hoogst gerangschikte in de competitie, is
a) Marco, omdat het gemiddelde en de mediaan hetzelfde zijn.
b) Marco, omdat deze een lagere standaarddeviatie had.
c) Paulo, aangezien hij de hoogste score in de tabel behaalde, 19 in het Portugees.
d) Paulo, aangezien hij de hoogste mediaan behaalde.
e) Paulo, omdat hij een hogere standaarddeviatie had.
Aangezien het gemiddelde van Marco en Paulo gelijk was, wordt het gelijkspel gedaan met de kleinste waarde van de standaarddeviatie, omdat dit een meer regelmatige score aangeeft.
Correct alternatief b: Marco, omdat deze de laagste standaarddeviatie kreeg.
Zie voor meer informatie ook:
- Gemiddelde
- Geometrisch gemiddelde
- Gemiddeld, Mode en Mediaan
- statistiek
- Statistieken - Oefeningen
- Soorten afbeeldingen