Dispersiematen: variantie en standaarddeviatie

In de studie van statistiek, hebben we enkele strategieën om te controleren of de waarden die in een dataset worden gepresenteerd, verspreid zijn of niet en hoe ver ze uit elkaar liggen. De tools die worden gebruikt om dit mogelijk te maken, zijn geclassificeerd als: verspreidingsmaatregelen en belde variantie en standaarddeviatie. Laten we eens kijken wat elk van hen vertegenwoordigt:

variantie:

  • Gegeven een set gegevens, is variantie een spreidingsmaat die aangeeft hoe ver elke waarde in die set van de centrale (gemiddelde) waarde verwijderd is.

  • Hoe kleiner de variantie, hoe dichter de waarden bij het gemiddelde liggen; maar hoe groter het is, hoe verder de waarden van het gemiddelde verwijderd zijn.

  • Bedenk dat X1, x2, …, xNeezij zijn de Nee elementen van a monster is dat X en het rekenkundig gemiddelde van deze elementen. De berekening van steekproefvariantie Het wordt gegeven door:

    Var. voorbeeld = (X1X)² + (x2X)² + (x3X)² +... + (xNeeX
    n - 1

  • Als we daarentegen de willen berekenen

    populatie variantie, zullen we alle elementen van de populatie beschouwen, niet alleen een steekproef. In dit geval heeft de berekening een klein verschil. Kijk maar:

    Var. bevolking = (X1X)² + (x2X)² + (x3X)² +... + (xNeeX
    Nee

Standaardafwijking:

  • De standaarddeviatie is in staat om de "fout" in een dataset te identificeren, als we een van de verzamelde waarden willen vervangen door het rekenkundig gemiddelde.

  • De standaarddeviatie verschijnt naast het rekenkundig gemiddelde, wat aangeeft hoe "betrouwbaar" deze waarde is. Het wordt als volgt gepresenteerd:

    rekenkundig gemiddelde (X) ± standaarddeviatie (sd)

  • De berekening van de standaarddeviatie gebeurt op basis van de positieve vierkantswortel van de variantie. Daarom:

    dp = √var

Laten we nu de variantie- en standaarddeviatieberekening toepassen in een voorbeeld:

In één school besloot het bestuur te kijken naar het aantal leerlingen dat alle cijfers boven het gemiddelde heeft voor alle vakken. Om het beter te analyseren, besloot directeur Ana om een ​​tabel samen te stellen met het aantal "blauwe" cijfers in een steekproef van vier klassen gedurende een jaar. Zie hieronder de tabel georganiseerd door de directeur:

Voordat de variantie wordt berekend, is het noodzakelijk om de rekenkundig gemiddelde(X) het aantal bovengemiddelde leerlingen in elke klas:

6e jaar X = 5 + 8 + 10 + 7 = 30 = 7,50.
4 4

7e jaar X = 8 + 6 + 6 + 12 = 32 = 8,00.
4 4

8e jaar X = 11 + 9 + 5 + 10 = 35 = 8,75.
4 4

9e jaar X = 8 + 13 + 9 + 4 = 34 = 8,50.
4 4

Om de variantie van het aantal studenten boven het gemiddelde in elke klas te berekenen, gebruiken we a monster, daarom gebruiken we de formule van steekproefvariantie:

Var. voorbeeld = (X1X)² + (x2X)² + (x3X)² +... + (xNeeX
n - 1

Niet stoppen nu... Er is meer na de reclame ;)

6e jaar → Var = (5 – 7,50)² + (8 – 7,50)² + (10 – 7,50)² + (7 – 7,50)²
4 – 1

Var = (– 2,50)² + (0,50)² + (2,50)² + (– 0,50)²
3

Var = 6,25 + 0,25 + 6,25 + 0,25
3

Var = 13,00
3
Var = 4.33

7e jaar → Var = (8 – 8,00)² + (6 – 8,00)² + (6 – 8,00)² + (12 – 8,00)²
4 – 1

Var = (0,00)² + (– 2,00)² + (– 2,00)² + (4,00)²
3

Var = 0,00 + 4,00 + 4,00 + 16,00
3

Var = 24,00
3
Var = 8,00

8e jaar → Var = (11 – 8,75)² + (9 – 8,75)² + (5 – 8,75)² + (10 – 8,75)²
4 – 1

Var = (2,25)² + (0,25)² + (– 3,75)² + (1,25)²
3

Var = 5,06 + 0,06 + 14,06 + 1,56
3

Var = 20,74
3
Var = 6.91

9e jaar → Var = (8 – 8,50)² + (13 – 8,50)² + (9 – 8,50)² + (4 – 8,50)²
4 – 1

Var = (– 0,50)² + (4,50)² + (0,50)² + (– 4,50)²
3

Var = 0,25 + 20,25 + 0,25 + 20,25
3

Var = 41,00
3
Var = 13,66

Zodra de variantie van elke klasse bekend is, gaan we nu de standaarddeviatie berekenen:

6e jaar

dp = √var
dp = √4.33
dp 2,08

7e jaar

dp = √var
dp = √8.00
dp 2,83

8e jaar

dp = √var
dp = √6,91
dp 2,63

9e jaar

dp = √var
dp = √13,66
dp 3,70

Om haar analyse af te ronden, kan de directeur de volgende waarden presenteren die het gemiddelde aantal studenten boven het gemiddelde per onderzochte klas aangeven:

6e jaar: 7,50 ± 2,08 studenten bovengemiddeld per semester;
7e jaar: 8,00 ± 2,83 studenten boven het gemiddelde per twee maanden;
8e jaar: 8,75 ± 2,63 studenten boven het gemiddelde per twee maanden;
9e jaar: 8,50 ± 3,70 studenten boven het gemiddelde per twee maanden;

Een andere spreidingsmaat is de variatiecoëfficiënt. Kijken hier hoe het te berekenen!


Door Amanda Gonçalves
Afgestudeerd in wiskunde

Gemiddeld, Mode en Mediaan

Gemiddeld, Mode en Mediaan

Gemiddelde, modus en mediaan zijn maten van centrale tendens die in statistieken worden gebruikt....

read more
Afbeeldingen: functie, typen, voorbeelden, oefeningen

Afbeeldingen: functie, typen, voorbeelden, oefeningen

U afbeeldingen zijn representaties die de analyse van gegevens vergemakkelijken, die bij het uitv...

read more
Venn-diagrammen in statistieken

Venn-diagrammen in statistieken

De studie en ontwikkeling van statistiek vereisen organisatorische planning, vanwege het grote be...

read more