O standardafvigelse er et mål for spredning, ligesom varians og variationskoefficient. Når vi bestemmer standardafvigelsen, kan vi etablere et interval omkring det aritmetiske middelværdi (division mellem summen af tal i en liste og antallet af tilføjede tal), hvor de fleste data er koncentreret. Jo større værdien af standardafvigelsen er, jo større er variabiliteten af dataene, det vil sige, jo større er afvigelsen fra det aritmetiske gennemsnit.
Læs også: Mode, middelværdi og median - de vigtigste mål for centrale tendenser
Standardafvigelsesoversigt
- Standardafvigelse er et mål for variabilitet.
- Standardafvigelsesnotation er det små græske bogstav sigma (σ) eller bogstavet s.
- Standardafvigelsen bruges til at verificere variabiliteten af data omkring middelværdien.
- Standardafvigelsen bestemmer et interval \(\venstre[\mu-\sigma,\mu+\sigma\højre]\), hvor de fleste data er placeret.
- For at beregne standardafvigelsen skal vi finde kvadratroden af variansen:
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\venstre (x_i-\mu\right)^2}{N}}\)
Hvad er standardafvigelse?
Standardafvigelsen er en spredningsforanstaltning vedtaget i Statistik. Dens brug er knyttet til varians fortolkning, som også er et mål for spredning.
I praksis er standardafvigelsen bestemmer et interval, centreret om det aritmetiske gennemsnit, hvori de fleste data er koncentreret. Jo større værdien af standardafvigelsen er, jo større er uregelmæssigheden af dataene (mere information heterogen), og jo mindre værdien af standardafvigelsen er, jo mindre er uregelmæssigheden af dataene (mere information homogen).
Hvordan beregner man standardafvigelsen?
For at beregne standardafvigelsen for et datasæt, vi skal finde kvadratroden af variansen. Så formlen til beregning af standardafvigelsen er
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\venstre (x_i-\mu\right)^2}{N}}\)
- \(x_1,x_2,x_3,\ldots, x_N\) → involverede data.
- μ → aritmetisk middelværdi af dataene.
- N → mængde af data.
- \( \sum_{i=1}^{N}\venstre (x_i-\mu\right)^2\ =\ \venstre (x_1-\mu\right)^2+\venstre (x_2-\mu\right) )^2+\venstre (x_3-\mu\højre)^2+...+\venstre (x_N-\mu\højre)^2 \)
Det sidste punkt, som refererer til tælleren for radikanden, angiver summen af kvadrater af forskellen mellem hvert datapunkt og det aritmetiske middelværdi. Bemærk, at måleenheden for standardafvigelsen er den samme måleenhed som dataene x1,x2,x3,…,xIngen.
Selvom skrivningen af denne formel er lidt kompleks, er dens anvendelse enklere og mere direkte. Nedenfor er et eksempel på, hvordan man bruger dette udtryk til at beregne standardafvigelsen.
- Eksempel:
I to uger blev følgende temperaturer registreret i en by:
Uge/dag |
Søndag |
Anden |
Tredje |
Fjerde |
Femte |
Fredag |
lørdag |
uge 1 |
29°C |
30°C |
31°C |
31,5°C |
28°C |
28,5°C |
29°C |
uge 2 |
28,5°C |
27°C |
28°C |
29°C |
30°C |
28°C |
29°C |
I hvilken af de to uger forblev temperaturen mere regelmæssig i denne by?
Løsning:
For at analysere temperaturregulariteten skal vi sammenligne standardafvigelserne for temperaturerne registreret i uge 1 og 2.
- Lad os først se på standardafvigelsen for uge 1:
Bemærk, at gennemsnittet μ1 det er Ingen1 de er
\(\mu_1=\frac{29+30+31+31.5+28+28.5+29}{7}\ca.29.57\)
\(N_1=7 \) (7 dage om ugen)
Vi skal også beregne kvadratet af forskellen mellem hver temperatur og gennemsnitstemperaturen.
\(\venstre (29-29,57\højre)^2=0,3249\)
\(\venstre (30-29.57\højre)^2=0.1849\)
\(\venstre (31-29.57\højre)^2=2.0449\)
\(\venstre (31,5-29,57\højre)^2=3,7249\)
\(\venstre (28-29.57\højre)^2=2.4649\)
\(\venstre (28,5-29,57\højre)^2=1,1449\)
\(\venstre (29-29,57\højre)^2=0,3249\)
Tilføjelse af resultaterne, har vi, at tælleren for radicanden i standardafvigelsesformlen er
\(0,3249\ +\ 0,1849\ +2,0449+3,7249+2,4649+1,1449+0,3249\ =\ 10,2143\)
Så uge 1 standardafvigelsen er
\(\sigma_1=\sqrt{\frac{\sum_{i=1}^{7}\venstre (x_i-\mu_1\right)^2}{N_1}}=\sqrt{\frac{10,2143} {7}}\ \ca. 1,208\ °C\)
Bemærk: Dette resultat betyder, at det meste af uge 1 temperaturer er i intervallet [28,36 °C, 30,77 °C], det vil sige intervallet \(\venstre[\mu_1-\sigma_1,\mu_1+\sigma_1\højre]\).
- Lad os nu se på uge 2 standardafvigelsen:
Efter samme ræsonnement har vi
\(\mu_2=\frac{28,5+27+28+29+30+28+29}{7}=28,5\)
\(N_2=7\)
\(\venstre (28,5-28,5\højre)^2=0\)
\(\venstre (27-28,5\højre)^2=2,25\)
\(\venstre (28-28,5\højre)^2=0,25\)
\(\venstre (29-28,5\højre)^2=0,25\)
\(\venstre (30-28,5\højre)^2=2,25\)
\(\venstre (28-28,5\højre)^2=0,25\)
\(\venstre (29-28,5\højre)^2=0,25\)
\(0\ +\ 2,25\ +\ 0,25\ +\ 0,25+2,25+0,25+0,25\ =\ 5,5\)
Så uge 2 standardafvigelse er
\(\sigma_2=\sqrt{\frac{\sum_{i=1}^{7}\venstre (x_i-\mu_1\right)^2}{N_2}}=\sqrt{\frac{5,5} {7}}\ \ca.0,89\ °C\)
Dette resultat betyder, at de fleste uge 2 temperaturer er i området \(\venstre[\mu_2-\sigma_2,\mu_2+\sigma_2\højre]\), altså rækkevidden \(\venstre[\mu_2-\sigma_2,\mu_2+\sigma_2\højre]\).
indse det \(\sigma_2, det vil sige, at uge 2 standardafvigelsen er mindre end uge 1 standardafvigelsen. Derfor præsenterede uge 2 mere regulære temperaturer end uge 1.
Hvilke typer standardafvigelse er der?
Typerne af standardafvigelse er relateret til typen af dataorganisation. I det foregående eksempel arbejdede vi med standardafvigelsen for ikke-grupperede data. For at beregne standardafvigelsen for et sæt af ellers organiserede data (f.eks. grupperede data), skal du justere formlen.
Hvad er forskellene mellem standardafvigelse og varians?
standardafvigelsen er kvadratroden af variansen:
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\venstre (x_i-\mu\right)^2}{N}}\)
\(V=\frac{\sum_{i=1}^{N}\venstre (x_i-\mu\right)^2}{N}\)
Når du bruger varians til at bestemme variabiliteten af et datasæt, har resultatet dataenheden kvadreret, hvilket gør dets analyse vanskelig. Standardafvigelsen, som har samme enhed som dataene, er således et muligt værktøj til at fortolke variansresultatet.
Få mere at vide:Absolut frekvens — antallet af gange, det samme svar dukkede op under dataindsamlingen
Løste øvelser om standardafvigelse
Spørgsmål 1
(FGV) I en klasse på 10 elever var elevernes karakterer i en vurdering:
6 |
7 |
7 |
8 |
8 |
8 |
8 |
9 |
9 |
10 |
Standardafvigelsen for denne liste er ca
A) 0,8.
B) 0,9.
C) 1.1.
D) 1.3.
E) 1,5.
Løsning:
Alternativ C.
Ifølge udtalelsen N = 10. Gennemsnittet af denne liste er
\( \mu=\frac{6+7+7+8+8+8+8+9+9+10}{10}=8 \)
Desuden,
\(\venstre (6-8\højre)^2=4\)
\(\venstre (7-8\højre)^2=1\)
\(\venstre (8-8\højre)^2=0\)
\(\venstre (9-8\højre)^2=1\)
\(\venstre (10-8\højre)^2=4\)
\(4+1+1+0+0+0+0+1+1+4=12\)
Så standardafvigelsen for denne liste er
\(\sigma=\sqrt{\frac{\sum_{i=1}^{10}\left (x_i-8\right)^2}{10}}=\sqrt{\frac{12}{10} }\ca1.1\)
spørgsmål 2
Overvej nedenstående udsagn, og bedøm hver enkelt som T (sandt) eller F (falsk).
jeg. Kvadratroden af variansen er standardafvigelsen.
II. Standardafvigelsen har ingen sammenhæng med det aritmetiske gennemsnit.
III. Varians og standardafvigelse er eksempler på spredningsmål.
Den korrekte rækkefølge, fra top til bund, er
A) V-V-F
B) F-F-V
C) F-V-F
D) F-F-F
E) V-F-V
Løsning:
E alternativ.
jeg. Kvadratroden af variansen er standardafvigelsen. (rigtigt)
II. Standardafvigelsen har ingen sammenhæng med det aritmetiske gennemsnit. (falsk)
Standardafvigelsen angiver et interval omkring det aritmetiske middelværdi, hvori de fleste data falder.
III. Varians og standardafvigelse er eksempler på spredningsmål. (rigtigt)
Af Maria Luiza Alves Rizzo
Matematiklærer
Kilde: Brasilien skole - https://brasilescola.uol.com.br/matematica/desvio-padrao.htm