O szórás a szóródás mértéke, akárcsak a variancia és a variációs együttható. A szórás meghatározásakor a számtani közép körüli tartományt (osztás egy listában szereplő számok összege és a hozzáadott számok száma között), ahol az adatok nagy része koncentrálódik. Minél nagyobb a szórás értéke, annál nagyobb az adatok változékonysága, vagyis annál nagyobb az eltérés a számtani átlagtól.
Olvasd el te is: Módus, átlag és medián – a központi tendenciák fő mérőszámai
Szórás összegzése
- A szórás a változékonyság mértéke.
- A szórás jelölése a kisbetűs görög szigma (σ) vagy az s betű.
- A szórással ellenőrizzük az adatok átlag körüli változékonyságát.
- A szórás meghatároz egy tartományt \(\left[\mu-\sigma,\mu+\sigma\right]\), ahol az adatok nagy része található.
- A szórás kiszámításához meg kell találnunk a variancia négyzetgyökét:
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
Mi az a szórás?
A szórás a a Statisztikában elfogadott diszperziós intézkedés. Használata összefügg variancia értelmezés, ami egyben a diszperzió mértéke is.
A gyakorlatban a szórás meghatároz egy intervallumot, a számtani átlag középpontjában, amelyben az adatok nagy része koncentrálódik. Így minél nagyobb a szórás értéke, annál nagyobb az adatok szabálytalansága (több információ heterogén), és minél kisebb a szórás értéke, annál kisebb az adatok szabálytalansága (további információ homogén).
Hogyan kell kiszámítani a szórást?
Egy adathalmaz szórásának kiszámításához meg kell találnunk a variancia négyzetgyökét. Tehát a szórás kiszámításának képlete a következő
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
- \(x_1,x_2,x_3,\lpontok, x_N\) → érintett adatok.
- μ → az adatok számtani átlaga.
- N → adatmennyiség.
- \( \sum_{i=1}^{N}\left (x_i-\mu\right)^2\ =\ \left (x_1-\mu\right)^2+\left (x_2-\mu\right) )^2+\left (x_3-\mu\right)^2+...+\left (x_N-\mu\right)^2 \)
Az utolsó tétel, amely a radikán számlálójára utal, az egyes adatpontok és a számtani átlag közötti különbség négyzetösszegét jelöli. Kérjük, vegye figyelembe, hogy a szórás mértékegysége megegyezik az adatokkal x1,x2,x3,…,xNem.
Bár ennek a képletnek az írása kissé bonyolult, alkalmazása egyszerűbb és közvetlenebb. Az alábbiakban egy példa látható arra, hogyan használhatja ezt a kifejezést a szórás kiszámításához.
- Példa:
Két hétig a következő hőmérsékleteket regisztrálták egy városban:
Hétköznap |
vasárnap |
Második |
Harmadik |
Negyedik |
Ötödik |
péntek |
szombat |
1. hét |
29°C |
30°C |
31°C |
31,5 °C |
28°C |
28,5 °C |
29°C |
hét 2 |
28,5 °C |
27°C |
28°C |
29°C |
30°C |
28°C |
29°C |
A két hét közül melyikben maradt rendszeresebb a hőmérséklet ebben a városban?
Felbontás:
A hőmérséklet szabályszerűségének elemzéséhez össze kell hasonlítanunk az 1. és 2. héten mért hőmérsékletek szórását.
- Először nézzük meg az 1. hét szórását:
Vegye figyelembe, hogy az átlag μ1 Ez Nem1 ők
\(\mu_1=\frac{29+30+31+31,5+28+28,5+29}{7}\kb. 29,57\)
\(N_1=7 \) (hetente 7 nap)
Ezenkívül ki kell számítanunk az egyes hőmérsékletek és az átlagos hőmérséklet közötti különbség négyzetét.
\(\bal (29-29,57\jobb)^2=0,3249\)
\(\bal (30-29,57\jobb)^2=0,1849\)
\(\bal (31-29,57\jobb)^2=2,0449\)
\(\bal (31,5-29,57\jobb)^2=3,7249\)
\(\bal (28-29,57\jobb)^2=2,4649\)
\(\bal (28,5-29,57\jobb)^2=1,1449\)
\(\bal (29-29,57\jobb)^2=0,3249\)
Az eredményeket összeadva azt kapjuk, hogy a szórás képletében a gyök számlálója a
\(0,3249\ +\ 0,1849\ +2,0449+3,7249+2,4649+1,1449+0,3249\ =\ 10,2143\)
Tehát az 1. hét szórása az
\(\sigma_1=\sqrt{\frac{\sum_{i=1}^{7}\left (x_i-\mu_1\right)^2}{N_1}}=\sqrt{\frac{10,2143} {7}}\ \kb. 1,208\ °C\)
Megjegyzés: Ez az eredmény azt jelenti, hogy az 1. heti hőmérsékletek nagy része a [28,36 °C, 30,77 °C] intervallumban van, azaz \(\left[\mu_1-\sigma_1,\mu_1+\sigma_1\right]\).
- Most nézzük a 2. hét szórását:
Ugyanezt az érvelést követve mi is így vagyunk
\(\mu_2=\frac{28,5+27+28+29+30+28+29}{7}=28,5\)
\(N_2=7\)
\(\bal (28,5-28,5\jobb)^2=0\)
\(\bal (27-28,5\jobb)^2=2,25\)
\(\bal (28-28,5\jobb)^2=0,25\)
\(\bal (29-28,5\jobb)^2=0,25\)
\(\bal (30-28,5\jobb)^2=2,25\)
\(\bal (28-28,5\jobb)^2=0,25\)
\(\bal (29-28,5\jobb)^2=0,25\)
\(0\ +\ 2,25\ +\ 0,25\ +\ 0,25+2,25+0,25+0,25\ =\ 5,5\)
Tehát a 2. heti szórás az
\(\sigma_2=\sqrt{\frac{\sum_{i=1}^{7}\left (x_i-\mu_1\right)^2}{N_2}}=\sqrt{\frac{5,5} {7}}\ \kb0,89\ °C\)
Ez az eredmény azt jelenti, hogy a 2. hét legtöbb hőmérséklete a tartományon belül van \(\left[\mu_2-\sigma_2,\mu_2+\sigma_2\right]\), vagyis a tartomány \(\left[\mu_2-\sigma_2,\mu_2+\sigma_2\right]\).
rájöttem \(\sigma_2, vagyis a 2. heti szórás kisebb, mint az 1. heti szórás. Ezért a 2. hét szabályosabb hőmérsékletet mutatott, mint az 1. hét.
Melyek a szórás típusai?
A szórások típusai az adatszervezés típusához kapcsolódnak. Az előző példában a csoportosítatlan adatok szórásával dolgoztunk. Az egyébként szervezett adatok (például csoportosított adatok) halmazának szórásának kiszámításához módosítania kell a képletet.
Mi a különbség a szórás és a variancia között?
a szórást a négyzetgyök az eltérésből:
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
\(V=\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}\)
Ha egy adathalmaz variabilitását variancia segítségével határozzuk meg, az eredmény az adategységet négyzetre emeli, ami megnehezíti az elemzést. Így a szórás, amelynek mértékegysége megegyezik az adatokkal, egy lehetséges eszköz a variancia eredmény értelmezésére.
Többet tud:Abszolút gyakoriság – hányszor jelent meg ugyanaz a válasz az adatgyűjtés során
Megoldott gyakorlatok a szórással
1. kérdés
(FGV) Egy 10 fős osztályban a tanulók értékelése a következő volt:
6 |
7 |
7 |
8 |
8 |
8 |
8 |
9 |
9 |
10 |
Ennek a listának a szórása kb
A) 0,8.
B) 0,9.
C) 1.1.
D) 1.3.
E) 1.5.
Felbontás:
C alternatíva.
A közlemény szerint N = 10. Ennek a listának az átlaga
\( \mu=\frac{6+7+7+8+8+8+8+9+9+10}{10}=8 \)
Továbbá,
\(\bal (6-8\jobb)^2=4\)
\(\bal (7-8\jobb)^2=1\)
\(\bal (8-8\jobb)^2=0\)
\(\bal (9-8\jobb)^2=1\)
\(\bal (10-8\jobb)^2=4\)
\(4+1+1+0+0+0+0+1+1+4=12\)
Tehát ennek a listának a szórása az
\(\sigma=\sqrt{\frac{\sum_{i=1}^{10}\left (x_i-8\right)^2}{10}}=\sqrt{\frac{12}{10} }\approx1.1\)
2. kérdés
Tekintsük az alábbi állításokat, és értékeljük mindegyiket T (igaz) vagy F (hamis) értékre.
én. Az eltérés négyzetgyöke a szórás.
II. A szórásnak nincs kapcsolata a számtani átlaggal.
III. A szórás és a szórás példák a diszperzió mértékére.
A helyes sorrend fentről lefelé az
A) V-V-F
B) F-F-V
C) F-V-F
D) F-F-F
E) V-F-V
Felbontás:
E alternatíva.
én. Az eltérés négyzetgyöke a szórás. (igaz)
II. A szórásnak nincs kapcsolata a számtani átlaggal. (hamis)
A szórás azt az intervallumot jelöli a számtani átlag körül, amelybe az adatok nagy része esik.
III. A szórás és a szórás példák a diszperzió mértékére. (igaz)
Írta: Maria Luiza Alves Rizzo
Matematika tanár
Forrás: Brazil iskola - https://brasilescola.uol.com.br/matematica/desvio-padrao.htm