Statistika: načela, važnost, primjeri

THE statistički je polje matematike koje navodi činjenice i brojke u kojem postoji skup metoda koje nam omogućuju prikupljanje podataka i njihovu analizu, omogućujući tako njihovu interpretaciju. Statistika je podijeljena u dva dijela: opisni i inferencijalni. Opisnu statistiku karakterizira organizacija, analiza i prezentacija podataka, dok je inferencijalna statistika kao karakteristika proučavanje uzorka određene populacije i na temelju nje izvođenje analiza i prezentacija Kocke.

Pročitajte i vi: Koja je granica pogreške ankete?

Načela statistike

Dalje ćemo vidjeti glavne koncepte i načela statistike. Na temelju njih bit će moguće definirati sofisticiranije koncepte.

  • stanovništva ili statistički svemir

Stanovništvo ili statistički svemir je skup koji čine svi elementi koji sudjeluju u određenoj istraženoj temi.

Primjeri statističkog svemira

a) U gradu svi stanovnici pripadaju statističkom svemiru.

b) Na šestostranoj umrli, stanovništvo se daje brojem lica.

{1, 2, 3, 4, 5, 6}

  • Statistički podaci

Statistički podaci su a element koji pripada populaciji u cjelini, očito ti podaci moraju biti povezani s temom istraživanja.

Populacija

Statistički podaci

šestostrane kockice

4

Brazilski prvaci u brdskim biciklima

Henrique Avancini

  • Uzorak

Uzorak nazivamo podskup formiran na temelju statističkog svemira. Uzorak se koristi kada je populacija vrlo velika ili beskonačna. U slučajevima kada je prikupljanje svih podataka iz statističkog svemira nemoguće iz financijskih ili logističkih razloga, također je potrebno koristiti uzorke.

Izbor uzorka izuzetno je važan za anketu i on mora pouzdano predstavljati populaciju. Klasičan primjer upotrebe uzoraka u anketi je provođenje demografski popis naše zemlje.

  • Promjenjiva

U statistikama je varijabla predmet proučavanja, tj. tema koju istraživanje želi proučiti. Na primjer, pri proučavanju karakteristika grada, broj stanovnika može biti varijabla, kao i količina kiše u određenom razdoblju ili čak broj autobusa za prijevoz javnost. Imajte na umu da koncept varijable u statistici ovisi o kontekstu istraživanja.

Organizacija podataka u statistici odvija se u faze, kao u bilo kojem organizacijskom procesu. U početku se odabire tema koja se istražuje, zatim se promišlja način prikupljanja podataka o istraživanju, a treći korak je provođenje prikupljanja. Nakon završetka ovog posljednjeg koraka provodi se analiza prikupljenog i na temelju tumačenja traže se rezultati. Sada ćemo vidjeti neke važne i potrebne koncepte za organizaciju podataka.

Ne zaustavljaj se sada... Ima još toga nakon oglašavanja;)

  • uloga

U slučajevima kada se podaci mogu predstaviti brojevima, odnosno kada je varijabla kvantitativna, popis za organizacija tih podataka. Spisak može biti uzlazni ili silazni. Ako varijabla nije kvantitativna, odnosno ako je kvalitativna, popis nije moguće upotrijebiti, na primjer, ako su podaci osjećaji prema određenom proizvodu.

Primjer

U učionici su sakupljane visine učenika u metrima. Oni su: 1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.

Kako se popis može organizirati uzlazno ili silazno, slijedi da:

rol: (1,60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}

Imajte na umu da je s već sastavljenim valjkom moguće lakše pronaći podatke.

  • Tablica raspodjele frekvencija

U slučajevima kada na popisu ima mnogo elemenata i mnogo ponavljanja podataka, popis postaje zastario, jer je organizacija tih podataka nepraktična. U tim slučajevima tablice i distribucija frekvencije služe kao izvrsno organizacijsko sredstvo.

U tablici raspodjele apsolutna frekvencija, moramo staviti učestalost pojavljivanja svakog podatka, odnosno koliko se puta pojavljuje.

Izgradimo tablicu distribucije za apsolutna frekvencija dob učenika u određenom razredu u godinama.

Apsolutna frekvencijska raspodjela

Dob

Učestalost (F)

8

2

9

12

10

12

11

14

12

1

Ukupno (FT)

41

Iz tablice možemo dobiti sljedeće podatke: u razredu imamo 2 učenika u dobi od 8, 12 godina 9-godišnjaci i još 12 desetogodišnjaci i tako dalje, dostigavši ​​ukupno 41 studenti. U tablici raspodjele akumulirane frekvencije, moramo dodati frekvenciju iz prethodnog retka (u tablici apsolutne distribucije frekvencije).

Izgradimo kumulativnu tablicu raspodjele frekvencija za uzraste iste klase kao u prethodnom primjeru, pogledajte:

Raspodjela akumulirane frekvencije

Dob

Učestalost (F)

8

2

9

14

10

26

11

40

12

41

Ukupno (FT)

41

U tablici od raspodjela relativnih frekvencija, koristi se postotak u kojem se pojavljuju pojedini podaci. Opet ćemo raditi izračune na temelju tablice apsolutne distribucije frekvencije. Znamo da 41 odgovara 100% učenika u razredu, pa da bismo utvrdili postotak svake dobi, samo podijelimo učestalost dobi s 41 i pomnožimo rezultat sa 100, tako da ga možemo zapisati kao postotak.

2: 41 = 0,048 · 100 → 4,8%

12: 41 = 0,292 · 100 → 29,2%

12: 41 = 0,292 · 100 → 29,2%

14: 41 = 0,341 · 100 → 34,1%

1: 41 = 0,024 · 100 → 2,4%

Relativna frekvencijska raspodjela

Dob

Učestalost (F)

8

4,8%

9

29,2%

10

29,2%

11

34,1%

12

2,4%

Ukupno (FT)

100%

Pročitajte i vi:Primjena istatistika: ffrekvencija Theapsolutni i frelativna frekvencija

  • Nastava

U slučajevima kada je varijabla kontinuirana, odnosno kada ima nekoliko vrijednosti, potrebno ih je grupirati u stvarni intervali. U statistikama se ti intervali nazivaju klasama..

Za izgradnju tablice raspodjela frekvencije u nastavi, intervale moramo staviti u lijevi stupac s odgovarajućim naslovom, a u desni stupac stavite apsolutnu frekvenciju svakog od intervala, odnosno koliko elemenata pripada svakom od njih njihova.

Primjer

Visina učenika u 3. godini srednje škole u školi.

Raspodjela frekvencije u nastavi

visina (metri)

Apsolutna frekvencija (F)

[1,40; 1,50[

1

[1,50; 1,60[

4

[1,60; 1,70[

8

[1,70; 1,80[

2

[1,80; 1,90[

1

Ukupno (FT)

16

Analizirajući tablicu raspodjele frekvencija u razredima, možemo vidjeti da u razredu treće godine imamo 1 učenika koja ima visinu između 1,40 m i 1,50 m, baš kao što imamo 4 učenika visine između 1,50 i 1,60 m, i tako sukcesivno. Također možemo primijetiti da učenici imaju visinu između 1,40 m i 1,90 m, razlika između ovih mjerenja, odnosno između najviše i najniže visine uzorka, naziva se amplituda.

Razlika između gornje i donje granice klase naziva se razredna širina, dakle, drugi, koji ima 4 učenika s visinama između 1,50 metara (uključeno) i 1,60 metara (nije uključeno), ima domet:

1,60 – 1,50

0,10 metara

Pogledajte i: Mjere disperzije: amplituda i odstupanje

mjerenja položaja

Mjere položaja koriste se u slučajevima kada je moguće sastaviti numerički svitak s podacima ili tablicom frekvencija. Ova mjerenja pokazuju položaj elemenata u odnosu na popis. Tri glavne mjere položaja su:

  • Prosječno

Razmotrite popis s elementima (a1, a2, a3, a4,..., TheNe), aritmetička sredina ovih n elemenata dana je:

Primjer

U plesnoj skupini dob članova je prikupljena i predstavljena na sljedećem popisu:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Odredimo prosječnu dob članova ove plesne skupine.

Prema formuli, moramo dodati sve elemente i podijeliti ovaj rezultat s brojem elemenata na popisu, ovako:

Stoga je prosječna dob članova 22 godine.

Da biste saznali više o ovoj mjeri položaja, pročitajte naš tekst: Méjutro.

  • medijan

Medijanu daje središnji element popisa koji ima neparan broj elemenata. Ako popis ima paran broj elemenata, moramo uzeti u obzir dva središnja elementa i izračunati aritmetičku sredinu između njih.

Primjer

Razmotrite sljedeći popis.

(2, 2, 3, 3,4, 5, 6, 7, 9)

Imajte na umu da element 4 dijeli ulogu na dva jednaka dijela, pa je tako središnji element.

Primjer

Izračunajte srednju dob plesne skupine.

Ne zaboravite da popis dobnih skupina za ovu plesnu skupinu daje:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Imajte na umu da je broj elemenata na ovom popisu jednak 10, pa popis nije moguće podijeliti na dva jednaka dijela. Dakle, moramo uzeti dva središnja elementa i izvesti aritmetičku sredinu tih vrijednosti.

Pogledajte više detalja o ovoj mjeri položaja u našem tekstu: Medijanski.

  • Moda

Modu ćemo nazvati elementom uloge koji ima najveću frekvenciju, odnosno elementom koji se u njoj najviše pojavljuje.

Primjer

Odredimo modu dobne skupine plesne skupine.

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Element koji se najviše pojavljuje je 21, pa je način jednak 21.

Mjere raspršivanja

Mjere disperzije su koristi se u slučajevima kada prosjek više nije dovoljan. Primjerice, zamislite da su dva automobila u prosjeku prešla 40 000 kilometara. Samo sa znanjem o prosjecima možemo reći da su dva automobila prepješačila svaki odredivi kilometar, zar ne?

Međutim, zamislite da je jedan od automobila prešao 79 000 kilometara, a drugi 1000 kilometara, imajte na umu da samo s informacijama o prosjeku nije moguće davati izjave s preciznost.

Na mjere disperzije reći će nam koliko su elementi numeričkog popisa udaljeni od aritmetičke sredine. Imamo dvije važne mjere raspršivanja:

  • Varijansa (σ2)

Nazovimo aritmetičku sredinu kvadrata razlike između svakog elementa u kolutu i aritmetičku sredinu tog koluta kao varijansu. Varijansu predstavljaju: σ2.

Razmotrimo popis (x1, x2, x3, …, xNe) i da ima aritmetičku sredinux. Varijansu daju:

  • Standardno odstupanje (σ)

Standardno odstupanje dato je korijenom varijance, govori nam koliko je element raspršen u odnosu na srednju vrijednost. Standardno odstupanje označava se s σ.

Primjer

Odredite standardno odstupanje skupa podataka (4, 7, 10). Imajte na umu da je za to potrebno prvo odrediti varijansu, a da je za to potrebno prvo izračunati prosjek tih podataka.

Zamjenjujući ove podatke u formuli varijance, imamo:

Da bismo odredili standardno odstupanje, moramo izvući korijen varijance.

Čitaj više: Mjere disperzije: varijanca i standardna devijacija

Čemu služi statistika?

Vidjeli smo da je statistika povezana s Problemi s brojanjem ili organizacijom podataka. Uz to, ima važnu ulogu u razvoju alata koji omogućavaju proces organiziranja podataka, poput tablica. Statistika je također prisutna u razna područja znanosti, na temelju prikupljanja i obrade podataka, moguće je raditi s matematičkim modelima koji omogućuju daljnji razvoj na proučavanom području. Neka područja u kojima je statistika temeljna: ekonomija, meteorologija, marketing, sport, sociologija i geoznanosti.

Na primjer, u meteorologiji se podaci prikupljaju u određenom razdoblju, nakon što se organiziraju, obrađuju se, i tako, s na temelju njih je izgrađen matematički model koji nam omogućava da s većim stupnjem tvrdimo o klimi prethodnih dana pouzdanost. Statistika je grana znanosti koja nam omogućuje davanje izjava s određenim stupnjem pouzdanosti, ali nikada sa 100% sigurnošću.

Statističke podjele

Statistika je podijeljena u dva dijela, deskriptivni i inferencijalni. Prva se odnosi na brojanje elemenata koji su uključeni u istraživanje, ti se elementi broje jedan po jedan. Na Opisne statistike, naši glavni alati su mjere položaja, kao što su srednja vrijednost, medijan i način rada, kao i mjere disperzije poput varijance i standardne devijacije, imamo i tablice učestalosti i grafika.

Još uvijek u opisnoj statistici imamo vrlo dobro definiranu metodologiju za prezentacija podataka sa znatnim stupnjem pouzdanosti koja prolazi kroz organizaciju i prikupljanje, sažetak, tumačenje i predstavljanje i, na kraju, analizu podataka. Klasičan primjer upotrebe deskriptivne statistike javlja se u popisu stanovništva (svakih 10 godina) od strane Brazilskog instituta za geografiju i statistiku (IBGE).

THE inferencijalna statistika, zauzvrat, karakterizira se ne prikupljanjem podataka od elemenata populacije jedan po jedan, već provođenjem analiza uzorka ove populacije, donošenje zaključaka o njoj. U inferencijalnoj statistici treba biti oprezan pri odabiru uzorka, jer on mora vrlo dobro predstavljati populaciju. Neki se početni rezultati, poput prosjeka, u inferencijalnoj statistici koja se naziva nada, izvode na temelju znanja o opisnoj statistici.

Inferencijalna statistika koristi se, na primjer, u izbornim anketama. Odabire se uzorak populacije, na način koji ga predstavlja, i time se provodi istraživanje. Kad biramo uzorak koji ovu populaciju ne predstavlja dobro, kažemo da je istraživanje pristran a samim tim i nepouzdan.

Područje matematike odgovorno za brojanje i organiziranje podataka.
Područje matematike odgovorno za brojanje i organiziranje podataka.

riješene vježbe

Pitanje 1 - (U. F. Juiz de Fora - MG) Učitelj fizike primijenio je test, vrijedan 100 bodova, na svojih 22 učenika i kao rezultat dobio raspodjelu ocjena, kako se vidi u sljedećoj tablici:

40

20

10

20

70

60

90

80

30

50

50

70

50

20

50

50

10

40

30

20

60

60

Izvršite sljedeće obrade podataka:

a) Napišite popis ovih bilješki.

b) Odredite relativnu učestalost najviše note.

Razlučivost

a) Da bismo napravili popis ovih bilješki, moramo ih napisati uzlazno ili silazno. Dakle, moramo:

10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90

b) Gledajući svitak, možemo vidjeti da je najviša nota bila jednaka 90 i da je njezina apsolutna učestalost jednaka 1, jer se pojavljuje samo jednom. Da bismo odredili relativnu frekvenciju, apsolutnu frekvenciju te note moramo podijeliti s ukupnom frekvencijom, u ovom slučaju jednakom 22. Tako:

relativna frekvencija

Da bismo taj broj proslijedili u postocima, moramo ga pomnožiti sa 100.

0,045 · 100

4,5%

Pitanje 2 - (Enem) Nakon valjanja kockaste matrice s licima brojevima od 1 do 6, 10 uzastopnih puta i zabilježite broj dobiven u svakom potezu, sljedeću tablicu raspodjele frekvencije.

Dobiveni broj

Frekvencija

1

4

2

1

4

2

5

2

6

1

Srednja vrijednost, medijan i način ove distribucije frekvencije su:

a) 3, 2 i 1

b) 3, 3 i 1

c) 3, 4 i 2

d) 5, 4 i 2

e) 6, 2 i 4

Razlučivost

Alternativa B.

Da bismo odredili srednju vrijednost, imajte na umu da se dobiveni brojevi ponavljaju, pa ćemo upotrijebiti ponderiranu aritmetičku sredinu.

Da bismo odredili medijan, moramo raspored rasporediti uzlazno ili silazno. Ne zaboravite da je učestalost broj prikaza lica.

1, 1, 1, 1, 2, 4, 4, 5, 5, 6

Kako je broj elemenata u popisu paran, moramo izračunati aritmetičku sredinu središnjih elemenata koji dijele popis na pola kako bismo odredili medijan, ovako:

Način rada daje element koji se najviše pojavljuje, odnosno ima najveću frekvenciju, pa imamo da je način jednak 1.

Dakle, srednja vrijednost, medijan i način su jednaki:

3, 3 i 1

napisao Robson Luiz
Učitelj matematike

U grupi ljudi dob je: 10, 12, 15 i 17 godina. Ako se grupi pridruži 16-godišnjak, što se događa s prosječnom dobi grupe?

Izračunajte prosječnu plaću za tu tvrtku.

Mjere disperzije: amplituda i odstupanje

Na Statistički proučavane u osnovnim i srednjim školama, postoje dvije vrste mjera koje se korist...

read more
Grupiranje podataka u intervale

Grupiranje podataka u intervale

Statističke studije odgovorne su za analizu informacija putem informativnih tablica i grafičkih p...

read more
Mjere disperzije: varijanca i standardna devijacija

Mjere disperzije: varijanca i standardna devijacija

U studiji Statistički, imamo neke strategije za provjeru jesu li vrijednosti predstavljene u skup...

read more