Statistici: principii, importanță, exemple

THE statistic este domeniul matematicii care listează fapte și cifre în care există un set de metode care ne permit să colectăm date și să le analizăm, făcând astfel posibilă efectuarea unei interpretări a acestora. Statistica este împărțită în două părți: descriptiv și inferențial. Statistica descriptivă se caracterizează prin organizarea, analiza și prezentarea datelor, în timp ce statisticile inferențiale au ca o caracteristică studiul unui eșantion al unei populații date și, pe baza acesteia, efectuarea analizelor și prezentarea Zaruri.

Citește și: Care este marja de eroare a unui sondaj?

Principiile statisticii

În continuare, vom vedea principalele concepte și principii ale statisticii. Pe baza acestora, va fi posibil să se definească concepte mai sofisticate.

  • populație sau univers statistic

Populația sau universul statistic este set format din toate elementele care participă la un anumit subiect cercetat.

Exemple de univers statistic

a) Într-un oraș, toți locuitorii aparțin universului statistic.

b) Pe o matriță cu șase fețe, populația este dată de numărul fețelor.

{1, 2, 3, 4, 5, 6}

  • date statistice

Datele statistice sunt a element care aparține populației în ansamblu, evident, aceste date trebuie să fie implicate în tema cercetării.

Populația

date statistice

zaruri cu șase fețe

4

Campioni brazilieni la mountain bike

Henrique Avancini

  • Probă

Numim eșantionul subset format pe baza universului statistic. Un eșantion este utilizat atunci când populația este foarte mare sau infinită. În cazurile în care colectarea tuturor informațiilor din universul statistic este imposibil de realizat din motive financiare sau logistice, este de asemenea necesar să se utilizeze eșantioane.

Alegerea unui eșantion este extrem de importantă pentru un sondaj și trebuie să reprezinte în mod fiabil populația. Un exemplu clasic de utilizare a eșantioanelor într-un sondaj este în efectuarea recensământ demografic a țării noastre.

  • Variabil

În statistici, variabila face obiectul studiului, adică tema pe care cercetarea intenționează să o studieze. De exemplu, atunci când se studiază caracteristicile unui oraș, numărul de locuitori poate fi o variabilă, precum și volumul de ploaie într-o perioadă dată sau chiar numărul autobuzelor pentru transport public. Rețineți că conceptul de variabilă în statistici depinde de contextul cercetării.

Organizarea datelor în statistici are loc în faze, ca în orice proces de organizare. Inițial, se alege subiectul care urmează a fi cercetat, apoi se gândește metoda de colectare a datelor de cercetare, iar al treilea pas este efectuarea colectării. După sfârșitul acestui ultim pas, se efectuează analiza a ceea ce a fost colectat și, astfel, pe baza interpretării, se caută rezultate. Vom vedea acum câteva concepte importante și necesare pentru organizarea datelor.

Nu te opri acum... Există mai multe după publicitate;)

  • rol

În cazurile în care datele pot fi reprezentate prin numere, adică atunci când variabila este cantitativă, lista pentru organizarea acestor date. O listă poate fi ascendentă sau descendentă. Dacă o variabilă nu este cantitativă, adică dacă este calitativă, nu este posibil să se utilizeze lista, de exemplu, dacă datele sunt sentimente despre un anumit produs.

Exemplu

Într-o sală de clasă, înălțimile elevilor în metri au fost colectate. Acestea sunt: ​​1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.

Deoarece lista poate fi organizată în mod ascendent sau descendent, rezultă că:

rol: (1,60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}

Rețineți că, cu rola deja asamblată, este posibil să găsiți date mai ușor.

  • Tabelul de distribuție a frecvenței

În cazurile în care există multe elemente în listă și multe repetări de date, lista devine depășită, deoarece organizarea acestor date este impracticabilă. În aceste cazuri, tabelele și distribuția frecvenței ele servesc ca un instrument organizatoric excelent.

În tabelul de distribuție al frecvență absolută, trebuie să punem frecvența la care apare fiecare dată, adică de câte ori apare.

Să construim tabelul de distribuție pentru frecvența absolută vârstele, în ani, ale elevilor dintr-o clasă dată.

Distribuție absolută a frecvenței

Vârstă

Frecventa (F)

8

2

9

12

10

12

11

14

12

1

Total (FT)

41

Din tabel putem obține următoarele informații: în clasă avem 2 elevi cu vârsta de 8, 12 ani Studenți de 9 ani și încă 12 studenți de 10 ani și așa mai departe, ajungând la un total de 41 elevi. În tabelul de distribuție al frecvențe acumulate, trebuie să adăugăm frecvența din rândul anterior (în tabelul de distribuție a frecvenței absolute).

Să construim tabelul de distribuție a frecvenței cumulativ pentru vârste din aceeași clasă ca în exemplul anterior, a se vedea:

Distribuția frecvenței acumulată

Vârstă

Frecventa (F)

8

2

9

14

10

26

11

40

12

41

Total (FT)

41

În tabelul de distribuția frecvențelor relative, se folosește procentul în care apar fiecare date. Din nou vom face calculele pe baza tabelului de distribuție a frecvenței absolute. Știm că 41 corespunde cu 100% dintre elevii din clasă, deci pentru a determina procent din fiecare vârstă, împărțim frecvența vârstei cu 41 și înmulțim rezultatul cu 100, astfel încât să-l putem scrie ca procent.

2: 41 = 0,048 · 100 → 4,8%

12: 41 = 0,292 · 100 → 29,2%

12: 41 = 0,292 · 100 → 29,2%

14: 41 = 0,341 · 100 → 34,1%

1: 41 = 0,024 · 100 → 2,4%

Distribuția relativă a frecvenței

Vârstă

Frecventa (F)

8

4,8%

9

29,2%

10

29,2%

11

34,1%

12

2,4%

Total (FT)

100%

Citește și:Aplicarea șistatistici: ffrecvență absolut și ffrecventa relativa

  • Clase

În cazurile în care variabila este continuă, adică atunci când are mai multe valori, este necesar să le grupăm în intervale reale. În statistici, aceste intervale se numesc clase..

Pentru a construi masa lui distribuția frecvenței în clase, trebuie să punem intervalele în coloana din stânga, cu titlul lor corect, iar în coloana din dreapta, trebuie puneți frecvența absolută a fiecăruia dintre intervale, adică câte elemente aparțin fiecăruia al lor.

Exemplu

Înălțimea elevilor din anul 3 de liceu la o școală.

Distribuția frecvenței în clase

inaltime (metri)

Frecvența absolută (F)

[1,40; 1,50[

1

[1,50; 1,60[

4

[1,60; 1,70[

8

[1,70; 1,80[

2

[1,80; 1,90[

1

Total (FT)

16

Analizând tabelul de distribuție a frecvenței în clase, putem vedea că, în clasa a III-a, avem 1 elev care are o înălțime cuprinsă între 1,40 m și 1,50 m, la fel cum avem 4 elevi cu o înălțime între 1,50 și 1,60 m și așa succesiv. De asemenea, putem observa că elevii au înălțimea cuprinsă între 1,40 m și 1,90 m, diferența dintre aceste măsurători, adică între înălțimea cea mai mare și cea mai mică a eșantionului, se numește amplitudine.

Diferența dintre limitele superioare și inferioare ale unei clase se numește lățimea clasei, astfel, al doilea, care are 4 elevi cu înălțimi cuprinse între 1,50 metri (inclus) și 1,60 metri (neincluse), are o gamă de:

1,60 – 1,50

0,10 metri

Vezi și: Măsuri de dispersie: amplitudine și deviere

măsurători de poziție

Măsurile de poziționare sunt utilizate în cazurile în care este posibil să se construiască o rulare numerică cu datele sau un tabel de frecvențe. Aceste măsurători indică poziția elementelor în raport cu lista. Cele trei măsuri principale de poziție sunt:

  • In medie

Luați în considerare lista cu elementele (a1, A2, A3, A4,..., TheNu), media aritmetică a acestor n elemente este dată de:

Exemplu

Într-un grup de dans, vârstele membrilor au fost colectate și reprezentate în următoarea listă:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Să determinăm vârsta medie a membrilor acestui grup de dans.

Conform formulei, trebuie să adăugăm toate elementele și să împărțim acest rezultat la numărul de elemente din listă, astfel:

Prin urmare, vârsta medie a membrilor este de 22 de ani.

Pentru a afla mai multe despre această măsură de poziție, citiți textul nostru: Médimineaţă.

  • median

Mediana este dată de elementul central al unei liste care are un număr impar de elemente. Dacă lista are un număr par de elemente, trebuie să luăm în considerare cele două elemente centrale și să calculăm media aritmetică dintre ele.

Exemplu

Luați în considerare următoarea listă.

(2, 2, 3, 3,4, 5, 6, 7, 9)

Rețineți că elementul 4 împarte rolul în două părți egale, deci este elementul central.

Exemplu

Calculați vârsta mediană a grupului de dans.

Amintiți-vă că lista vârstelor pentru acest grup de dans este dată de:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Rețineți că numărul de elemente din această listă este egal cu 10, deci nu este posibil să împărțiți lista în două părți egale. Deci, trebuie să luăm două elemente centrale și să realizăm media aritmetică a acestor valori.

Vedeți mai multe detalii despre această măsură de poziție în textul nostru: Median.

  • Modă

Vom numi moda elementul rolului care are cea mai mare frecvență, adică elementul care apare cel mai mult în ea.

Exemplu

Să determinăm moda vârstei grupului de dans.

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

Elementul care apare cel mai mult este 21, deci modul este egal cu 21.

Măsuri de dispersie

Măsurile de dispersie sunt utilizat în cazurile în care media nu mai este suficientă. De exemplu, imaginați-vă că două mașini au parcurs în medie 40.000 de kilometri. Numai cu cunoștințe despre medii putem spune că cele două mașini au parcurs kilometri determinabili fiecare, nu?

Imaginați-vă însă că una dintre mașini a parcurs 79.000 de kilometri, iar cealaltă 1.000 kilometri, rețineți că numai cu informații despre medie nu este posibil să faceți declarații cu precizie.

La măsuri de dispersie ne va spune cât de departe sunt elementele unei liste numerice de media aritmetică. Avem două măsuri importante de dispersie:

  • Varianța (σ2)

Să numim media aritmetică a pătratelor diferenței dintre fiecare element din rolă și media aritmetică a acelei role ca varianță. Varianța este reprezentată de: σ2.

Luați în considerare lista (x1, X2, X3, …, XNu) și că are medie aritmeticăX. Varianța este dată de:

  • Abaterea standard (σ)

Abaterea standard este dată de rădăcina varianței, ne spune cât de mult este dispersat un element în raport cu media. Abaterea standard este notată cu σ.

Exemplu

Determinați abaterea standard a setului de date (4, 7, 10). Rețineți că, pentru aceasta, este necesar să se determine mai întâi varianța și că, pentru aceasta, este necesar să se calculeze mai întâi media acestor date.

Înlocuind aceste date în formula varianței, avem:

Pentru a determina abaterea standard, trebuie să extragem rădăcina varianței.

Citeste mai mult: Măsuri de dispersie: varianță și deviație standard

Pentru ce sunt statistici?

Am văzut că statistica este legată de Probleme de numărare sau de organizare a datelor. În plus, are un rol important în dezvoltarea instrumentelor care permit procesul de organizare a datelor, cum ar fi tabelele. Statisticile sunt prezente și în diverse domenii ale științei, pe baza colectării și tratării datelor, este posibil să se lucreze cu modele matematice care permit dezvoltarea în continuare în zona studiată. Câteva domenii în care statisticile sunt fundamentale: economie, meteorologie, marketing, sport, sociologie și geoștiințe.

În meteorologie, de exemplu, datele sunt colectate într-o anumită perioadă, după ce au fost organizate, sunt tratate și așa, cu pe baza acestora, se construiește un model matematic care ne permite să afirmăm despre clima din zilele anterioare cu un grad mai mare de fiabilitate. Statistica este o ramură a științei care ne permite să facem afirmații cu un anumit grad de fiabilitate, dar niciodată 100% siguranță.

Diviziuni statistice

Statistica este împărțită în două părți, descriptivă și inferențială. Primul este legat de numărarea elementelor implicate în cercetare, aceste elemente sunt numărate unul câte unul. La Statisticile descriptive, instrumentele noastre principale sunt măsurători de poziție, cum ar fi media, mediana și modul, precum și măsuri de dispersie, cum ar fi varianța și deviația standard, avem, de asemenea, tabele de frecvențe și grafică.

Încă în statisticile descriptive, avem o metodologie foarte bine definită pentru un prezentarea datelor cu un grad considerabil de fiabilitate care trece prin organizare și colectare, rezumat, interpretare și reprezentare și, în cele din urmă, analiza datelor. Un exemplu clasic de utilizare a statisticilor descriptive apare în recensământul populației (la fiecare 10 ani) de către Institutul brazilian de geografie și statistici (IBGE).

THE statistici deduse, la rândul său, se caracterizează nu prin colectarea de date de la elementele unei populații unul câte unul, ci prin efectuarea analiza unui eșantion din această populație, tragând concluzii despre ea. În statisticile inferențiale, trebuie să aveți grijă la alegerea eșantionului, deoarece acesta trebuie să reprezinte foarte bine populația. Unele rezultate inițiale, cum ar fi media, în statistici inferențiale numite speranță, sunt deduse pe baza cunoașterii statisticilor descriptive.

Statisticile inferențiale sunt utilizate, de exemplu, în sondajele electorale. Se alege un eșantion al populației, într-un mod care o reprezintă, și astfel se efectuează cercetarea. Atunci când alegem un eșantion care nu reprezintă foarte bine această populație, spunem că cercetarea este părtinitoare și, prin urmare, nesigur.

Zona matematicii responsabilă cu numărarea și organizarea datelor.
Zona matematicii responsabilă cu numărarea și organizarea datelor.

exerciții rezolvate

intrebarea 1 - (U. F. Juiz de Fora - MG) Un profesor de fizică a aplicat un test, în valoare de 100 de puncte, celor 22 de elevi ai săi și a obținut, ca rezultat, distribuirea notelor, văzută în tabelul următor:

40

20

10

20

70

60

90

80

30

50

50

70

50

20

50

50

10

40

30

20

60

60

Efectuați următoarele tratamente de date:

a) Scrieți lista acestor note.

b) Determinați frecvența relativă a celei mai mari note.

Rezoluţie

a) Pentru a face lista acestor note, trebuie să le scriem în mod ascendent sau descendent. Deci trebuie să:

10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90

b) Privind rolul, putem vedea că nota cea mai mare a fost egală cu 90 și că frecvența sa absolută este egală cu 1, deoarece apare o singură dată. Pentru a determina frecvența relativă, trebuie să împărțim frecvența absolută a acelei note la frecvența totală, în acest caz egală cu 22. Prin urmare:

frecventa relativa

Pentru a trece acest număr ca procent, trebuie să-l înmulțim cu 100.

0,045 · 100

4,5%

Întrebarea 2 - (Enem) După rularea unei matrițe în formă de cub cu fețe numerotate de la 1 la 6, de 10 ori consecutive și notați numărul obținut în fiecare mutare, următorul tabel de distribuție a frecvențe.

Numărul obținut

Frecvență

1

4

2

1

4

2

5

2

6

1

Media, mediana și modul acestei distribuții de frecvență sunt, respectiv:

a) 3, 2 și 1

b) 3, 3 și 1

c) 3, 4 și 2

d) 5, 4 și 2

e) 6, 2 și 4

Rezoluţie

Alternativa B.

Pentru a determina media, rețineți că există repetarea numerelor obținute, așa că vom folosi media aritmetică ponderată.

Pentru a determina mediana, trebuie să aranjăm lista într-un mod ascendent sau descendent. Amintiți-vă că frecvența este de câte ori apare fața.

1, 1, 1, 1, 2, 4, 4, 5, 5, 6

Deoarece numărul de elemente din listă este egal, trebuie să calculăm media aritmetică a elementelor centrale care împart lista în două pentru a determina mediana, astfel:

Modul este dat de elementul care apare cel mai mult, adică are cea mai mare frecvență, deci avem modul în care este egal cu 1.

Astfel, media, mediana și modul sunt, respectiv, egale cu:

3, 3 și 1

de Robson Luiz
Profesor de matematică

Într-un grup de oameni, vârstele sunt: ​​10, 12, 15 și 17 ani. Dacă un tânăr de 16 ani se alătură grupului, ce se întâmplă cu vârsta medie a grupului?

Calculați salariul mediu pentru compania respectivă.

Diagrame Venn în statistici

Diagrame Venn în statistici

Studiul și dezvoltarea Statisticii necesită planificare organizațională, datorită importanței sem...

read more

Măsuri de dispersie: amplitudine și deviere

La Statistic studiate în licee elementare și licee, există două tipuri de măsuri utilizate pentru...

read more
Gruparea datelor în intervale

Gruparea datelor în intervale

Studiile statistice sunt responsabile pentru analiza informațiilor prin tabele informative și rep...

read more