IL statistica è il campo della matematica che elenca fatti e cifre in cui esiste un insieme di metodi che ci consentono di raccogliere dati e analizzarli, rendendo così possibile eseguirne alcune interpretazioni. La statistica è divisa in due parti: descrittivo e inferenziale. La statistica descrittiva è caratterizzata dall'organizzazione, dall'analisi e dalla presentazione dei dati, mentre la statistica inferenziale ha come caratteristica lo studio di un campione di una data popolazione e, sulla base di esso, l'esecuzione di analisi e la presentazione di Dado.
Leggi anche: Qual è il margine di errore di un sondaggio?
Principi di statistica
Successivamente, vedremo i principali concetti e principi della statistica. Sulla base di essi sarà possibile definire concetti più sofisticati.
popolazione o universo statistico
La popolazione o universo statistico è il insieme formato da tutti gli elementi che partecipano a un particolare argomento di ricerca.
Esempi di universo statistico
a) In una città, tutti gli abitanti appartengono all'universo statistico.
b) Su un dado a sei facce, la popolazione è data dal numero di facce.
{1, 2, 3, 4, 5, 6}
dati statistici
I dati statistici sono a elemento che appartiene alla popolazione nel suo insieme, ovviamente questi dati devono essere coinvolti con il tema della ricerca.
Popolazione |
dati statistici |
dadi a sei facce |
4 |
Campioni brasiliani di mountain bike |
Henrique Avancini |
Campione
Chiamiamo il campione il sottoinsieme formato sulla base dell'universo statistico. Un campione viene utilizzato quando la popolazione è molto grande o infinita. Nei casi in cui la raccolta di tutte le informazioni dall'universo statistico non sia fattibile per motivi finanziari o logistici, è necessario utilizzare anche dei campioni.
La scelta di un campione è estremamente importante per una ricerca e deve rappresentare in modo affidabile la popolazione. Un classico esempio dell'uso dei campioni in un'indagine è nell'esecuzione del censimento demografico del nostro paese.
Variabile
In statistica, la variabile è oggetto di studio, cioè il tema che la ricerca intende studiare. Ad esempio, quando si studiano le caratteristiche di una città, il numero di abitanti può essere una variabile, così come il volume di pioggia in un dato periodo o anche il numero di autobus per il trasporto pubblico. Si noti che il concetto di variabile nelle statistiche dipende dal contesto di ricerca.
L'organizzazione dei dati nelle statistiche avviene in fasi, come in ogni processo organizzativo. Inizialmente, viene scelto l'argomento da ricercare, quindi viene pensato il metodo per raccogliere i dati della ricerca e il terzo passo è eseguire la raccolta. Al termine di quest'ultima fase si procede all'analisi di quanto raccolto e quindi, in base all'interpretazione, si cercano i risultati. Vedremo ora alcuni concetti importanti e necessari per l'organizzazione dei dati.
Non fermarti ora... C'è dell'altro dopo la pubblicità ;)
ruolo
Nei casi in cui i dati possono essere rappresentati da numeri, cioè quando la variabile è quantitativa, l'elenco per organizzazione di questi dati. Un elenco può essere ascendente o discendente. Se una variabile non è quantitativa, cioè se è qualitativa, non è possibile utilizzare l'elenco, ad esempio se i dati sono sentimenti su un determinato prodotto.
Esempio
In un'aula sono state raccolte le altezze degli studenti in metri. Sono: 1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.
Poiché l'elenco può essere organizzato in modo ascendente o discendente, ne consegue che:
ruolo: (1.60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
Si noti che, con il rotolo già assemblato, è possibile trovare i dati più facilmente.
Tabella di distribuzione della frequenza
Nei casi in cui ci sono molti elementi nell'elenco e molte ripetizioni di dati, l'elenco diventa obsoleto, poiché l'organizzazione di questi dati è impraticabile. In questi casi, le tabelle e il distribuzione di frequenza servono come un eccellente strumento organizzativo.
Nella tabella di distribuzione di frequenza assoluta, dobbiamo mettere la frequenza con cui appare ogni dato, cioè il numero di volte in cui appare.
Costruiamo la tabella di distribuzione per frequenza assoluta l'età, in anni, degli studenti di una data classe.
Distribuzione di frequenza assoluta | |
Età |
Frequenza (F) |
8 |
2 |
9 |
12 |
10 |
12 |
11 |
14 |
12 |
1 |
Totale (FT) |
41 |
Dalla tabella possiamo ricavare le seguenti informazioni: nella classe abbiamo 2 studenti di 8, 12 anni Studenti di 9 anni, e altri 12 studenti di 10 anni, e così via, raggiungendo un totale di 41 studenti. Nella tabella di distribuzione di frequenze accumulate, dobbiamo aggiungere la frequenza dalla riga precedente (nella tabella di distribuzione della frequenza assoluta).
Costruiamo la tabella di distribuzione della frequenza cumulativa per le età della stessa classe dell'esempio precedente, vedi:
Distribuzione di frequenza accumulata | |
Età |
Frequenza (F) |
8 |
2 |
9 |
14 |
10 |
26 |
11 |
40 |
12 |
41 |
Totale (FT) |
41 |
Nella tabella di distribuzione delle frequenze relative, viene utilizzata la percentuale in cui appare ciascun dato. Anche in questo caso faremo i calcoli in base alla tabella di distribuzione della frequenza assoluta. Sappiamo che 41 corrisponde al 100% degli studenti della classe, quindi per determinare il percentuale di ogni età, dividiamo semplicemente la frequenza dell'età per 41 e moltiplichiamo il risultato per 100, in modo da poterlo scrivere in percentuale.
2: 41 = 0,048 · 100 → 4,8%
12: 41 = 0,292 · 100 → 29,2%
12: 41 = 0,292 · 100 → 29,2%
14: 41 = 0,341 · 100 → 34,1%
1: 41 = 0,024 · 100 → 2,4%
Distribuzione di frequenza relativa | |
Età |
Frequenza (F) |
8 |
4,8% |
9 |
29,2% |
10 |
29,2% |
11 |
34,1% |
12 |
2,4% |
Totale (FT) |
100% |
Leggi anche:Applicazione di estatistiche: ffrequenza Ilassoluto e ffrequenza relativa
Classi
Nei casi in cui la variabile è continua, cioè quando ha più valori, è necessario raggrupparli in intervalli reali. In statistica questi intervalli sono chiamati classi..
Per costruire il tavolo di distribuzione di frequenza nelle classi, dobbiamo mettere gli intervalli nella colonna di sinistra, con il loro titolo proprio, e nella colonna di destra, dobbiamo metti la frequenza assoluta di ciascuno degli intervalli, cioè quanti elementi appartengono a ciascuno loro.
Esempio
Altezza degli studenti del 3° anno di liceo in una scuola.
Distribuzione di frequenza nelle classi | |
altezza (metri) |
Frequenza assoluta (F) |
[1,40; 1,50[ |
1 |
[1,50; 1,60[ |
4 |
[1,60; 1,70[ |
8 |
[1,70; 1,80[ |
2 |
[1,80; 1,90[ |
1 |
Totale (FT) |
16 |
Analizzando la tabella di distribuzione delle frequenze nelle classi, possiamo vedere che, nella classe terza, abbiamo 1 studente che ha un'altezza tra 1,40 me 1,50 m, così come abbiamo 4 studenti con altezza tra 1,50 e 1,60 m, e così successivamente. Possiamo anche osservare che gli studenti hanno altezza compresa tra 1,40 me 1,90 m, la differenza tra queste misure, cioè tra l'altezza più alta e quella più bassa del campione, si chiama ampiezza.
La differenza tra i limiti superiore e inferiore di una classe è chiamata ampiezza della classe, quindi, la seconda, che conta 4 studenti con altezza compresa tra 1,50 metri (incluso) e 1,60 metri (escluso), ha un range di:
1,60 – 1,50
0,10 metri
Vedi anche: Misure di dispersione: ampiezza e deviazione
misurazioni di posizione
Le misure di posizione vengono utilizzate nei casi in cui è possibile costruire un rotolo numerico con i dati o una tabella di frequenza. Queste misurazioni indicano la posizione degli elementi rispetto al roster. Le tre principali misure di posizione sono:
Media
Considera la lista con gli elementi (a1, a2, a3, a4, …, Ilno), la media aritmetica di questi n elementi è data da:
Esempio
In un gruppo di ballo, le età dei membri sono state raccolte e rappresentate nel seguente elenco:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Determiniamo l'età media dei membri di questo gruppo di ballo.
Secondo la formula, dobbiamo aggiungere tutti gli elementi e dividere questo risultato per il numero di elementi nell'elenco, in questo modo:
Pertanto, l'età media dei membri è di 22 anni.
Per saperne di più su questa misura di posizione, leggi il nostro testo: Mémattina.
mediano
La mediana è data dall'elemento centrale di un roster che ha un numero dispari di elementi. Se la lista ha un numero pari di elementi, dobbiamo considerare i due elementi centrali e calcolarne la media aritmetica.
Esempio
Considera il seguente elenco.
(2, 2, 3, 3,4, 5, 6, 7, 9)
Nota che l'elemento 4 divide il ruolo in due parti uguali, quindi è l'elemento centrale.
Esempio
Calcola l'età media del gruppo di ballo.
Ricorda che l'elenco delle età per questo gruppo di ballo è dato da:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Si noti che il numero di elementi in questa lista è pari a 10, quindi non è possibile dividere la lista in due parti uguali. Quindi dobbiamo prendere due elementi centrali ed eseguire la media aritmetica di questi valori.
Vedi maggiori dettagli di questa misura di posizione nel nostro testo: Mediana.
Moda
Chiameremo moda l'elemento del ruolo che ha la più alta frequenza, cioè l'elemento che più appare in esso.
Esempio
Determiniamo la moda della fascia d'età del gruppo di ballo.
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
L'elemento che appare di più è 21, quindi la modalità è uguale a 21.
Misure di dispersione
Le misure di dispersione sono utilizzato nei casi in cui la media non è più sufficiente. Ad esempio, immagina che due auto abbiano percorso in media 40.000 chilometri. Solo conoscendo le medie possiamo dire che le due auto hanno percorso chilometri determinabili ciascuna, giusto?
Tuttavia, immagina che una delle auto abbia percorso 79.000 chilometri e l'altra 1.000 chilometri, si noti che solo con informazioni sulla media non è possibile fare dichiarazioni con precisione.
A misure di dispersione ci dirà quanto distano gli elementi di una lista numerica dalla media aritmetica. Abbiamo due importanti misure di dispersione:
Varianza (σ2)
Chiamiamo varianza la media aritmetica dei quadrati della differenza tra ogni elemento del tiro e la media aritmetica di quel tiro. La varianza è rappresentata da: σ2.
Considera la lista (x1, X2, X3, …, Xno) e che ha media aritmeticaX. La varianza è data da:
Deviazione standard (σ)
La deviazione standard è data dalla radice della varianza, ci dice quanto un elemento è disperso rispetto alla media. La deviazione standard è indicata con .
Esempio
Determinare la deviazione standard del set di dati (4, 7, 10). Nota che, per questo, è necessario determinare prima la varianza e che, per questo, è necessario prima calcolare la media di questi dati.
Sostituendo questi dati nella formula della varianza, abbiamo:
Per determinare la deviazione standard, dobbiamo estrarre la radice della varianza.
Leggi di più: Misure di dispersione: varianza e deviazione standard
A cosa servono le statistiche?
Abbiamo visto che la statistica è correlata a Conteggio o problemi di organizzazione dei dati. Inoltre, ha un ruolo importante nello sviluppo di strumenti che consentono il processo di organizzazione dei dati, come le tabelle. Le statistiche sono presenti anche in vari campi della scienza, sulla base della raccolta e del trattamento dei dati, è possibile lavorare con modelli matematici che consentono un ulteriore sviluppo nell'area studiata. Alcuni campi in cui la statistica è fondamentale: economia, meteorologia, marketing, sport, sociologia e geoscienze.
In meteorologia, ad esempio, i dati vengono raccolti in un certo periodo, dopo essere stati organizzati, vengono trattati, e così, con in base ad essi si costruisce un modello matematico che ci permette di affermare sul clima dei giorni precedenti con un maggior grado di affidabilità. La statistica è una branca della scienza che ci permette di fare affermazioni con un certo grado di affidabilità, ma mai con certezza al 100%.
Divisioni statistiche
La statistica è divisa in due parti, descrittiva e inferenziale. Il primo è relativo al conteggio degli elementi coinvolti nella ricerca, questi elementi vengono contati uno per uno. A Statistiche descrittive, i nostri strumenti principali sono le misure di posizione, come media, mediana e moda, nonché misure di dispersione come varianza e deviazione standard, abbiamo anche tabelle di frequenza e grafica.
Sempre in statistica descrittiva, abbiamo una metodologia molto ben definita per a presentazione dei dati con un notevole grado di affidabilità che passa attraverso organizzazione e raccolta, sintesi, interpretazione e rappresentazione e, infine, analisi dei dati. Un classico esempio dell'uso della statistica descrittiva si trova nel censimento della popolazione (ogni 10 anni) dell'Istituto brasiliano di geografia e statistica (IBGE).
IL statistica inferenziale, a sua volta, si caratterizza non raccogliendo dati dagli elementi di una popolazione uno per uno, ma effettuando la analisi di un campione di questa popolazione, traendo conclusioni di lei. Nella statistica inferenziale bisogna fare attenzione nella scelta del campione, in quanto deve rappresentare molto bene la popolazione. Alcuni risultati iniziali, come la media, nelle statistiche inferenziali chiamate speranza, sono dedotti sulla base della conoscenza della statistica descrittiva.
Le statistiche inferenziali vengono utilizzate, ad esempio, nei sondaggi elettorali. Viene scelto un campione della popolazione, in modo che lo rappresenti, e quindi viene svolta la ricerca. Quando si sceglie un campione che non rappresenta molto bene questa popolazione, diciamo che la ricerca è parziale e quindi inaffidabile.
esercizi risolti
domanda 1 – (U. f. Juiz de Fora – MG) Un insegnante di fisica ha applicato un test, del valore di 100 punti, ai suoi 22 studenti e ha ottenuto, come risultato, la distribuzione dei voti, riportata nella tabella seguente:
40 |
20 |
10 |
20 |
70 |
60 |
90 |
80 |
30 |
50 |
50 |
70 |
50 |
20 |
50 |
50 |
10 |
40 |
30 |
20 |
60 |
60 |
– |
– |
Effettua i seguenti trattamenti di dati:
a) Scrivi l'elenco di queste note.
b) Determinare la frequenza relativa della nota più alta.
Risoluzione
a) Per fare l'elenco di queste note, dobbiamo scriverle in modo ascendente o discendente. Quindi dobbiamo:
10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90
b) Guardando il rullo, possiamo vedere che la nota più alta era pari a 90 e che la sua frequenza assoluta è pari a 1, poiché compare una sola volta. Per determinare la frequenza relativa, dobbiamo dividere la frequenza assoluta di quella nota per la frequenza totale, in questo caso pari a 22. Così:
frequenza relativa
Per passare questo numero in percentuale, dobbiamo moltiplicarlo per 100.
0,045 · 100
4,5%
Domanda 2 – (Enem) Dopo aver lanciato un dado a forma di cubo con facce numerate da 1 a 6, 10 volte consecutive, e annotare il numero ottenuto in ogni mossa, la seguente tabella di distribuzione di frequenze.
Numero ottenuto |
Frequenza |
1 |
4 |
2 |
1 |
4 |
2 |
5 |
2 |
6 |
1 |
La media, la mediana e la moda di questa distribuzione di frequenza sono, rispettivamente:
a) 3, 2 e 1
b) 3, 3 e 1
c) 3, 4 e 2
d) 5, 4 e 2
e) 6, 2 e 4
Risoluzione
Alternativa B.
Per determinare la media, si noti che c'è ripetizione dei numeri ottenuti, quindi useremo la media aritmetica ponderata.
Per determinare la mediana, dobbiamo disporre il roster in modo ascendente o discendente. Ricorda che la frequenza è il numero di volte in cui appare il viso.
1, 1, 1, 1, 2, 4, 4, 5, 5, 6
Poiché il numero di elementi del roster è pari, dobbiamo calcolare la media aritmetica degli elementi centrali che dividono il roster a metà per determinare la mediana, in questo modo:
La modalità è data dall'elemento che appare di più, cioè ha la frequenza più alta, quindi abbiamo che la modalità è uguale a 1.
Quindi, la media, la mediana e la moda sono, rispettivamente, uguali a:
3, 3 e 1
di Robson Luiz
Insegnante di matematica
In un gruppo di persone, le età sono: 10, 12, 15 e 17 anni. Se un ragazzo di 16 anni si unisce al gruppo, cosa succede all'età media del gruppo?
Calcola lo stipendio medio per quell'azienda.