THE statistický je obor matematiky, který uvádí fakta a čísla ve kterém existuje soubor metod, které nám umožňují shromažďovat data a analyzovat je, což umožňuje provádět jejich interpretaci. Statistika je rozdělena do dvou částí: popisný a inferenční. Popisná statistika je charakterizována organizací, analýzou a prezentací dat, zatímco inferenční statistiky ano jako charakteristiku studium vzorku dané populace a na jeho základě provedení analýz a prezentace Kostky.
Přečtěte si také: Co je míra chyby v průzkumu?
Principy statistiky
Dále uvidíme hlavní pojmy a principy statistiky. Na jejich základě bude možné definovat propracovanější koncepty.
populace nebo statistický vesmír
Populace nebo statistický vesmír je množina tvořená všemi prvky kteří se účastní konkrétního zkoumaného tématu.
Příklady statistického vesmíru
a) Ve městě patří všichni obyvatelé do statistického vesmíru.
b) Na šestistranné matrici je populace dána počtem tváří.
{1, 2, 3, 4, 5, 6}
statistická data
Statistické údaje jsou a prvek, který patří k populaci jako celku
, je zřejmé, že tato data musí být součástí výzkumného tématu.Populace |
statistická data |
šestistranné kostky |
4 |
Mistři brazilských horských kol |
Henrique Avancini |
Vzorek
Vzorek nazýváme podmnožina vytvořená na základě statistického vesmíru. Vzorek se používá, když je populace velmi velká nebo nekonečná. V případech, kdy je shromažďování všech informací ze statistického světa z finančních nebo logistických důvodů neproveditelné, je rovněž nutné použít vzorky.
Výběr vzorku je pro průzkum nesmírně důležitý a musí spolehlivě reprezentovat populaci. Klasickým příkladem použití vzorků v průzkumu je provádění demografické sčítání naší země.
Variabilní
Ve statistice je proměnná předmětem studia, tj. téma, které má výzkum v úmyslu studovat. Například při studiu charakteristik města může být počet obyvatel proměnnou, stejně jako objem deště v daném období nebo dokonce počet autobusů pro dopravu veřejnost. Všimněte si, že koncept proměnné ve statistice závisí na kontextu výzkumu.
Organizace údajů ve statistice probíhá v fáze, jako v každém organizačním procesu. Nejprve je vybráno téma, které má být prozkoumáno, poté je promyšlená metoda sběru výzkumných dat a třetím krokem je provedení sběru. Po skončení tohoto posledního kroku je provedena analýza shromážděných údajů, a proto jsou na základě interpretace hledány výsledky. Nyní uvidíme některé důležité a nezbytné koncepty pro organizaci dat.
Nepřestávejte... Po reklamě je toho víc;)
role
V případech, kdy mohou být data reprezentována čísly, to znamená, když je proměnná kvantitativní, seznam pro organizace těchto údajů. Seznam může být vzestupný nebo sestupný. Pokud proměnná není kvantitativní, to znamená, že pokud je kvalitativní, není možné seznam použít, například pokud jsou údaji pocity konkrétního produktu.
Příklad
Ve třídě byly sbírány výšky studentů v metrech. Jsou to: 1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.
Protože seznam lze uspořádat vzestupně nebo sestupně, vyplývá z toho, že:
role: (1,60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
Pamatujte, že s již smontovanou rolí je možné snáze najít matrici.
Tabulka distribuce frekvence
V případech, kdy je v seznamu mnoho prvků a mnoho opakování dat, je seznam zastaralý, protože organizace těchto dat je neproveditelná. V těchto případech tabulky a rozdělení frekvence slouží jako vynikající organizační nástroj.
V distribuční tabulce absolutní frekvence, musíme určit frekvenci, s jakou se jednotlivá data objevují, tj. kolikrát se objevují.
Vytvořme distribuční tabulku pro absolutní frekvence věk (roky) studentů v dané třídě.
Absolutní distribuce frekvence | |
Stáří |
Frekvence (F) |
8 |
2 |
9 |
12 |
10 |
12 |
11 |
14 |
12 |
1 |
Celkem (FT) |
41 |
Z tabulky můžeme získat následující informace: ve třídě máme 2 studenty ve věku 8, 12 let 9letých studentů a 12 dalších 10letých studentů atd. A dosáhlo celkem 41 studenti. V distribuční tabulce akumulované frekvence, musíme přidat frekvenci z předchozího řádku (v tabulce absolutní distribuce frekvence).
Vytvořme kumulativní distribuční tabulku frekvencí pro věky stejné třídy jako v předchozím příkladu, viz:
Kumulované rozdělení frekvence | |
Stáří |
Frekvence (F) |
8 |
2 |
9 |
14 |
10 |
26 |
11 |
40 |
12 |
41 |
Celkem (FT) |
41 |
V tabulce rozdělení relativních frekvencí, je použito procento, ve kterém se jednotlivé údaje objevují. Opět provedeme výpočty založené na tabulce absolutního rozdělení frekvence. Víme, že 41 odpovídá 100% studentů ve třídě, takže k určení procento každého věku pouze vydělíme věkovou frekvenci 41 a výsledek vynásobíme 100, abychom jej mohli napsat jako procento.
2: 41 = 0,048 · 100 → 4,8%
12: 41 = 0,292 · 100 → 29,2%
12: 41 = 0,292 · 100 → 29,2%
14: 41 = 0,341 · 100 → 34,1%
1: 41 = 0,024 · 100 → 2,4%
Relativní distribuce frekvence | |
Stáří |
Frekvence (F) |
8 |
4,8% |
9 |
29,2% |
10 |
29,2% |
11 |
34,1% |
12 |
2,4% |
Celkem (FT) |
100% |
Přečtěte si také:Aplikace astatistika: Ffrekvence Theabsolutní a Frelativní frekvence
Třídy
V případech, kdy je proměnná spojitá, to znamená, že když má několik hodnot, je nutné je seskupit skutečné intervaly. Ve statistikách se tyto intervaly nazývají třídy..
Sestavit tabulku rozdělení kmitočtů ve třídách, musíme dát intervaly do levého sloupce s jejich správným názvem a do pravého sloupce musíme dejte absolutní frekvenci každého z intervalů, tj. kolik prvků patří každému jejich.
Příklad
Výška studentů 3. ročníku střední školy ve škole.
Distribuce frekvence ve třídách | |
výška (metry) |
Absolutní frekvence (F) |
[1,40; 1,50[ |
1 |
[1,50; 1,60[ |
4 |
[1,60; 1,70[ |
8 |
[1,70; 1,80[ |
2 |
[1,80; 1,90[ |
1 |
Celkem (FT) |
16 |
Analýzou tabulky rozdělení frekvence ve třídách vidíme, že ve třídě třetího ročníku máme 1 studenta který má výšku mezi 1,40 ma 1,50 m, stejně jako máme 4 studenty s výškou mezi 1,50 a 1,60 m, a tak postupně. Můžeme také pozorovat, že studenti mají výšku mezi 1,40 ma 1,90 m, rozdíl mezi těmito měřeními, tj. Mezi nejvyšší a nejnižší výškou vzorku, se nazývá amplituda.
Rozdíl mezi horní a dolní hranicí třídy se nazývá šířka třídy, tedy druhý, který má 4 studenty s výškami mezi 1,50 metry (včetně) a 1,60 metrů (nejsou zahrnuty), má rozsah:
1,60 – 1,50
0,10 metru
Podívejte se také: Disperzní opatření: amplituda a odchylka
měření polohy
Poziční míry se používají v případech, kdy je možné sestavit číselný válec s daty nebo tabulkou frekvencí. Tato měření označují polohu prvků ve vztahu k soupisce. Tři hlavní míry polohy jsou:
Průměrný
Zvažte seznam s prvky (a1, a2, a3, a4,…,Ne), aritmetický průměr těchto n prvků je dán vztahem:
Příklad
V taneční skupině byly shromážděny věky členů a zastoupeny v následujícím seznamu:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Určme průměrný věk členů této taneční skupiny.
Podle vzorce musíme přidat všechny prvky a tento výsledek vydělit počtem prvků v seznamu, například takto:
Proto je průměrný věk členů 22 let.
Chcete-li se o této míře polohy dozvědět více, přečtěte si náš text: Méráno.
medián
Medián je dán centrálním prvkem seznamu, který má lichý počet prvků. Pokud má seznam sudý počet prvků, musíme vzít v úvahu dva centrální prvky a vypočítat mezi nimi aritmetický průměr.
Příklad
Zvažte následující seznam.
(2, 2, 3, 3,4, 5, 6, 7, 9)
Všimněte si, že prvek 4 rozděluje roli na dvě stejné části, takže je to centrální prvek.
Příklad
Vypočítejte střední věk taneční skupiny.
Nezapomeňte, že seznam věkových skupin této taneční skupiny je dán:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Počet prvků v tomto seznamu je roven 10, takže není možné rozdělit seznam na dvě stejné části. Musíme tedy vzít dva centrální prvky a provést aritmetický průměr těchto hodnot.
Podívejte se na další podrobnosti tohoto měření polohy v našem textu: Median.
Móda
Módu budeme nazývat prvkem role, který má nejvyšší frekvenci, tedy prvkem, který se v něm objevuje nejvíce.
Příklad
Pojďme určit módu věkové role taneční skupiny.
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Nejčastěji zobrazovaný prvek je 21, takže režim je roven 21.
Disperzní opatření
Disperzní opatření jsou používá se v případech, kdy průměr již není dostatečný. Představte si například, že dvě auta najely průměrně 40 000 kilometrů. Pouze se znalostí průměrů můžeme říci, že oba vozy ušly každý stanovitelný kilometr, že?
Představte si však, že jeden z vozů najel 79 000 kilometrů a druhý 1 000 kilometrů, mějte na paměti, že pouze s informacemi o průměru nelze dělat prohlášení s přesnost.
Na disperzní opatření řekne nám, jak daleko jsou prvky číselného seznamu od aritmetického průměru. Máme dvě důležitá měřítka rozptylu:
Rozptyl (σ2)
Pojďme nazvat aritmetický průměr čtverců rozdílu mezi každým prvkem v roli a aritmetický průměr této role jako rozptyl. Rozptyl je reprezentován: σ2.
Zvažte seznam (x1, X2, X3, …, XNe) a že má aritmetický průměrX. Rozptyl je dán vztahem:
Směrodatná odchylka (σ)
Směrodatná odchylka je dána kořenem rozptylu a udává, o kolik je prvek rozptýlen ve vztahu ke střední hodnotě. Směrodatná odchylka je označena σ.
Příklad
Určete směrodatnou odchylku souboru dat (4, 7, 10). Všimněte si, že za tímto účelem je nutné nejprve určit rozptyl a že za tímto účelem je nutné nejprve vypočítat průměr těchto údajů.
Nahrazením těchto dat ve variantním vzorci máme:
Abychom určili směrodatnou odchylku, musíme extrahovat kořen rozptylu.
Přečtěte si více: Disperzní opatření: rozptyl a směrodatná odchylka
K čemu slouží statistika?
Viděli jsme, že statistika souvisí s Problémy s počítáním nebo organizací dat. Kromě toho hraje důležitou roli při vývoji nástrojů, které umožňují proces organizace dat, například v tabulkách. Statistiky jsou také přítomny v různých vědních oborů, na základě sběru a zpracování dat je možné pracovat s matematickými modely, které umožňují další rozvoj ve studované oblasti. Některé oblasti, ve kterých je statistika zásadní: ekonomie, meteorologie, marketing, sport, sociologie a geovědy.
Například v meteorologii jsou data shromažďována v určitém období, poté, co jsou organizována, je s nimi zacházeno a podobně na jejich základě je vytvořen matematický model, který nám umožňuje tvrdit o klimatu předchozích dnů s větší mírou spolehlivost. Statistika je odvětví vědy, které nám umožňuje dělat prohlášení s určitou mírou spolehlivosti, ale nikdy se 100% jistotou.
Statistické dělení
Statistika je rozdělena na dvě části, popisnou a inferenční. První souvisí s počítáním prvků zapojených do výzkumu, tyto prvky se počítají jeden po druhém. Na Deskriptivní statistika, naše hlavní nástroje jsou poziční míry, jako je průměr, medián a režim, stejně jako disperzní opatření, jako je rozptyl a směrodatná odchylka, máme také frekvenční tabulky a grafika.
Stále v popisné statistice máme velmi dobře definovanou metodiku pro a prezentace údajů se značnou mírou spolehlivosti který prochází organizací a sběrem, shrnutím, interpretací a reprezentací a nakonec analýzou dat. Klasickým příkladem použití popisné statistiky je sčítání lidu (každých 10 let), které provedl brazilský institut geografie a statistiky (IBGE).
THE inferenční statistiky, na druhé straně je charakterizován nikoli shromažďováním údajů z prvků populace jeden po druhém, ale prováděním analýza vzorku této populace a vyvození závěrů o ní. V inferenční statistice je třeba při výběru vzorku postupovat opatrně, protože musí velmi dobře reprezentovat populaci. Některé počáteční výsledky, jako je průměrování, v inferenční statistice zvané naděje, jsou odvozeny na základě znalostí popisných statistik.
Inferenční statistiky se používají například ve volebních průzkumech. Je vybrán vzorek populace způsobem, který ji reprezentuje, a tak je proveden výzkum. Při výběru vzorku, který tuto populaci příliš nereprezentuje, říkáme, že výzkum je zaujatý a proto nespolehlivý.
vyřešená cvičení
Otázka 1 - (U. F. Juiz de Fora - MG) Učitel fyziky aplikoval test v hodnotě 100 bodů na svých 22 studentů a ve výsledku získal rozložení známek, jak je vidět v následující tabulce:
40 |
20 |
10 |
20 |
70 |
60 |
90 |
80 |
30 |
50 |
50 |
70 |
50 |
20 |
50 |
50 |
10 |
40 |
30 |
20 |
60 |
60 |
– |
– |
Proveďte následující zpracování dat:
a) Napište seznam těchto poznámek.
b) Určete relativní frekvenci nejvyšší noty.
Řešení
a) Chcete-li vytvořit seznam těchto poznámek, musíme je napsat vzestupně nebo sestupně. Musíme tedy:
10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90
b) Při pohledu na roli vidíme, že nejvyšší nota byla rovna 90 a že její absolutní frekvence je rovna 1, protože se objevuje pouze jednou. Abychom určili relativní frekvenci, musíme vydělit absolutní frekvenci této noty celkovou frekvencí, v tomto případě rovnou 22. Tím pádem:
relativní frekvence
Abychom toto číslo prošli procentem, musíme ho vynásobit 100.
0,045 · 100
4,5%
Otázka 2 - (Enem) Po válcování kostky ve tvaru kostky s tvářemi očíslovanými od 1 do 6, 10 po sobě jdoucích, a poznamenejte si počet získaných v každém tahu, následující tabulka rozdělení frekvence.
Získané číslo |
Frekvence |
1 |
4 |
2 |
1 |
4 |
2 |
5 |
2 |
6 |
1 |
Průměr, medián a způsob tohoto rozdělení frekvence jsou:
a) 3, 2 a 1
b) 3, 3 a 1
c) 3, 4 a 2
d) 5, 4 a 2
e) 6, 2 a 4
Řešení
Alternativa B.
Pro určení průměru si všimněte, že se opakuje získaná čísla, takže použijeme vážený aritmetický průměr.
Abychom určili medián, musíme uspořádat seznam vzestupně nebo sestupně. Nezapomeňte, že frekvence je počet zobrazení obličeje.
1, 1, 1, 1, 2, 4, 4, 5, 5, 6
Protože počet prvků v seznamu je sudý, musíme vypočítat aritmetický průměr centrálních prvků, které rozdělí seznam na polovinu, abychom určili medián, například takto:
Režim je dán prvkem, který se objeví nejvíce, to znamená, že má nejvyšší frekvenci, takže máme, že režim je roven 1.
Tedy průměr, medián a režim se rovnají:
3, 3 a 1
Robson Luiz
Učitel matematiky
Ve skupině lidí jsou věky: 10, 12, 15 a 17 let. Pokud se do skupiny připojí 16letý chlapec, co se stane s průměrným věkem skupiny?
Vypočítejte průměrný plat pro tuto společnost.