TEN Statystyczny jest dziedziną matematyki, która wymienia fakty i liczby w którym istnieje zestaw metod pozwalających na zbieranie danych i ich analizę, a tym samym na ich interpretację. Statystyka podzielona jest na dwie części: opisowy i wnioskowanie. Statystyka opisowa charakteryzuje się organizacją, analizą i prezentacją danych, podczas gdy statystyka wnioskowa ma jako cechy charakterystycznej badanie próby danej populacji i na jej podstawie wykonanie analiz i prezentacja Kostka do gry.
Przeczytaj też: Jaki jest margines błędu ankiety?
Zasady statystyki
Następnie przyjrzymy się głównym pojęciom i zasadom statystyki. Na ich podstawie będzie można definiować bardziej wyrafinowane koncepcje.
populacja lub uniwersum statystyczne
Populacja lub wszechświat statystyczny to zestaw złożony ze wszystkich elementów którzy uczestniczą w konkretnym badanym temacie. .
Przykłady wszechświata statystycznego
a) W mieście wszyscy mieszkańcy należą do uniwersum statystycznego.
b) Na kostce sześciennej populację podaje liczba ścian.
{1, 2, 3, 4, 5, 6}
dane statystyczne
Dane statystyczne to element należący do populacji jako całości, oczywiście dane te muszą być powiązane z tematem badań.
Populacja |
dane statystyczne |
kości sześciościenne |
4 |
Brazylijscy mistrzowie kolarstwa górskiego |
Henrique Avancini |
Próba
Próbkę nazywamy podzbiór utworzony na podstawie uniwersum statystycznego. Próbka jest używana, gdy populacja jest bardzo duża lub nieskończona. W przypadkach, gdy zebranie wszystkich informacji ze świata statystycznego jest niewykonalne ze względów finansowych lub logistycznych, konieczne jest również skorzystanie z próbek.
Dobór próby jest niezwykle ważny dla badania i musi rzetelnie reprezentować populację. Klasycznym przykładem wykorzystania próbek w ankiecie jest przeprowadzanie spis demograficzny Z naszego kraju.
Zmienna
W statystyce zmienna jest przedmiotem badań, czyli temat, który badanie zamierza zbadać. Na przykład, badając cechy miasta, liczba mieszkańców może być zmienną, a także wielkość opadów w danym okresie czy nawet ilość autobusów do przewozu publiczny. Zauważ, że pojęcie zmiennej w statystyce zależy od kontekstu badawczego.
Organizacja danych w statystykach odbywa się w: fazy, jak w każdym procesie organizacyjnym. Najpierw wybierany jest temat do badania, następnie przemyślany jest sposób zbierania danych badawczych, a trzecim krokiem jest przeprowadzenie zbierania. Po zakończeniu tego ostatniego kroku przeprowadzana jest analiza tego, co zostało zebrane, a tym samym na podstawie interpretacji poszukuje się wyników. Zobaczymy teraz kilka ważnych i niezbędnych koncepcji organizacji danych.
Teraz nie przestawaj... Po reklamie jest więcej ;)
rola
W przypadkach, w których dane mogą być reprezentowane przez liczby, czyli gdy zmienna jest ilościowa, lista dla organizacja tych danych. Lista może być rosnąco lub malejąco. Jeśli zmienna nie jest ilościowa, to znaczy, jeśli jest jakościowa, nie można użyć listy, na przykład, jeśli dane są odczuciami na temat konkretnego produktu.
Przykład
W klasie zebrano wysokość uczniów w metrach. Są to: 1,70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.
Ponieważ lista może być uporządkowana rosnąco lub malejąco, wynika z tego, że:
rola: (1,60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
Zwróć uwagę, że po złożeniu rolki można łatwiej znaleźć dane.
Tabela dystrybucji częstotliwości
W przypadkach, gdy wykaz zawiera wiele elementów i wiele powtórzeń danych, wykaz staje się przestarzały, ponieważ organizacja tych danych jest niepraktyczna. W takich przypadkach tabele i rozkład częstotliwości służą jako doskonałe narzędzie organizacyjne.
W tabeli dystrybucji częstotliwość bezwzględna, musimy podać częstotliwość, z jaką pojawiają się poszczególne dane, to znaczy, ile razy się pojawiają.
Zbudujmy tabelę dystrybucji dla częstotliwość bezwzględna wiek, w latach, uczniów w danej klasie.
Bezwzględny rozkład częstotliwości | |
Wiek |
Częstotliwość (F) |
8 |
2 |
9 |
12 |
10 |
12 |
11 |
14 |
12 |
1 |
Razem (FT) |
41 |
Z tabeli możemy uzyskać następujące informacje: w klasie mamy 2 uczniów w wieku 8, 12 lat 9-latków i 12 kolejnych 10-latków i tak dalej, łącznie 41 studenci. W tabeli dystrybucji nagromadzone częstotliwości, musimy dodać częstotliwość z poprzedniego wiersza (w tabeli bezwzględnego rozkładu częstotliwości).
Zbudujmy tabelę skumulowanego rozkładu częstości dla grup wiekowych tej samej klasy, co w poprzednim przykładzie, zobacz:
Skumulowany rozkład częstotliwości | |
Wiek |
Częstotliwość (F) |
8 |
2 |
9 |
14 |
10 |
26 |
11 |
40 |
12 |
41 |
Razem (FT) |
41 |
W tabeli rozkład częstotliwości względnych, używany jest procent, w jakim pojawiają się poszczególne dane. Ponownie dokonamy obliczeń w oparciu o tabelę bezwzględnego rozkładu częstotliwości. Wiemy, że 41 odpowiada 100% uczniów w klasie, więc aby określić odsetek każdego wieku, po prostu dzielimy częstotliwość wieku przez 41 i mnożymy wynik przez 100, abyśmy mogli zapisać go w procentach.
2: 41 = 0,048 · 100 → 4,8%
12: 41 = 0,292 · 100 → 29,2%
12: 41 = 0,292 · 100 → 29,2%
14: 41 = 0,341 · 100 → 34,1%
1: 41 = 0,024 · 100 → 2,4%
Względny rozkład częstotliwości | |
Wiek |
Częstotliwość (F) |
8 |
4,8% |
9 |
29,2% |
10 |
29,2% |
11 |
34,1% |
12 |
2,4% |
Razem (FT) |
100% |
Przeczytaj też:Stosowanie iStatystyka: faczęstotliwość absolutne i faczęstotliwość względna
Klasy
W przypadkach, gdy zmienna jest ciągła, czyli gdy ma kilka wartości, konieczne jest pogrupowanie ich w rzeczywiste interwały. W statystyce te przedziały nazywane są klasami..
Aby zbudować stół z rozkład częstotliwości w klasach, interwały musimy umieścić w lewej kolumnie, z ich właściwym tytułem, a w prawej kolumnie musimy podaj bezwzględną częstotliwość każdego z przedziałów, czyli ile elementów należy do każdego z nich ich.
Przykład
Wzrost uczniów w III klasie liceum w szkole.
Rozkład częstotliwości w klasach | |
wysokość (metry) |
Częstotliwość bezwzględna (F) |
[1,40; 1,50[ |
1 |
[1,50; 1,60[ |
4 |
[1,60; 1,70[ |
8 |
[1,70; 1,80[ |
2 |
[1,80; 1,90[ |
1 |
Razem (FT) |
16 |
Analizując tabelę rozkładu frekwencji w klasach, widzimy, że na 3 roku mamy 1 ucznia która ma wysokość od 1,40 m do 1,50 m, podobnie jak mamy 4 uczniów o wzroście od 1,50 do 1,60 m, i tak sukcesywnie. Możemy również zaobserwować, że uczniowie mają wzrost między 1,40 m a 1,90 m, różnica między tymi pomiarami, czyli między najwyższą a najniższą wysokością próbki, nazywa się amplituda.
Różnica między górną i dolną granicą klasy nazywana jest szerokość klasy, zatem druga, która ma 4 uczniów o wzroście od 1,50 metra (w zestawie) do 1,60 metra (nie w zestawie), ma zasięg:
1,60 – 1,50
0,10 metra
Zobacz też: Miary dyspersji: amplituda i odchylenie
pomiary pozycji
Miary pozycji są stosowane w przypadkach, gdy możliwe jest zbudowanie rolki numerycznej z danymi lub tabelą częstości. Pomiary te wskazują położenie elementów w stosunku do grafiku. Trzy główne miary pozycji to:
Średni
Rozważ listę z elementami (a1, a2, a3, a4, …,Nie), średnia arytmetyczna tych n elementów jest dana wzorem:
Przykład
W grupie tanecznej wiek członków został zebrany i przedstawiony na poniższej liście:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Ustalmy średni wiek członków tej grupy tanecznej.
Zgodnie ze wzorem musimy dodać wszystkie elementy i podzielić ten wynik przez liczbę elementów na liście, tak:
Dlatego średni wiek członków to 22 lata.
Aby dowiedzieć się więcej o tej mierze pozycji, przeczytaj nasz tekst: Méranek.
mediana
Mediana jest podana przez centralny element grafiku, który ma nieparzystą liczbę elementów. Jeśli lista ma parzystą liczbę elementów, musimy wziąć pod uwagę dwa środkowe elementy i obliczyć średnią arytmetyczną między nimi.
Przykład
Rozważ poniższą listę.
(2, 2, 3, 3,4, 5, 6, 7, 9)
Zauważ, że element 4 dzieli rolę na dwie równe części, więc jest to element centralny.
Przykład
Oblicz medianę wieku grupy tanecznej.
Pamiętaj, że listę wiekową dla tej grupy tanecznej podaje:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Zwróć uwagę, że liczba elementów na tej liście jest równa 10, więc nie można podzielić listy na dwie równe części. Musimy więc wziąć dwa centralne elementy i wykonać średnią arytmetyczną tych wartości.
Zobacz więcej szczegółów tej miary pozycji w naszym tekście: Median.
Moda
Modę nazwiemy elementem roli, który ma największą częstotliwość, czyli elementem, który występuje w niej najczęściej.
Przykład
Ustalmy modę rolki wiekowej grupy tanecznej.
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Element, który pojawia się najczęściej, to 21, więc tryb jest równy 21.
Środki dyspersji
Środki dyspersji są stosowane w przypadkach, gdy średnia nie jest już wystarczająca. Na przykład wyobraź sobie, że dwa samochody przejechały średnio 40 000 kilometrów. Tylko mając wiedzę na temat średnich możemy powiedzieć, że oba samochody przejechały określone kilometry, prawda?
Wyobraź sobie jednak, że jeden z samochodów przejechał 79 000 kilometrów, a drugi 1000 kilometrów, pamiętaj, że tylko z informacją o średniej nie można składać oświadczeń z precyzja.
W miary dyspersji powie nam, jak daleko są elementy listy liczbowej od średniej arytmetycznej. Mamy dwie ważne miary dyspersji:
Wariancja (σ2)
Nazwijmy średnią arytmetyczną kwadratów różnicy między każdym elementem w rzucie i średnią arytmetyczną tego rzutu jako wariancję. Wariancja jest reprezentowana przez: σ2.
Rozważ listę (x1, x2, x3, …, xNie) i że ma średnią arytmetycznąx. Wariancję określa wzór:
Odchylenie standardowe (σ)
Odchylenie standardowe jest podane przez pierwiastek wariancji, mówi nam, jak bardzo element jest rozproszony w stosunku do średniej. Odchylenie standardowe oznaczono przez σ.
Przykład
Określ odchylenie standardowe zestawu danych (4, 7, 10). Zauważ, że w tym celu najpierw należy określić wariancję, a w tym celu najpierw należy obliczyć średnią tych danych.
Zastępując te dane we wzorze wariancji, mamy:
Aby określić odchylenie standardowe, musimy wyodrębnić pierwiastek wariancji.
Czytaj więcej: Miary dyspersji: wariancja i odchylenie standardowe
Do czego służą statystyki?
Widzieliśmy, że statystyka jest związana z Problemy z liczeniem lub organizacją danych. Ponadto odgrywa ważną rolę w rozwoju narzędzi umożliwiających proces organizacji danych, np. w tabelach. Statystyki są również obecne w różne dziedziny nauki, w oparciu o gromadzenie i przetwarzanie danych, możliwa jest praca z modelami matematycznymi, które pozwalają na dalszy rozwój w badanym obszarze. Niektóre dziedziny, w których statystyka ma fundamentalne znaczenie: ekonomia, meteorologia, marketing, sport, socjologia i nauki o Ziemi.
Na przykład w meteorologii dane są gromadzone w pewnym okresie, po uporządkowaniu są traktowane, a więc z na ich podstawie budowany jest model matematyczny, który pozwala w większym stopniu stwierdzić klimat minionych dni niezawodność. Statystyka to dziedzina nauki, która pozwala nam formułować twierdzenia z pewną dozą wiarygodności, ale nigdy ze 100% pewnością.
Podziały statystyczne
Statystyka podzielona jest na dwie części, opisową i wnioskową. Pierwsza związana jest z liczeniem elementów biorących udział w badaniu, elementy te są liczone jeden po drugim. W Opisowe statystyki, naszymi głównymi narzędziami są miary pozycyjne, takie jak średnia, mediana i moda, a także miary dyspersji, takie jak wariancja i odchylenie standardowe, mamy również tabele częstości i grafika.
Wciąż w statystykach opisowych mamy bardzo dobrze zdefiniowaną metodologię prezentacja danych o dużym stopniu rzetelności który przechodzi przez organizację i gromadzenie, podsumowanie, interpretację i reprezentację, a na koniec analizę danych. Klasycznym przykładem wykorzystania statystyki opisowej jest spis ludności (co 10 lat) prowadzony przez brazylijski Instytut Geografii i Statystyki (IBGE).
TEN statystyka wnioskowa, z kolei charakteryzuje się nie zbieraniem danych z elementów populacji jeden po drugim, ale przeprowadzaniem analiza próby tej populacji, wyciąganie wniosków o niej. W statystyce inferencyjnej należy zachować ostrożność przy doborze próby, ponieważ musi ona bardzo dobrze reprezentować populację. Niektóre wstępne wyniki, takie jak uśrednianie, w statystyce wnioskowej zwanej nadzieją, wyprowadza się na podstawie znajomości statystyki opisowej.
Statystyki inferencyjne są wykorzystywane na przykład w sondażach wyborczych. Dobierana jest próba populacji w sposób ją reprezentujący, a tym samym przeprowadzane są badania. Wybierając próbę, która niezbyt dobrze reprezentuje tę populację, mówimy, że badanie jest stronniczy i dlatego zawodne.
rozwiązane ćwiczenia
Pytanie 1 – (U. FA. Juiz de Fora – MG) Nauczyciel fizyki zastosował test wart 100 punktów na swoich 22 uczniach i uzyskał w rezultacie rozkład ocen przedstawiony w poniższej tabeli:
40 |
20 |
10 |
20 |
70 |
60 |
90 |
80 |
30 |
50 |
50 |
70 |
50 |
20 |
50 |
50 |
10 |
40 |
30 |
20 |
60 |
60 |
– |
– |
Wykonaj następujące operacje na danych:
a) Napisz listę tych notatek.
b) Określ względną częstotliwość najwyższej nuty.
Rozkład
a) Aby sporządzić listę tych notatek, musimy napisać je rosnąco lub malejąco. Więc musimy:
10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90
b) Patrząc na rolkę, widzimy, że najwyższa nuta była równa 90, a jej bezwzględna częstotliwość jest równa 1, ponieważ pojawia się tylko raz. Aby określić względną częstotliwość, musimy podzielić bezwzględną częstotliwość tej nuty przez całkowitą częstotliwość, w tym przypadku równą 22. A zatem:
częstotliwość względna
Aby przekazać tę liczbę w procentach, musimy ją pomnożyć przez 100.
0,045 · 100
4,5%
Pytanie 2 – (Enem) Po rzucie kostką w kształcie sześcianu z ścianami ponumerowanymi od 1 do 6, 10 kolejnych razy i zwróć uwagę na liczbę uzyskaną w każdym ruchu, poniższa tabela rozkładu częstotliwości.
Liczba uzyskana |
Częstotliwość |
1 |
4 |
2 |
1 |
4 |
2 |
5 |
2 |
6 |
1 |
Średnia, mediana i postać tego rozkładu częstotliwości to odpowiednio:
a) 3, 2 i 1
b) 3, 3 i 1
c) 3, 4 i 2
d) 5, 4 i 2
e) 6, 2 i 4
Rozkład
Alternatywa B.
Aby wyznaczyć średnią, zauważ, że uzyskane liczby są powtarzane, więc użyjemy średniej ważonej arytmetycznej.
Aby określić medianę, musimy ułożyć grafik rosnąco lub malejąco. Pamiętaj, że częstotliwość to liczba pojawiających się twarzy.
1, 1, 1, 1, 2, 4, 4, 5, 5, 6
Ponieważ liczba elementów w grafiku jest parzysta, musimy obliczyć średnią arytmetyczną centralnych elementów, które dzielą grafikę na pół, aby określić medianę, w następujący sposób:
Tryb jest określony przez element, który pojawia się najczęściej, to znaczy ma najwyższą częstotliwość, więc mamy, że tryb jest równy 1.
Zatem średnia, mediana i mod są odpowiednio równe:
3, 3 i 1
Robson Luiz
Nauczyciel matematyki
W grupie osób wiek to: 10, 12, 15 i 17 lat. Jeśli do grupy dołączy 16-latek, co dzieje się ze średnim wiekiem grupy?
Oblicz średnią pensję dla tej firmy.