bu istatistik matematik alanıdır gerçekleri ve rakamları listeler veri toplamamızı ve bunları analiz etmemizi sağlayan ve böylece bunların bazı yorumlarını gerçekleştirmeyi mümkün kılan bir dizi yöntemin bulunduğu. İstatistik iki bölüme ayrılmıştır: tanımlayıcı ve çıkarımsal. Tanımlayıcı istatistikler, verilerin organizasyonu, analizi ve sunumu ile karakterize edilirken, çıkarımsal istatistikler bir karakteristik olarak, belirli bir popülasyonun bir örneğinin incelenmesi ve buna dayalı olarak, analizlerin performansı ve sunumu Zar.
Siz de okuyun: Anketin hata payı nedir?
İstatistik İlkeleri
Daha sonra, istatistiğin temel kavramlarını ve ilkelerini göreceğiz. Onlara dayanarak, daha karmaşık kavramları tanımlamak mümkün olacaktır.
nüfus veya istatistiksel evren
Nüfus veya istatistiksel evren, tüm elemanların oluşturduğu küme Belirli bir araştırılmış konuya katılanlar.
İstatistiksel evren örnekleri
a) Bir şehirde, tüm sakinler istatistiksel evrene aittir.
b) Altı kenarlı bir zarda nüfus, yüz sayısına göre verilir.
{1, 2, 3, 4, 5, 6}
istatistiksel veri
İstatistiksel veriler bir bir bütün olarak popülasyona ait olan unsur, açıkçası bu veriler araştırma temasıyla ilgili olmalıdır.
nüfus |
istatistiksel veri |
altı yüzlü zar |
4 |
Brezilya Dağ Bisikleti Şampiyonları |
Henrique Avancini |
Örneklem
örnek diyoruz istatistiksel evrene dayalı olarak oluşturulan alt küme. Popülasyon çok büyük veya sonsuz olduğunda bir örnek kullanılır. İstatistiksel evrenden tüm bilgilerin toplanmasının finansal veya lojistik nedenlerle mümkün olmadığı durumlarda, örneklemlerin kullanılması da gereklidir.
Bir anket için örneklem seçimi son derece önemlidir ve popülasyonu güvenilir bir şekilde temsil etmelidir. Bir ankette numune kullanımının klasik bir örneği, nüfus sayımı ülkemizin.
Değişken
İstatistikte değişken, çalışmanın nesnesidir, yani, araştırmanın araştırmayı amaçladığı konu. Örneğin, bir şehrin özelliklerini incelerken, yaşayanların sayısı bir değişken olabilir, ayrıca belirli bir dönemdeki yağmur hacmi ve hatta ulaşım için otobüs sayısı halka açık. İstatistikteki değişken kavramının araştırma bağlamına bağlı olduğunu unutmayın.
İstatistiklerdeki verilerin organizasyonu, aşamalar, herhangi bir organizasyon sürecinde olduğu gibi. Öncelikle araştırılacak konu seçilir, daha sonra araştırma verilerinin toplanma yöntemi düşünülür ve üçüncü adım toplama işlemidir. Bu son adımın ardından toplananların analizi yapılır ve böylece yoruma dayalı olarak sonuçlar aranır. Şimdi veri organizasyonu için bazı önemli ve gerekli kavramları göreceğiz.
Şimdi durma... Reklamdan sonra devamı var ;)
rol
Verilerin sayılarla temsil edilebildiği, yani değişkenin nicel olduğu durumlarda, bu verilerin organizasyonu. Bir liste artan veya azalan olabilir. Bir değişken nicel değilse, yani nitel ise, örneğin veriler belirli bir ürüne ilişkin duygular ise, listeyi kullanmak mümkün değildir.
Misal
Bir sınıfta öğrencilerin metre cinsinden boyları toplanmıştır. Bunlar: 1.70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.
Liste artan veya azalan bir şekilde düzenlenebildiğinden, şu şekildedir:
rol: (1.60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
Rulo önceden monte edildiğinde, verileri daha kolay bulmanın mümkün olduğunu unutmayın.
Frekans dağılım tablosu
Listede çok sayıda öğenin olduğu ve verilerin çok sayıda tekrarlandığı durumlarda, bu verilerin organizasyonu pratik olmadığı için liste geçersiz hale gelir. Bu durumlarda, tablolar ve frekans dağılımı mükemmel bir organizasyon aracı olarak hizmet ederler.
dağıtım tablosundaki mutlak frekans, her verinin görünme sıklığını, yani kaç kez göründüğünü koymalıyız.
için dağıtım tablosunu oluşturalım. mutlak frekans Belirli bir sınıftaki öğrencilerin yıl cinsinden yaşları.
Mutlak frekans dağılımı | |
Yaş |
Frekans (F) |
8 |
2 |
9 |
12 |
10 |
12 |
11 |
14 |
12 |
1 |
Toplam (FT) |
41 |
Tablodan şu bilgileri alabiliriz: sınıfta 8, 12 yaşlarında 2 öğrencimiz var. 9 yaşındaki öğrenci ve 10 yaşındaki 12 öğrenci daha olmak üzere toplam 41 öğrenciye ulaşıyor. öğrenciler. dağıtım tablosundaki birikmiş frekanslar, bir önceki satırdaki frekansı eklemeliyiz (mutlak frekans dağılım tablosunda).
Önceki örnekte olduğu gibi aynı sınıfın yaşları için kümülatif sıklık dağılım tablosunu oluşturalım, bakınız:
Birikmiş frekans dağılımı | |
Yaş |
Frekans (F) |
8 |
2 |
9 |
14 |
10 |
26 |
11 |
40 |
12 |
41 |
Toplam (FT) |
41 |
tablosunda bağıl frekansların dağılımı, her verinin göründüğü yüzde kullanılır. Yine mutlak frekans dağılım tablosuna göre hesaplamaları yapacağız. 41'in sınıftaki öğrencilerin %100'üne tekabül ettiğini biliyoruz. yüzde her yaştan, sadece yaşın frekansını 41'e bölüp sonucu 100 ile çarpıyoruz ki yüzde olarak yazabilelim.
2: 41 = 0,048 · 100 → 4,8%
12: 41 = 0,292 · 100 → 29,2%
12: 41 = 0,292 · 100 → 29,2%
14: 41 = 0,341 · 100 → 34,1%
1: 41 = 0,024 · 100 → 2,4%
Göreceli frekans dağılımı | |
Yaş |
Frekans (F) |
8 |
4,8% |
9 |
29,2% |
10 |
29,2% |
11 |
34,1% |
12 |
2,4% |
Toplam (FT) |
100% |
Siz de okuyun:Uygulama veİstatistik: fSıklık mutlak ve fgöreceli frekans
sınıflar
Değişkenin sürekli olduğu, yani birden fazla değere sahip olduğu durumlarda bunları gruplandırmak gerekir. gerçek aralıklar. İstatistikte bu aralıklara sınıf denir..
tablosunu oluşturmak için sınıflarda frekans dağılımı, aralıkları uygun başlıklarıyla sol sütuna ve sağ sütuna koymalıyız. her bir aralığın mutlak frekansını, yani her birine kaç öğenin ait olduğunu koyun onların.
Misal
Bir okulda lise 3. sınıftaki öğrencilerin boyları.
Sınıflarda frekans dağılımı | |
yükseklik (metre) |
Mutlak frekans (F) |
[1,40; 1,50[ |
1 |
[1,50; 1,60[ |
4 |
[1,60; 1,70[ |
8 |
[1,70; 1,80[ |
2 |
[1,80; 1,90[ |
1 |
Toplam (FT) |
16 |
Sınıflardaki sıklık dağılım tablosunu incelediğimizde, üçüncü sınıf sınıfında 1 öğrencimiz olduğunu görebiliriz. 1,40 m ile 1,50 m arasında yüksekliğe sahip olan, tıpkı 1,50 ile 1,60 m arasında 4 öğrencimiz olduğu gibi, art arda. Öğrencilerin boylarının 1.40 m ile 1.90 m arasında olduğunu da gözlemleyebiliriz, bu ölçümler arasındaki, yani örneğin en yüksek ve en düşük yüksekliği arasındaki farka denir. genlik.
Bir sınıfın üst ve alt sınırları arasındaki farka denir. sınıf genişliğiBöylece boyları 1,50 metre (dahil) ile 1,60 metre (dahil değil) arasında 4 öğrenciye sahip olan ikincisi, aşağıdaki özelliklere sahiptir:
1,60 – 1,50
0.10 metre
Ayrıca bakınız: Dağılım ölçüleri: genlik ve sapma
pozisyon ölçümleri
Konum ölçüleri, veriler veya bir frekans tablosu ile sayısal bir yuvarlama oluşturmanın mümkün olduğu durumlarda kullanılır. Bu ölçümler, öğelerin listeye göre konumunu gösterir. Üç ana konum ölçüsü şunlardır:
Ortalama
Öğeleri içeren listeyi düşünün (a1, bir2, bir3, bir4, …,Hayır), bu n elemanın aritmetik ortalaması şu şekilde verilir:
Misal
Bir dans grubunda, üyelerin yaşları toplandı ve aşağıdaki listede temsil edildi:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Bu dans grubunun üyelerinin yaş ortalamasını belirleyelim.
Formüle göre, tüm elemanları toplamalı ve bu sonucu listedeki eleman sayısına bölmeliyiz, şöyle:
Bu nedenle, üyelerin yaş ortalaması 22'dir.
Bu konum ölçüsü hakkında daha fazla bilgi edinmek için metnimizi okuyun: Mésabah.
medyan
Medyan, tek sayıda öğeye sahip bir listenin merkezi öğesi tarafından verilir. Liste çift sayıda öğeye sahipse, iki merkezi öğeyi göz önünde bulundurmalı ve aralarındaki aritmetik ortalamayı hesaplamalıyız.
Misal
Aşağıdaki listeyi göz önünde bulundurun.
(2, 2, 3, 3,4, 5, 6, 7, 9)
4. öğenin rolü iki eşit parçaya böldüğünü, dolayısıyla merkezi öğe olduğunu unutmayın.
Misal
Dans grubunun ortanca yaşını hesaplayın.
Bu dans grubunun yaş listesinin şu kişiler tarafından verildiğini unutmayın:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
Bu listedeki eleman sayısının 10'a eşit olduğuna dikkat edin, bu nedenle listeyi iki eşit parçaya bölmek mümkün değildir. Bu yüzden iki merkezi eleman almalı ve bu değerlerin aritmetik ortalamasını yapmalıyız.
Bu konum ölçüsünün daha fazla ayrıntısını metnimizde görün: Mortanca.
Moda
Rolün frekansı en yüksek, yani içinde en çok görünen unsuruna moda diyeceğiz.
Misal
Dans grubunun yaş rulosunun modasını belirleyelim.
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
En çok görünen eleman 21'dir, yani mod 21'e eşittir.
Dağılım önlemleri
Dağılım önlemleri ortalamanın artık yeterli olmadığı durumlarda kullanılır. Örneğin, iki arabanın ortalama 40.000 kilometre kat ettiğini hayal edin. Sadece ortalamalar hakkında bilgi sahibi olarak, iki arabanın her birinin belirlenebilir kilometreler yürüdüğünü söyleyebiliriz, değil mi?
Ancak, arabalardan birinin 79.000 kilometre ve diğer 1.000 kilometre kat ettiğini hayal edin. kilometre, sadece ortalama hakkında bilgi ile açıklama yapmanın mümkün olmadığını unutmayın. hassas.
saat dağılım önlemleri bize sayısal bir listenin elemanlarının aritmetik ortalamadan ne kadar uzak olduğunu söyleyecektir. İki önemli dağılım önlemimiz var:
varyans (σ2)
Rulodaki her bir eleman arasındaki farkın karelerinin aritmetik ortalamasını ve o rulonun aritmetik ortalamasını varyans olarak adlandıralım. Varyans şu şekilde temsil edilir: σ2.
Listeyi düşünün (x1, x2, x3, …, xHayır) ve aritmetik ortalamaya sahip olduğunux. Varyans şu şekilde verilir:
Standart sapma (σ)
Standart sapma, varyansın kökü tarafından verilir, bize bir elemanın ortalamaya göre ne kadar dağıldığını söyler. Standart sapma σ ile gösterilir.
Misal
Veri setinin (4, 7, 10) standart sapmasını belirleyin. Bunun için önce varyansı belirlemek ve bunun için önce bu verilerin ortalamasını hesaplamak gerektiğini unutmayın.
Bu verileri varyans formülünde değiştirirsek:
Standart sapmayı belirlemek için varyansın kökünü çıkarmamız gerekir.
Devamını oku: Dağılım ölçüleri: varyans ve standart sapma
İstatistikler ne için?
istatistiğin ilişkili olduğunu gördük. Sayma veya Veri Düzenleme Sorunları. Ayrıca tablolar gibi verilerin düzenlenmesi sürecini sağlayan araçların geliştirilmesinde de önemli bir role sahiptir. İstatistikler de mevcut çeşitli bilim alanları, veri toplama ve işlemeye dayalı olarak, çalışılan alanda daha fazla gelişmeye izin veren matematiksel modellerle çalışmak mümkündür. İstatistiğin temel olduğu bazı alanlar: ekonomi, meteoroloji, pazarlama, spor, sosyoloji ve yer bilimleri.
Örneğin meteorolojide veriler belirli bir süre içinde toplanır, organize edildikten sonra işlenir ve böylece onlara dayanarak, önceki günlerin iklimi hakkında daha büyük bir derece ile iddiada bulunmamıza izin veren matematiksel bir model inşa edildi. güvenilirlik. İstatistik, bir dereceye kadar güvenilirlikle ifadeler yapmamıza izin veren bir bilim dalıdır, ancak asla %100 kesinlik yoktur.
İstatistik bölümleri
İstatistikler tanımlayıcı ve çıkarımsal olmak üzere iki kısma ayrılır. Birincisi, araştırmaya dahil olan unsurların sayılması ile ilgili olup, bu unsurlar tek tek sayılmıştır. saat Tanımlayıcı istatistikler, ana araçlarımız ortalama, medyan ve mod gibi konum ölçümlerinin yanı sıra varyans ve standart sapma gibi dağılım ölçüleri, ayrıca frekans tablolarımız ve grafik.
Hala tanımlayıcı istatistiklerde, çok iyi tanımlanmış bir metodolojimiz var. önemli derecede güvenilirlik ile verilerin sunumu organizasyon ve toplama, özet, yorumlama ve temsil ve son olarak veri analizinden geçer. Tanımlayıcı istatistiklerin kullanımına ilişkin klasik bir örnek, Brezilya Coğrafya ve İstatistik Enstitüsü tarafından yapılan nüfus sayımında (10 yılda bir) ortaya çıkar.IBGE).
bu çıkarımsal istatistik, sırayla, bir popülasyonun öğelerinden tek tek veri toplamakla değil, bu popülasyonun bir örneğinin analizi, sonuç çıkarma Onun hakkında. Çıkarımsal istatistiklerde, evreni çok iyi temsil etmesi gerektiğinden örneklem seçilirken dikkatli olunmalıdır. Umut adı verilen çıkarımsal istatistiklerde ortalama alma gibi bazı ilk sonuçlar, tanımlayıcı istatistik bilgisine dayalı olarak çıkarılır.
Çıkarımsal istatistikler, örneğin seçim anketlerinde kullanılır. Evrenden bir örneklem seçilerek onu temsil edecek şekilde araştırma yapılır. Bu evreni çok iyi temsil etmeyen bir örneklem seçerken araştırmanın başarılı olduğunu söyleriz. önyargılı ve bu nedenle güvenilmez.
çözülmüş alıştırmalar
soru 1 – (Ü. F. Juiz de Fora – MG) Bir fizik öğretmeni 22 öğrencisine 100 puanlık bir test uyguladı ve sonuç olarak aşağıdaki tabloda görülen not dağılımını elde etti:
40 |
20 |
10 |
20 |
70 |
60 |
90 |
80 |
30 |
50 |
50 |
70 |
50 |
20 |
50 |
50 |
10 |
40 |
30 |
20 |
60 |
60 |
– |
– |
Aşağıdaki veri işlemlerini gerçekleştirin:
a) Bu notların listesini yazın.
b) En yüksek notanın nispi frekansını belirleyin.
çözüm
a) Bu notların listesini yapmak için artan veya azalan şekilde yazmalıyız. Öyleyse yapmalıyız:
10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90
b) Ruloya baktığımızda, en yüksek notanın 90'a eşit olduğunu ve sadece bir kez göründüğü için mutlak frekansının 1'e eşit olduğunu görebiliriz. Göreceli frekansı belirlemek için, o notanın mutlak frekansını, bu durumda 22'ye eşit olan toplam frekansa bölmeliyiz. Böylece:
göreceli frekans
Bu sayıyı yüzde olarak geçmek için 100 ile çarpmamız gerekir.
0,045 · 100
4,5%
Soru 2 – (Düşman) Yüzleri 1'den 6'ya kadar numaralandırılmış küp şeklindeki bir kalıbın üst üste 10 kez yuvarlanmasından sonra ve her harekette elde edilen sayıyı not edin, aşağıdaki dağılım tablosu frekanslar.
Elde edilen sayı |
Sıklık |
1 |
4 |
2 |
1 |
4 |
2 |
5 |
2 |
6 |
1 |
Bu frekans dağılımının ortalaması, medyanı ve modu sırasıyla:
a) 3, 2 ve 1
b) 3, 3 ve 1
c) 3, 4 ve 2
d) 5, 4 ve 2
e) 6, 2 ve 4
çözüm
Alternatif B.
Ortalamayı belirlemek için elde edilen sayıların tekrarı olduğuna dikkat edin, bu nedenle ağırlıklı aritmetik ortalamayı kullanacağız.
Medyanı belirlemek için, listeyi artan veya azalan şekilde düzenlemeliyiz. Sıklığın yüzün görünme sayısı olduğunu unutmayın.
1, 1, 1, 1, 2, 4, 4, 5, 5, 6
Listedeki eleman sayısı çift olduğundan, ortancayı belirlemek için listeyi ikiye bölen merkezi elemanların aritmetik ortalamasını hesaplamamız gerekir, şöyle:
Mod, en çok görünen, yani en yüksek frekansa sahip olan eleman tarafından verilir, yani modun 1'e eşit olduğunu elde ederiz.
Böylece, ortalama, medyan ve mod sırasıyla şuna eşittir:
3, 3 ve 1
Robson Luiz tarafından
Matematik öğretmeni
Bir grup insanda yaşlar: 10, 12, 15 ve 17 yaşında. 16 yaşında biri gruba katılırsa, grubun yaş ortalaması ne olur?
Bu şirket için ortalama maaşı hesaplayın.