सांख्यिकीय गणित का क्षेत्र है कि तथ्यों और आंकड़ों को सूचीबद्ध करता है जिसमें तरीकों का एक सेट है जो हमें डेटा एकत्र करने और उनका विश्लेषण करने में सक्षम बनाता है, इस प्रकार उनकी कुछ व्याख्या करना संभव बनाता है। आँकड़ों को दो भागों में बांटा गया है: वर्णनात्मक तथा अनुमान वर्णनात्मक आँकड़ों की विशेषता डेटा के संगठन, विश्लेषण और प्रस्तुतिकरण द्वारा होती है, जबकि अनुमानात्मक आँकड़े होते हैं एक विशेषता के रूप में किसी दी गई आबादी के नमूने का अध्ययन और, उसके आधार पर, विश्लेषण का प्रदर्शन और की प्रस्तुति पासा।
यह भी पढ़ें: एक सर्वेक्षण की त्रुटि का मार्जिन क्या है?
सांख्यिकी के सिद्धांत
इसके बाद, हम सांख्यिकी की मुख्य अवधारणाओं और सिद्धांतों को देखेंगे। उनके आधार पर, अधिक परिष्कृत अवधारणाओं को परिभाषित करना संभव होगा।
जनसंख्या या सांख्यिकीय ब्रह्मांड
जनसंख्या या सांख्यिकीय ब्रह्मांड है सभी तत्वों द्वारा गठित सेट जो किसी विशेष शोध विषय में भाग लेते हैं।
सांख्यिकीय ब्रह्मांड के उदाहरण
क) एक शहर में, सभी निवासी सांख्यिकीय ब्रह्मांड से संबंधित हैं।
b) छह-पक्षीय पासे पर, चेहरे की संख्या से जनसंख्या दी जाती है।
{1, 2, 3, 4, 5, 6}
सांख्यिकीय डेटा
सांख्यिकीय डेटा एक. है वह तत्व जो समग्र रूप से जनसंख्या का हैजाहिर है, यह डेटा शोध विषय के साथ शामिल होना चाहिए।
आबादी |
सांख्यिकीय डेटा |
छह तरफा पासा |
4 |
ब्राजीलियाई माउंटेन बाइक चैंपियंस |
हेनरिक अवांसिनी |
नमूना
हम नमूना कहते हैं सांख्यिकीय ब्रह्मांड के आधार पर गठित उपसमुच्चय. एक नमूने का उपयोग तब किया जाता है जब जनसंख्या बहुत बड़ी या अनंत होती है। ऐसे मामलों में जहां सांख्यिकीय ब्रह्मांड से सभी जानकारी एकत्र करना वित्तीय या तार्किक कारणों से संभव नहीं है, नमूनों का उपयोग करना भी आवश्यक है।
एक सर्वेक्षण के लिए एक नमूने का चुनाव अत्यंत महत्वपूर्ण है, और इसे विश्वसनीय रूप से जनसंख्या का प्रतिनिधित्व करना चाहिए। एक सर्वेक्षण में नमूनों के उपयोग का एक उत्कृष्ट उदाहरण है जनसांख्यिकीय जनगणना हमारे देश की।
परिवर्तनशील
सांख्यिकी में, चर अध्ययन की वस्तु है, अर्थात्, वह विषय जिसका शोध अध्ययन करना चाहता है. उदाहरण के लिए, किसी शहर की विशेषताओं का अध्ययन करते समय, निवासियों की संख्या एक चर हो सकती है, साथ ही एक निश्चित अवधि में बारिश की मात्रा या परिवहन के लिए बसों की संख्या भी सह लोक। ध्यान दें कि सांख्यिकी में चर की अवधारणा अनुसंधान संदर्भ पर निर्भर है।
आँकड़ों में डेटा का संगठन होता है चरणों, जैसा कि किसी भी संगठन प्रक्रिया में होता है। प्रारंभ में, शोध के लिए विषय का चयन किया जाता है, फिर शोध डेटा एकत्र करने की विधि पर विचार किया जाता है, और तीसरा चरण संग्रह को अंजाम देना है। इस अंतिम चरण के अंत के बाद, जो एकत्र किया गया था उसका विश्लेषण किया जाता है, और इस प्रकार, व्याख्या के आधार पर, परिणाम मांगे जाते हैं। अब हम डेटा संगठन के लिए कुछ महत्वपूर्ण और आवश्यक अवधारणाओं को देखेंगे।
अब मत रोको... विज्ञापन के बाद और भी बहुत कुछ है;)
भूमिका
ऐसे मामलों में जहां डेटा को संख्याओं द्वारा दर्शाया जा सकता है, अर्थात, जब चर मात्रात्मक है, के लिए सूची इन आंकड़ों का संगठन. रोस्टर आरोही या अवरोही हो सकता है। यदि कोई चर मात्रात्मक नहीं है, अर्थात यदि यह गुणात्मक है, तो सूची का उपयोग करना संभव नहीं है, उदाहरण के लिए, यदि डेटा किसी विशेष उत्पाद के बारे में भावनाएं हैं।
उदाहरण
एक कक्षा में, विद्यार्थियों की ऊँचाई मीटरों में एकत्रित की गई। वे हैं: 1.70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.
जैसा कि सूची को आरोही या अवरोही तरीके से व्यवस्थित किया जा सकता है, यह इस प्रकार है:
रोल: (1.60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}
ध्यान दें कि, पहले से ही असेंबल किए गए रोल के साथ, डेटा को अधिक आसानी से खोजना संभव है।
आवृत्ति वितरण तालिका
ऐसे मामलों में जहां सूची में कई तत्व होते हैं और डेटा की कई पुनरावृत्ति होती है, सूची अप्रचलित हो जाती है, क्योंकि इन आंकड़ों का संगठन अव्यावहारिक है। इन मामलों में, टेबल और आवृत्ति वितरण वे एक उत्कृष्ट संगठनात्मक उपकरण के रूप में कार्य करते हैं।
वितरण तालिका में पूर्ण आवृत्ति, हमें उस आवृत्ति को रखना चाहिए जिस पर प्रत्येक डेटा दिखाई देता है, यानी जितनी बार दिखाई देता है।
आइए वितरण तालिका बनाएं निरपेक्ष आवृत्ति किसी कक्षा में विद्यार्थियों की आयु, वर्षों में।
निरपेक्ष आवृत्ति वितरण | |
उम्र |
आवृत्ति (एफ) |
8 |
2 |
9 |
12 |
10 |
12 |
11 |
14 |
12 |
1 |
कुल (एफटी) |
41 |
तालिका से हम निम्नलिखित जानकारी प्राप्त कर सकते हैं: कक्षा में हमारे पास 8, 12 वर्ष की आयु के 2 छात्र हैं ९-वर्षीय छात्र, और १२ और १०-वर्षीय छात्र, और इसी तरह, कुल ४१. तक पहुँचते हैं छात्र। वितरण तालिका में संचित आवृत्तियों, हमें पिछली पंक्ति (पूर्ण आवृत्ति वितरण तालिका में) से बारंबारता जोड़नी होगी।
आइए पिछले उदाहरण की तरह उसी वर्ग की आयु के लिए संचयी बारंबारता वितरण तालिका बनाएं, देखें:
संचित आवृत्ति वितरण | |
उम्र |
आवृत्ति (एफ) |
8 |
2 |
9 |
14 |
10 |
26 |
11 |
40 |
12 |
41 |
कुल (एफटी) |
41 |
की तालिका में सापेक्ष आवृत्तियों का वितरण, जिस प्रतिशत में प्रत्येक डेटा प्रकट होता है उसका उपयोग किया जाता है। फिर से हम परिकलन निरपेक्ष बारंबारता बंटन तालिका के आधार पर करेंगे। हम जानते हैं कि ४१ कक्षा में १००% छात्रों से मेल खाता है, इसलिए निर्धारित करने के लिए प्रतिशत प्रत्येक आयु में, हम केवल आयु की आवृत्ति को 41 से विभाजित करते हैं और परिणाम को 100 से गुणा करते हैं, ताकि हम इसे प्रतिशत के रूप में लिख सकें।
2: 41 = 0,048 · 100 → 4,8%
12: 41 = 0,292 · 100 → 29,2%
12: 41 = 0,292 · 100 → 29,2%
14: 41 = 0,341 · 100 → 34,1%
1: 41 = 0,024 · 100 → 2,4%
सापेक्ष आवृत्ति वितरण | |
उम्र |
आवृत्ति (एफ) |
8 |
4,8% |
9 |
29,2% |
10 |
29,2% |
11 |
34,1% |
12 |
2,4% |
कुल (एफटी) |
100% |
यह भी पढ़ें:का आवेदन तथासांख्यिकी: एफआवृत्ति निरपेक्ष और एफसापेक्ष आवृत्ति
कक्षाओं
ऐसे मामलों में जहां चर निरंतर है, अर्थात, जब इसके कई मान हैं, तो उन्हें समूह में रखना आवश्यक है वास्तविक अंतराल. सांख्यिकी में, इन अंतरालों को वर्ग कहा जाता है।.
की तालिका बनाने के लिए कक्षाओं में बारंबारता वितरण, हमें अंतरालों को बाएं कॉलम में, उनके उचित शीर्षक के साथ, और दाएं कॉलम में, हमें अवश्य रखना चाहिए प्रत्येक अंतराल की निरपेक्ष आवृत्ति डालें, अर्थात प्रत्येक में कितने तत्व हैं जो अपने।
उदाहरण
एक स्कूल में हाई स्कूल के तीसरे वर्ष में छात्रों की ऊंचाई।
कक्षाओं में बारंबारता वितरण | |
ऊंचाई (मीटर) |
निरपेक्ष आवृत्ति (एफ) |
[1,40; 1,50[ |
1 |
[1,50; 1,60[ |
4 |
[1,60; 1,70[ |
8 |
[1,70; 1,80[ |
2 |
[1,80; 1,90[ |
1 |
कुल (एफटी) |
16 |
कक्षाओं में बारंबारता बंटन तालिका का विश्लेषण करते हुए, हम देख सकते हैं कि, तीसरे वर्ष की कक्षा में, हमारे पास 1 छात्र है जिसकी ऊंचाई 1.40 मीटर और 1.50 मीटर के बीच है, जैसे हमारे पास 4 छात्र हैं जिनकी ऊंचाई 1.50 और 1.60 मीटर के बीच है, और इसी तरह क्रमिक रूप से। हम यह भी देख सकते हैं कि छात्रों की ऊंचाई 1.40 मीटर और 1.90 मीटर के बीच है, इन मापों के बीच का अंतर, यानी नमूने की उच्चतम और निम्नतम ऊंचाई के बीच का अंतर कहलाता है आयाम.
किसी वर्ग की ऊपरी और निचली सीमा के बीच के अंतर को कहा जाता है वर्ग चौड़ाई, इस प्रकार, दूसरा, जिसमें 4 छात्र हैं जिनकी ऊंचाई 1.50 मीटर (शामिल) और 1.60 मीटर (शामिल नहीं) के बीच है, की सीमा है:
1,60 – 1,50
0.10 मीटर
यह भी देखें: फैलाव उपाय: आयाम और विचलन
स्थिति माप
स्थिति उपायों का उपयोग उन मामलों में किया जाता है जहां डेटा या आवृत्ति तालिका के साथ संख्यात्मक रोल बनाना संभव होता है। ये माप रोस्टर के संबंध में तत्वों की स्थिति को दर्शाते हैं। स्थिति के तीन मुख्य उपाय हैं:
औसत
तत्वों के साथ सूची पर विचार करें (ए1, ए2, ए3, ए4,..., थेनहीं न), इन n तत्वों का समांतर माध्य निम्न द्वारा दिया जाता है:

उदाहरण
एक नृत्य समूह में, सदस्यों की आयु एकत्र की गई और उन्हें निम्नलिखित सूची में दर्शाया गया:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
आइए इस नृत्य समूह के सदस्यों की औसत आयु निर्धारित करें।
सूत्र के अनुसार, हमें सभी तत्वों को जोड़ना होगा और इस परिणाम को सूची में तत्वों की संख्या से विभाजित करना होगा, जैसे:

अतः सदस्यों की औसत आयु 22 वर्ष है।
इस स्थिति माप के बारे में अधिक जानने के लिए, हमारा पाठ पढ़ें: मéसुबह.
मंझला
माध्यिका एक रोस्टर के केंद्रीय तत्व द्वारा दी जाती है जिसमें विषम संख्या में तत्व होते हैं। यदि सूची में तत्वों की संख्या समान है, तो हमें दो केंद्रीय तत्वों पर विचार करना चाहिए और उनके बीच अंकगणितीय माध्य की गणना करनी चाहिए।
उदाहरण
निम्नलिखित सूची पर विचार करें।
(2, 2, 3, 3,4, 5, 6, 7, 9)
ध्यान दें कि तत्व 4 भूमिका को दो बराबर भागों में विभाजित करता है, इसलिए यह केंद्रीय तत्व है।
उदाहरण
नृत्य समूह की औसत आयु की गणना करें।
याद रखें कि इस नृत्य समूह के लिए आयु की सूची निम्न द्वारा दी गई है:
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
ध्यान दें कि इस सूची में तत्वों की संख्या 10 के बराबर है, इसलिए सूची को दो बराबर भागों में विभाजित करना संभव नहीं है। इसलिए हमें दो केंद्रीय तत्वों को लेना चाहिए और इन मूल्यों का अंकगणितीय माध्य करना चाहिए।

हमारे पाठ में इस स्थिति माप के अधिक विवरण देखें: मईडियन.
फैशन
हम फैशन को उस भूमिका का तत्व कहेंगे जिसकी आवृत्ति सबसे अधिक है, यानी वह तत्व जो उसमें सबसे अधिक दिखाई देता है।
उदाहरण
आइए नृत्य समूह के आयु रोल के फैशन का निर्धारण करें।
(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)
सबसे अधिक दिखाई देने वाला तत्व 21 है, इसलिए बहुलक 21 के बराबर है।
फैलाव उपाय
फैलाव उपाय हैं उन मामलों में उपयोग किया जाता है जहां औसत अब पर्याप्त नहीं है. उदाहरण के लिए, कल्पना कीजिए कि दो कारों ने औसतन 40,000 किलोमीटर की दूरी तय की है। केवल औसत के बारे में ज्ञान के साथ ही हम कह सकते हैं कि दोनों कारें एक निश्चित किलोमीटर की दूरी तय करती हैं, है ना?
हालांकि, कल्पना करें कि कारों में से एक ने 79,000 किलोमीटर की दूरी तय की है, और अन्य ने 1,000 किलोमीटर, ध्यान दें कि केवल औसत के बारे में जानकारी के साथ बयान देना संभव नहीं है परिशुद्धता।
पर फैलाव उपाय हमें बताएगा कि संख्यात्मक सूची के तत्व अंकगणितीय माध्य से कितनी दूर हैं। हमारे पास फैलाव के दो महत्वपूर्ण उपाय हैं:
प्रसरण (σ2)
आइए रोल में प्रत्येक तत्व के बीच अंतर के वर्गों के अंकगणितीय माध्य और उस रोल के अंकगणितीय माध्य को विचरण कहते हैं। विचरण द्वारा दर्शाया गया है:2.
सूची पर विचार करें (x1, एक्स2, एक्स3, …, एक्सनहीं न) और इसका अंकगणितीय माध्य हैएक्स. भिन्नता द्वारा दिया जाता है:

मानक विचलन (σ)
मानक विचलन विचरण के मूल द्वारा दिया जाता है, यह हमें बताता है कि माध्य के संबंध में कोई तत्व कितना बिखरा हुआ है। मानक विचलन को द्वारा निरूपित किया जाता है।
उदाहरण
डेटा सेट (4, 7, 10) के मानक विचलन का निर्धारण करें। ध्यान दें, इसके लिए पहले विचरण निर्धारित करना आवश्यक है, और इसके लिए, पहले इन आंकड़ों के औसत की गणना करना आवश्यक है।

इन आंकड़ों को प्रसरण सूत्र में प्रतिस्थापित करते हुए, हमारे पास है:

मानक विचलन निर्धारित करने के लिए, हमें विचरण की जड़ को निकालना होगा।

अधिक पढ़ें: फैलाव उपाय: विचरण और मानक विचलन
सांख्यिकी किस लिए है?
हमने देखा कि आँकड़ा संबंधित है गिनती या डेटा संगठन की समस्याएं. इसके अलावा, डेटा को व्यवस्थित करने की प्रक्रिया को सक्षम करने वाले उपकरणों के विकास में इसकी महत्वपूर्ण भूमिका है, जैसे कि टेबल। आंकड़े भी मौजूद हैं विज्ञान के विभिन्न क्षेत्र, डेटा संग्रह और उपचार के आधार पर, गणितीय मॉडल के साथ काम करना संभव है जो अध्ययन किए गए क्षेत्र में और विकास की अनुमति देता है। कुछ क्षेत्र जिनमें सांख्यिकी मौलिक हैं: अर्थशास्त्र, मौसम विज्ञान, विपणन, खेल, समाजशास्त्र और भूविज्ञान।
मौसम विज्ञान में, उदाहरण के लिए, एक निश्चित अवधि में डेटा एकत्र किया जाता है, व्यवस्थित होने के बाद, उनका इलाज किया जाता है, और इसलिए, के साथ उनके आधार पर, एक गणितीय मॉडल बनाया गया है जो हमें पिछले दिनों की जलवायु के बारे में अधिक से अधिक डिग्री के साथ जोर देने की अनुमति देता है विश्वसनीयता। सांख्यिकी विज्ञान की एक शाखा है जो हमें कुछ हद तक विश्वसनीयता के साथ बयान देने की अनुमति देती है, लेकिन कभी भी 100% निश्चितता के साथ नहीं।
सांख्यिकी विभाग
सांख्यिकी को दो भागों में बांटा गया है, वर्णनात्मक और अनुमानात्मक। पहला शोध में शामिल तत्वों की गिनती से संबंधित है, इन तत्वों को एक-एक करके गिना जाता है। पर वर्णनात्मक आँकड़े, हमारे मुख्य उपकरण स्थिति माप हैं, जैसे माध्य, माध्यिका और बहुलक, साथ ही विचरण और मानक विचलन जैसे फैलाव उपाय, हमारे पास आवृत्ति तालिकाएं भी हैं और ग्राफिक्स।
अभी भी वर्णनात्मक आँकड़ों में, हमारे पास a. के लिए एक बहुत अच्छी तरह से परिभाषित कार्यप्रणाली है काफी हद तक विश्वसनीयता के साथ डेटा की प्रस्तुति जो संगठन और संग्रह, सारांश, व्याख्या और प्रतिनिधित्व और अंत में, डेटा विश्लेषण के माध्यम से जाता है। वर्णनात्मक आंकड़ों के उपयोग का एक उत्कृष्ट उदाहरण ब्राजीलियाई भूगोल और सांख्यिकी संस्थान द्वारा जनसंख्या जनगणना (हर 10 वर्ष) में होता है (आईबीजीई).
आनुमानिक आंकड़े, बदले में, यह जनसंख्या के तत्वों से एक-एक करके डेटा एकत्र करके नहीं, बल्कि इसे पूरा करने की विशेषता है इस आबादी के नमूने का विश्लेषण, निष्कर्ष निकालना उसके बारे में। अनुमान के आंकड़ों में, नमूना चुनते समय सावधानी बरतनी चाहिए, क्योंकि यह जनसंख्या का बहुत अच्छी तरह से प्रतिनिधित्व करता है। कुछ प्रारंभिक परिणाम, जैसे कि औसत, अनुमानित आँकड़ों में जिन्हें आशा कहा जाता है, वर्णनात्मक आँकड़ों के ज्ञान के आधार पर निकाले जाते हैं।
उदाहरण के लिए, चुनावी चुनावों में अनुमानित आंकड़ों का उपयोग किया जाता है। जनसंख्या का एक नमूना चुना जाता है, जो इसका प्रतिनिधित्व करता है, और इस प्रकार अनुसंधान किया जाता है। एक नमूना चुनते समय जो इस आबादी का बहुत अच्छी तरह से प्रतिनिधित्व नहीं करता है, हम कहते हैं कि शोध है research झुका हुआ और इसलिए अविश्वसनीय।

हल किए गए अभ्यास
प्रश्न 1 - (यू. एफ जुइज़ डी फोरा - एमजी) एक भौतिकी शिक्षक ने अपने 22 छात्रों के लिए 100 अंकों के मूल्य का एक परीक्षण लागू किया और परिणामस्वरूप, निम्न तालिका में देखा गया ग्रेड का वितरण प्राप्त किया:
40 |
20 |
10 |
20 |
70 |
60 |
90 |
80 |
30 |
50 |
50 |
70 |
50 |
20 |
50 |
50 |
10 |
40 |
30 |
20 |
60 |
60 |
– |
– |
निम्नलिखित डेटा उपचार करें:
क) इन नोटों की सूची लिखिए।
बी) उच्चतम नोट की सापेक्ष आवृत्ति निर्धारित करें।
संकल्प
a) इन नोटों की सूची बनाने के लिए, हमें उन्हें आरोही या अवरोही तरीके से लिखना होगा। तो हमें करना होगा:
10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90
बी) रोल को देखते हुए, हम देख सकते हैं कि उच्चतम नोट 90 के बराबर था और इसकी पूर्ण आवृत्ति 1 के बराबर है, क्योंकि यह केवल एक बार दिखाई देता है। सापेक्ष आवृत्ति निर्धारित करने के लिए, हमें उस नोट की पूर्ण आवृत्ति को कुल आवृत्ति से विभाजित करना होगा, इस मामले में 22 के बराबर। इस प्रकार:
सापेक्ष आवृत्ति

इस संख्या को प्रतिशत के रूप में पारित करने के लिए, हमें इसे 100 से गुणा करना होगा।
0,045 · 100
4,5%
प्रश्न २ – (एनेम) एक घन के आकार के पासे को घुमाने के बाद, जिसके फलक १ से ६ तक, लगातार १० बार, और प्रत्येक चाल में प्राप्त संख्या पर ध्यान दें, वितरण की निम्न तालिका आवृत्तियों।
प्राप्त संख्या |
आवृत्ति |
1 |
4 |
2 |
1 |
4 |
2 |
5 |
2 |
6 |
1 |
इस बारंबारता बंटन का माध्य, माध्यिका और बहुलक क्रमशः हैं:
ए) 3, 2 और 1
बी) 3, 3 और 1
ग) 3, 4 और 2
डी) 5, 4 और 2
ई) 6, 2 और 4
संकल्प
वैकल्पिक बी.
माध्य ज्ञात करने के लिए, ध्यान दें कि प्राप्त संख्याओं की पुनरावृत्ति होती है, इसलिए हम भारित अंकगणितीय माध्य का उपयोग करेंगे।

माध्यिका निर्धारित करने के लिए, हमें रोस्टर को बढ़ते या घटते तरीके से व्यवस्थित करना चाहिए। याद रखें कि आवृत्ति चेहरे के प्रकट होने की संख्या है।
1, 1, 1, 1, 2, 4, 4, 5, 5, 6
जैसा कि रोस्टर में तत्वों की संख्या सम है, हमें केंद्रीय तत्वों के अंकगणितीय माध्य की गणना करनी चाहिए जो मध्यिका को निर्धारित करने के लिए रोस्टर को आधे में विभाजित करते हैं, जैसे:

बहुलक उस तत्व द्वारा दिया जाता है जो सबसे अधिक दिखाई देता है, अर्थात इसकी आवृत्ति सबसे अधिक है, इसलिए हमारे पास यह है कि बहुलक 1 के बराबर है।
इस प्रकार, माध्य, माध्यिका और बहुलक क्रमशः इसके बराबर हैं:
3, 3 और 1
रॉबसन लुइज़ो द्वारा
गणित अध्यापक
लोगों के समूह में, आयु हैं: 10, 12, 15 और 17 वर्ष। यदि एक 16 वर्षीय व्यक्ति समूह में शामिल हो जाता है, तो समूह की औसत आयु का क्या होगा?
उस कंपनी के लिए औसत वेतन की गणना करें।