סטטיסטיקה: עקרונות, חשיבות, דוגמאות

ה סטטיסטיקה הוא תחום המתמטיקה זה רשום עובדות ונתונים בהן יש סט שיטות המאפשרות לנו לאסוף נתונים ולנתח אותם, ובכך מאפשרים לבצע פירוש כלשהו אליהם. הנתון מחולק לשני חלקים: תיאור ו מסיק. סטטיסטיקה תיאורית מאופיינת בארגון, ניתוח והצגת נתונים, ואילו סטטיסטיקה מסקנת יש כמאפיין חקר מדגם של אוכלוסייה נתונה ועל סמך זה ביצוע ניתוחים והצגת קוביות.

קרא גם: מהו מרווח הטעות של הסקר?

עקרונות הסטטיסטיקה

לאחר מכן נראה את המושגים והעקרונות העיקריים של סטטיסטיקה. בהתבסס עליהם ניתן יהיה להגדיר מושגים מתוחכמים יותר.

  • אוכלוסייה או יקום סטטיסטי

האוכלוסייה או היקום הסטטיסטי הם סט שנוצר על ידי כל האלמנטים שמשתתפים בנושא נחקר מסוים.

דוגמאות ליקום סטטיסטי

א) בעיר, כל התושבים שייכים ליקום הסטטיסטי.

ב) במות בעל שישה צדדים האוכלוסייה ניתנת לפי מספר הפנים.

{1, 2, 3, 4, 5, 6}

  • מידע סטטיסטי

הנתונים הסטטיסטיים הם א אלמנט השייך לאוכלוסייה כולה, ברור שנתונים אלה חייבים להיות קשורים לנושא המחקר.

אוּכְלוֹסִיָה

מידע סטטיסטי

קוביות בעלות 6 צדדים

4

אלופי ברזילאית באופני הרים

הנריקה אבנצ'יני

  • לִטעוֹם

אנו מכנים את המדגם ה- תת-קבוצה נוצרה על בסיס יקום סטטיסטי

. מדגם משמש כאשר האוכלוסייה גדולה מאוד או אינסופית. במקרים שבהם איסוף כל המידע מהיקום הסטטיסטי אינו אפשרי מסיבות כלכליות או לוגיסטיות, יש צורך גם להשתמש בדוגמאות.

הבחירה במדגם חשובה ביותר למחקר, והיא חייבת לייצג את האוכלוסייה באופן מהימן. דוגמה קלאסית לשימוש בדגימות בסקר היא בביצוע ה - מפקד דמוגרפי של ארצנו.

  • מִשְׁתַנֶה

בסטטיסטיקה, המשתנה הוא מושא המחקר, כלומר הנושא שהמחקר מתכוון ללמוד. לדוגמא, כאשר בוחנים את מאפייני העיר, מספר התושבים יכול להיות משתנה, כמו גם נפח הגשם בתקופה נתונה או אפילו מספר האוטובוסים לתחבורה פּוּמְבֵּי. שים לב שמושג המשתנה בסטטיסטיקה תלוי בהקשר המחקרי.

ארגון הנתונים בסטטיסטיקה מתרחש ב שלבים, כמו בכל תהליך ארגון. בתחילה בוחרים את הנושא הנחקר, ואז חושבים על השיטה לאיסוף נתוני המחקר, והשלב השלישי הוא ביצוע האיסוף. לאחר סיום שלב אחרון זה מתבצע הניתוח של מה שנאסף, ועל כן, על סמך הפרשנות, מחפשים תוצאות. כעת נראה כמה מושגים חשובים והכרחיים לארגון נתונים.

אל תפסיק עכשיו... יש עוד אחרי הפרסום;)

  • תַפְקִיד

במקרים בהם ניתן לייצג את הנתונים על ידי מספרים, כלומר כאשר המשתנה הוא כמותי, הרשימה עבור ארגון נתונים אלה. סגל יכול להיות עולה או יורד. אם משתנה אינו כמותי, כלומר אם הוא איכותי, לא ניתן להשתמש ברשימה, למשל, אם הנתונים הם תחושות לגבי מוצר מסוים.

דוגמא

בכיתה נאספו גבהים של תלמידים במטרים. הם: 1.70; 1,60; 1,65; 1,78; 1,71; 1,73; 1,72; 1,64.

מכיוון שניתן לארגן את הרשימה בצורה עולה או יורדת, מכאן נובע:

rol: (1.60; 1,64; 1,65; 1,70; 1,71; 1,72; 1,73; 1,78}

שים לב, כאשר הגליל כבר מורכב, ניתן למצוא נתונים ביתר קלות.

  • טבלת חלוקת תדרים

במקרים בהם ישנם אלמנטים רבים ברשימה וחזרות רבות על נתונים, הרשימה מתיישנת, מכיוון שארגון נתונים אלה אינו ניתן לביצוע. במקרים אלה, הטבלאות וה- התפלגות תדרים הם משמשים ככלי ארגוני מצוין.

בטבלת החלוקה של תדר מוחלט, עלינו לשים את התדירות בה מופיעים כל נתונים, כלומר מספר הפעמים שהם מופיעים.

בואו לבנות את טבלת החלוקה עבור תדר מוחלט הגילאים, בשנים, של התלמידים בכיתה נתונה.

התפלגות תדרים מוחלטת

גיל

תדר (F)

8

2

9

12

10

12

11

14

12

1

סה"כ (Fט)

41

מהטבלה נוכל לקבל את המידע הבא: בכיתה יש לנו 2 תלמידים בגילאי 8, 12 סטודנטים בני 9, ועוד 12 סטודנטים בני 10, וכן הלאה, מגיעים לסך כולל של 41 סטודנטים. בטבלת החלוקה של תדרים מצטברים, עלינו להוסיף את התדר מהשורה הקודמת (בטבלת חלוקת התדרים המוחלטת).

בואו לבנות את טבלת חלוקת התדרים המצטברת לגילאים מאותה כיתה כמו בדוגמה הקודמת, ראו:

התפלגות תדרים מצטברת

גיל

תדר (F)

8

2

9

14

10

26

11

40

12

41

סה"כ (Fט)

41

בטבלה של התפלגות התדרים היחסיים, נעשה שימוש באחוז שבו כל נתונים מופיעים. שוב נעשה את החישובים על בסיס טבלת חלוקת התדרים המוחלטת. אנו יודעים כי 41 תואם 100% מהתלמידים בכיתה, כדי לקבוע את ה אֲחוּזִים בכל גיל אנו פשוט מחלקים את תדירות הגיל ב- 41 ומכפילים את התוצאה ב- 100, כך שנוכל לכתוב אותה באחוזים.

2: 41 = 0,048 · 100 → 4,8%

12: 41 = 0,292 · 100 → 29,2%

12: 41 = 0,292 · 100 → 29,2%

14: 41 = 0,341 · 100 → 34,1%

1: 41 = 0,024 · 100 → 2,4%

התפלגות תדרים יחסית

גיל

תדר (F)

8

4,8%

9

29,2%

10

29,2%

11

34,1%

12

2,4%

סה"כ (Fט)

100%

קרא גם:יישום של וסטָטִיסטִיקָה: fתדירות המוחלט ו fתדירות יחסית

  • שיעורים

במקרים בהם המשתנה הוא רציף, כלומר, כאשר יש לו מספר ערכים, יש צורך לקבץ אותם פנימה מרווחים אמיתיים. בסטטיסטיקה, מרווחים אלה נקראים מחלקות..

לבנות את השולחן של התפלגות תדרים בשיעורים, עלינו לשים את המרווחים בעמודה השמאלית, עם הכותרת המתאימה שלהם, ובעמודה הימנית, עלינו שים את התדירות המוחלטת של כל אחד מהמרווחים, כלומר כמה אלמנטים שייכים לכל אחד שֶׁלָהֶם.

דוגמא

גובה התלמידים בשנה ג 'בתיכון בבית ספר.

חלוקת תדרים בשיעורים

גובה (מטר)

תדר מוחלט (F)

[1,40; 1,50[

1

[1,50; 1,60[

4

[1,60; 1,70[

8

[1,70; 1,80[

2

[1,80; 1,90[

1

סה"כ (Fט)

16

בניתוח טבלת חלוקת התדרים בשיעורים, אנו יכולים לראות שבשיעור ג 'יש לנו תלמיד אחד שגובהו בין 1.40 מ 'ל- 1.50 מ', בדיוק כמו שיש לנו 4 תלמידים שגובהם בין 1.50 ל- 1.60 מ ', וכך ברצף. אנו יכולים גם לראות שלתלמידים יש גבהים בין 1.40 מ 'ל- 1.90 מ', ההבדל בין המידות הללו, כלומר בין הגובה הגבוה ביותר לנמוך ביותר של המדגם, נקרא אמפליטודה.

ההבדל בין הגבול העליון והתחתון של הכיתה נקרא רוחב כיתהלפיכך, השני, שמונה 4 תלמידים עם גבהים שבין 1.50 מטר (כלול) ל- 1.60 מטר (לא כלול), כולל טווח של:

1,60 – 1,50

0.10 מטר

ראה גם: אמצעי פיזור: משרעת וסטייה

מדידות מיקום

משתמשים במדידות מיקום במקרים בהם ניתן לבנות גליל מספרי עם הנתונים או טבלת התדרים. מדידות אלה מצביעות על מיקום האלמנטים ביחס לסגל. שלושת מדדי העמדה העיקריים הם:

  • מְמוּצָע

שקול את הרשימה עם האלמנטים (א1, א2, א3, א4, …, הלא), הממוצע החשבוני של יסודות n אלה ניתן על ידי:

דוגמא

בקבוצת ריקודים נאספו גילאי החברים המיוצגים ברשימה הבאה:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

בואו נקבע את הגיל הממוצע של חברי קבוצת הריקודים הזו.

על פי הנוסחה, עלינו להוסיף את כל האלמנטים ולחלק את התוצאה הזו למספר האלמנטים ברשימה, כך:

לכן הגיל הממוצע של החברים הוא 22 שנים.

למידע נוסף על מדד עמדה זה, קרא את הטקסט שלנו: Méבוקר.

  • חֲצִיוֹן

החציון ניתן על ידי האלמנט המרכזי בסגל שיש בו מספר אי זוגי של אלמנטים. אם ברשימה מספר זוגי של אלמנטים, עלינו להתחשב בשני האלמנטים המרכזיים ולחשב את הממוצע החשבוני ביניהם.

דוגמא

שקול את הרשימה הבאה.

(2, 2, 3, 3,4, 5, 6, 7, 9)

שימו לב שאלמנט 4 מחלק את התפקיד לשני חלקים שווים, ולכן הוא האלמנט המרכזי.

דוגמא

חשב את הגיל החציוני של קבוצת הריקודים.

זכור שרשימת הגילאים של קבוצת ריקודים זו ניתנת על ידי:

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

שים לב שמספר האלמנטים ברשימה זו שווה ל- 10, כך שלא ניתן לחלק את הרשימה לשני חלקים שווים. אז עלינו לקחת שני אלמנטים מרכזיים ולבצע את הממוצע החשבוני של ערכים אלה.

ראה פרטים נוספים על מדד עמדה זה בטקסט שלנו: Mאדיאן.

  • אופנה

אנו נקרא לאופנה אלמנט התפקיד בעל התדר הגבוה ביותר, כלומר האלמנט המופיע בו הכי הרבה.

דוגמא

בואו נקבע את אופנת גיל הגילאים של קבוצת הריקודים.

(18, 20, 20, 21, 21, 21, 22, 22, 25, 30)

האלמנט שנראה הכי הרבה הוא 21, כך שהמצב שווה ל 21.

אמצעי פיזור

אמצעי פיזור הם משמש במקרים בהם הממוצע כבר אינו מספיק. לדוגמא, דמיין ששתי מכוניות עברו 40,000 ק"מ בממוצע. רק עם ידע על ממוצעים נוכל לומר ששתי המכוניות הלכו קילומטרים ניתנים לקביעה כל אחת, נכון?

עם זאת, דמיין שאחת המכוניות עברה 79,000 ק"מ, והשנייה 1,000 קילומטרים, שים לב שרק עם מידע על הממוצע לא ניתן להצהיר עם דיוק.

בְּ אמצעי פיזור יגידו לנו כמה רחוקים האלמנטים של רשימה מספרית מהממוצע החשבוני. יש לנו שני מדדים חשובים לפיזור:

  • שונות (σ2)

בואו נקרא לממוצע החשבוני של ריבועי ההפרש בין כל אלמנט בגליל לבין הממוצע החשבוני של אותו גליל כשונות. השונות מיוצגת על ידי: σ2.

שקול את הרשימה (x1, איקס2, איקס3, …, איקסלא) ושיש לו ממוצע אריתמטיאיקס. השונות ניתנת על ידי:

  • סטיית תקן (σ)

סטיית התקן ניתנת על ידי שורש השונות, היא מספרת לנו כמה אלמנט מתפזר ביחס לממוצע. סטיית התקן מסומנת על ידי σ.

דוגמא

קבע את סטיית התקן של מערך הנתונים (4, 7, 10). שים לב כי לשם כך יש צורך לקבוע תחילה את השונות וכי לשם כך יש לחשב תחילה את ממוצע הנתונים הללו.

החלפת נתונים אלה בנוסחת השונות, יש לנו:

כדי לקבוע את סטיית התקן, עלינו לחלץ את שורש השונות.

קרא עוד: מדדי פיזור: שונות וסטיית תקן

לשם מה הסטטיסטיקה?

ראינו שהנתון קשור ל בעיות בספירה או בארגון נתונים. בנוסף, יש לו תפקיד חשוב בפיתוח כלים המאפשרים תהליך של ארגון נתונים, כמו טבלאות. סטטיסטיקה קיימת גם ב תחומי מדע שונים, בהתבסס על איסוף נתונים וטיפול, ניתן לעבוד עם מודלים מתמטיים המאפשרים פיתוח נוסף בתחום הנחקר. כמה תחומים בהם הסטטיסטיקה היא בסיסית: כלכלה, מטאורולוגיה, שיווק, ספורט, סוציולוגיה ומדעי הגיאוגרפיה.

במטאורולוגיה, למשל, הנתונים נאספים בתקופה מסוימת, לאחר שהם מאורגנים, הם מטופלים, וכך גם בהתבסס עליהם, נבנה מודל מתמטי המאפשר לנו לקבוע את האקלים של הימים הקודמים במידה רבה יותר של מהימנות. סטטיסטיקה היא ענף מדע המאפשר לנו להצהיר מידות מסוימות של אמינות, אך אף פעם לא בוודאות של 100%.

חלוקות סטטיסטיות

הסטטיסטיקה מחולקת לשני חלקים, תיאוריים ומסקנים. הראשון קשור לספירת האלמנטים המעורבים במחקר, יסודות אלה נספרים אחד אחד. בְּ סטטיסטיקה תיאורית, הכלים העיקריים שלנו הם מדדי מיקום, כגון ממוצע, חציון ומצב, כמו גם מדדי פיזור כגון שונות וסטיית תקן, יש לנו גם טבלאות תדרים ו גרָפִיקָה.

עדיין בסטטיסטיקה תיאורית, יש לנו מתודולוגיה מוגדרת מאוד עבור הצגת נתונים עם מידה ניכרת של אמינות שעובר על ארגון ואיסוף, סיכום, פרשנות וייצוג ולבסוף ניתוח נתונים. דוגמה קלאסית לשימוש בסטטיסטיקה תיאורית מופיעה במפקד האוכלוסין (כל עשר שנים) על ידי המכון הברזילאי לגיאוגרפיה וסטטיסטיקה (IBGE).

ה סטטיסטיקה היסקית, בתורו, הוא מאופיין לא באיסוף נתונים מגורמי האוכלוסייה בזה אחר זה, אלא בביצוע ה ניתוח מדגם מאוכלוסייה זו, הסקת מסקנות לגביה. בסטטיסטיקה הסקתית יש לנקוט משנה זהירות בבחירת המדגם, מכיוון שהוא חייב לייצג את האוכלוסייה היטב. כמה תוצאות ראשוניות, כגון ממוצע, בסטטיסטיקה מסקנת הנקראת תקווה, נגזרות על סמך ידע בסטטיסטיקה תיאורית.

סטטיסטיקה מסקנת משמשת, למשל, בסקרים של בחירות. נבחר מדגם של האוכלוסייה, באופן המייצג אותה, וכך מתבצע המחקר. בבחירת מדגם שאינו מייצג אוכלוסייה זו בצורה טובה במיוחד, אנו אומרים כי המחקר הוא מְשׁוּחָד ולכן לא אמין.

תחום המתמטיקה האחראי על ספירת וארגון נתונים.
תחום המתמטיקה האחראי על ספירת וארגון נתונים.

תרגילים נפתרו

שאלה 1 - (U. פ. Juiz de Fora - MG) מורה לפיזיקה העביר מבחן בשווי 100 נקודות על 22 תלמידיו והשיג כתוצאה את חלוקת הציונים, כפי שנראה בטבלה הבאה:

40

20

10

20

70

60

90

80

30

50

50

70

50

20

50

50

10

40

30

20

60

60

בצע את טיפולי הנתונים הבאים:

א) כתוב את רשימת ההערות הללו.

ב) קבע את התדירות היחסית של התו הגבוה ביותר.

פתרון הבעיה

א) כדי להכין את רשימת ההערות הללו, עלינו לכתוב אותם באופן עולה או יורד. אז עלינו:

10, 10, 20, 20, 20, 20, 30, 30, 40, 40, 50, 50, 50, 50, 50, 60, 60, 60, 80, 90

ב) כשמסתכלים על הגליל נוכל לראות שהתו הגבוה ביותר היה שווה ל 90 וכי התדירות המוחלטת שלו שווה ל -1, כפי שהוא מופיע רק פעם אחת. כדי לקבוע את התדר היחסי, עלינו לחלק את התדר המוחלט של אותה הערה לתדר הכולל, במקרה זה שווה ל 22. לכן:

תדירות יחסית

כדי להעביר את המספר הזה באחוזים, עלינו להכפיל אותו ב 100.

0,045 · 100

4,5%

שאלה 2 - (אויב) לאחר גלגול תבנית בצורת קובייה עם פנים ממוספרות מ 1 ל 6, 10 פעמים ברציפות, ו שימו לב למספר שהתקבל בכל מהלך, בטבלת ההפצה הבאה של תדרים.

המספר שהושג

תדירות

1

4

2

1

4

2

5

2

6

1

הממוצע, החציון והמצב של התפלגות תדרים זו הם, בהתאמה:

א) 3, 2 ו- 1

ב) 3, 3 ו -1

ג) 3, 4 ו -2

ד) 5, 4 ו -2

ה) 6, 2 ו -4

פתרון הבעיה

חלופה ב '

כדי לקבוע את הממוצע, שים לב שיש חזרה על המספרים שהתקבלו, ולכן נשתמש בממוצע החשבוני המשוקלל.

כדי לקבוע את החציון, עלינו לסדר את הסגל באופן עולה או יורד. זכרו שתדירות היא מספר הפעמים שהפנים מופיעים.

1, 1, 1, 1, 2, 4, 4, 5, 5, 6

מכיוון שמספר האלמנטים בסגל אחיד, עלינו לחשב את הממוצע החשבוני של האלמנטים המרכזיים המחלקים את הסגל לחצי כדי לקבוע את החציון, כך:

המצב ניתן על ידי האלמנט שנראה הכי הרבה, כלומר יש לו את התדר הגבוה ביותר, אז יש לנו שהמצב שווה ל -1.

לפיכך, הממוצע, החציון והמצב שווים, בהתאמה, ל:

3, 3 ו -1

מאת רובסון לואיז
מורה למתמטיקה

בקבוצת אנשים הגילאים הם: בני 10, 12, 15 ו -17. אם בן 16 מצטרף לקבוצה, מה קורה לגיל הממוצע של הקבוצה?

חישוב השכר הממוצע עבור אותה חברה.

יישום סטטיסטיקה: תדירות מוחלטת ותדירות יחסית

סטטיסטיקה היא כלי מתמטי שנמצא בשימוש נרחב במגזרים שונים בחברה, מארגן נתוני מחקר ומציג מידע ברור ...

read more
שׁוֹנוּת. כיצד מחשבים את השונות של אוכלוסייה?

שׁוֹנוּת. כיצד מחשבים את השונות של אוכלוסייה?

בתוך הסטטיסטיקה, ישנן מספר דרכים לנתח מערך נתונים, בהתאם לצורך בכל מקרה. תאר לעצמך שמאמן רושם את ...

read more
חישובי אחוזים הכוללים תדרים יחסיים

חישובי אחוזים הכוללים תדרים יחסיים

האחוז הוא יחס סנטסימלי המשמש להשוואת ערכים במצב נתון. התדירות היחסית מיוצגת על ידי מספר אחוז הנגז...

read more
instagram viewer