במחקר של סטטיסטיקה, יש לנו כמה אסטרטגיות לבדוק אם הערכים המוצגים במערך נתונים מפוזרים או לא וכמה הם עשויים להיות זה מזה. הכלים המשמשים לאפשר זאת מסווגים כ אמצעי פיזור והתקשר שׁוֹנוּת וסטיית תקן. בואו נראה מה כל אחד מהם מייצג:
שׁוֹנוּת:
בהינתן מערך נתונים, השונות היא מדד לפיזור שמראה כמה כל ערך בערכה ההיא נמצא מהערך המרכזי (הממוצע).
ככל שהשונות קטנה יותר, כך הערכים קרובים יותר לממוצע; אך ככל שהוא גדול יותר, כך הערכים רחוקים יותר מהממוצע.
-
תשקול את זה איקס1, איקס2, …, איקסלאהם ה לא אלמנטים של א לִטעוֹם האם זה X ו- הממוצע החשבוני של יסודות אלה. החישוב של שונה במדגם זה ניתן על ידי:
Var. מדגם = (איקס1 – איקס) ² + (x2 – איקס) ² + (x3 – איקס)² +... + (xלא – איקס)²
n - 1 -
אם, לעומת זאת, אנו רוצים לחשב את שונות האוכלוסייה, נשקול את כל מרכיבי האוכלוסייה, ולא רק מדגם. במקרה זה, לחישוב יש הבדל קטן. שעון:
Var. אוכלוסייה = (איקס1 – איקס) ² + (x2 – איקס) ² + (x3 – איקס)² +... + (xלא – איקס)²
לא
סטיית תקן:
סטיית התקן מסוגלת לזהות את "השגיאה" במערכת נתונים, אם נרצה להחליף את אחד הערכים שנאספו בממוצע החשבוני.
-
סטיית התקן מופיעה לצד הממוצע החשבוני, ומודיעה עד כמה ערך זה "אמין". הוא מוצג באופן הבא:
ממוצע חשבון (איקס) ± סטיית תקן (sd)
-
חישוב סטיית התקן נעשה משורש הריבוע החיובי של השונות. לָכֵן:
dp = √var
בואו נשתמש בחישוב השונות וסטיית התקן בדוגמה:
בבית ספר אחד החליטה המועצה לבדוק את מספר התלמידים שיש להם את כל הציונים מעל הממוצע בכל המקצועות. כדי לנתח אותו טוב יותר, הבמאית אנה החליטה להרכיב שולחן עם כמות הציונים "הכחולים" במדגם של ארבע כיתות במשך שנה. ראה להלן הטבלה שארגנה המנהלת:
לפני חישוב השונות, יש צורך לבדוק את ה- ממוצע חשבון(איקס) מספר התלמידים מעל הממוצע בכל כיתה:
שנה 6 → איקס = 5 + 8 + 10 + 7 = 30 = 7,50.
4 4
שנה 7 → איקס = 8 + 6 + 6 + 12 = 32 = 8,00.
4 4
שנה 8 → איקס = 11 + 9 + 5 + 10 = 35 = 8,75.
4 4
שנה 9 → איקס = 8 + 13 + 9 + 4 = 34 = 8,50.
4 4
כדי לחשב את השונות של מספר התלמידים מעל הממוצע בכל כיתה, אנו משתמשים ב- לִטעוֹם, בגלל זה אנו משתמשים בנוסחה של שונה במדגם:
Var. מדגם = (איקס1 – איקס) ² + (x2 – איקס) ² + (x3 – איקס)² +... + (xלא – איקס)²
n - 1
אל תפסיק עכשיו... יש עוד אחרי הפרסום;)
שנה 6 → Var = (5 – 7,50)² + (8 – 7,50)² + (10 – 7,50)² + (7 – 7,50)²
4 – 1
Var = (– 2,50)² + (0,50)² + (2,50)² + (– 0,50)²
3
Var = 6,25 + 0,25 + 6,25 + 0,25
3
Var = 13,00
3
Var = 4.33
שנה 7 → Var = (8 – 8,00)² + (6 – 8,00)² + (6 – 8,00)² + (12 – 8,00)²
4 – 1
Var = (0,00)² + (– 2,00)² + (– 2,00)² + (4,00)²
3
Var = 0,00 + 4,00 + 4,00 + 16,00
3
Var = 24,00
3
Var = 8.00
שנה 8 → Var = (11 – 8,75)² + (9 – 8,75)² + (5 – 8,75)² + (10 – 8,75)²
4 – 1
Var = (2,25)² + (0,25)² + (– 3,75)² + (1,25)²
3
Var = 5,06 + 0,06 + 14,06 + 1,56
3
Var = 20,74
3
Var = 6.91
שנה 9 → Var = (8 – 8,50)² + (13 – 8,50)² + (9 – 8,50)² + (4 – 8,50)²
4 – 1
Var = (– 0,50)² + (4,50)² + (0,50)² + (– 4,50)²
3
Var = 0,25 + 20,25 + 0,25 + 20,25
3
Var = 41,00
3
Var = 13.66
לאחר שהשונות של כל מחלקה ידועה, בואו נחשב את סטיית התקן:
שנה 6 dp = √var |
שנה 7 dp = √var |
שנה 8 dp = √var |
שנה 9 dp = √var |
להשלמת הניתוח שלה, המנהל יכול להציג את הערכים הבאים המציינים את מספר התלמידים הממוצע מעל הממוצע בכיתה שנבדקה:
שנה 6: 7.50 ± 2.08 תלמידים מעל הממוצע לתקופת קדנציה;
שנה 7: 8.00 ± 2.83 סטודנטים מעל הממוצע לחודשיים;
שנה 8: 8.75 ± 2.63 סטודנטים מעל הממוצע לחודשיים;
שנה 9: 8.50 ± 3.70 סטודנטים מעל הממוצע לחודשיים;
מדד נוסף של פיזור הוא מקדם וריאציה. תראה פה איך לחשב את זה!
מאת אמנדה גונסאלבס
בוגר מתמטיקה