במחקר של סטטיסטיקה, יש לנו כמה אסטרטגיות לבדוק האם הערכים המוצגים במערך נתונים מפוזרים או לא וכמה הם עשויים להיות זה מזה. הכלים המשמשים לאפשר זאת מסווגים כ אמצעי פיזור והתקשר שׁוֹנוּת וסטיית תקן. בואו נראה מה כל אחד מהם מייצג:
שׁוֹנוּת:
בהינתן מערך נתונים, השונות היא מדד לפיזור שמראה עד כמה כל ערך בערכה ההיא נמצא מהערך המרכזי (הממוצע).
ככל שהשונות קטנה יותר, כך הערכים קרובים יותר לממוצע; אך ככל שהוא גדול יותר, כך הערכים רחוקים יותר מהממוצע.
-
תשקול את זה איקס1, איקס2, …, איקסלאהם ה לא אלמנטים של א לִטעוֹם האם זה X ו- הממוצע החשבוני של היסודות הללו. החישוב של שונה במדגם זה ניתן על ידי:
Var. מדגם = (איקס1 – איקס) ² + (x2 – איקס) ² + (x3 – איקס)² +... + (xלא – איקס)²
n - 1 -
אם, לעומת זאת, אנו רוצים לחשב את שונות האוכלוסייה, נשקול את כל מרכיבי האוכלוסייה, ולא רק מדגם. במקרה זה, לחישוב יש הבדל קטן. שעון:
Var. אוכלוסייה = (איקס1 – איקס) ² + (x2 – איקס) ² + (x3 – איקס)² +... + (xלא – איקס)²
לא
סטיית תקן:
סטיית התקן מסוגלת לזהות את "השגיאה" במערכת נתונים, אם נרצה להחליף את אחד הערכים שנאספו בממוצע החשבוני.
-
סטיית התקן מופיעה לצד הממוצע החשבוני, ומודיעה עד כמה ערך זה "אמין". הוא מוצג באופן הבא:
ממוצע חשבון (איקס) ± סטיית תקן (sd)
-
חישוב סטיית התקן נעשה משורש הריבוע החיובי של השונות. לָכֵן:
dp = √var
בואו נשתמש כעת בחישוב השונות וסטיית התקן בדוגמה:
בבית ספר אחד, החליטה המועצה לבדוק את מספר התלמידים שיש להם את כל הציונים מעל הממוצע בכל המקצועות. כדי לנתח אותו טוב יותר, החליטה הבמאית אנה להרכיב שולחן עם כמות הציונים "הכחולים" במדגם של ארבע כיתות במשך שנה. ראה להלן הטבלה שארגנה המנהלת:
לפני חישוב השונות, יש צורך לבדוק את ממוצע חשבון(איקס) מספר התלמידים מעל הממוצע בכל כיתה:
שנה 6 → איקס = 5 + 8 + 10 + 7 = 30 = 7,50.
4 4
שנה 7 → איקס = 8 + 6 + 6 + 12 = 32 = 8,00.
4 4
שנה 8 → איקס = 11 + 9 + 5 + 10 = 35 = 8,75.
4 4
שנה 9 → איקס = 8 + 13 + 9 + 4 = 34 = 8,50.
4 4
כדי לחשב את השונות של מספר התלמידים מעל הממוצע בכל כיתה, אנו משתמשים ב- לִטעוֹם, בגלל זה אנו משתמשים בנוסחה של שונה במדגם:
Var. מדגם = (איקס1 – איקס) ² + (x2 – איקס) ² + (x3 – איקס)² +... + (xלא – איקס)²
n - 1
שנה 6 → Var = (5 – 7,50)² + (8 – 7,50)² + (10 – 7,50)² + (7 – 7,50)²
4 – 1
Var = (– 2,50)² + (0,50)² + (2,50)² + (– 0,50)²
3
Var = 6,25 + 0,25 + 6,25 + 0,25
3
Var = 13,00
3
Var = 4.33
שנה 7 → Var = (8 – 8,00)² + (6 – 8,00)² + (6 – 8,00)² + (12 – 8,00)²
4 – 1
Var = (0,00)² + (– 2,00)² + (– 2,00)² + (4,00)²
3
Var = 0,00 + 4,00 + 4,00 + 16,00
3
Var = 24,00
3
Var = 8.00
שנה 8 → Var = (11 – 8,75)² + (9 – 8,75)² + (5 – 8,75)² + (10 – 8,75)²
4 – 1
Var = (2,25)² + (0,25)² + (– 3,75)² + (1,25)²
3
Var = 5,06 + 0,06 + 14,06 + 1,56
3
Var = 20,74
3
Var = 6.91
שנה 9 → Var = (8 – 8,50)² + (13 – 8,50)² + (9 – 8,50)² + (4 – 8,50)²
4 – 1
Var = (– 0,50)² + (4,50)² + (0,50)² + (– 4,50)²
3
Var = 0,25 + 20,25 + 0,25 + 20,25
3
Var = 41,00
3
Var = 13.66
לאחר שהשונות של כל מחלקה ידועה, בואו נחשב את סטיית התקן:
שנה 6 dp = √var |
שנה 7 dp = √var |
שנה 8 dp = √var |
שנה 9 dp = √var |
להשלמת הניתוח שלה, המנהל יכול להציג את הערכים הבאים המציינים את מספר התלמידים הממוצע מעל הממוצע בכיתה שנבדקה:
שנה 6: 7.50 ± 2.08 סטודנטים מעל הממוצע לקדנציה;
שנה 7: 8.00 ± 2.83 סטודנטים מעל הממוצע לחודשיים;
שנה 8: 8.75 ± 2.63 סטודנטים מעל הממוצע לחודשיים;
שנה 9: 8.50 ± 3.70 סטודנטים מעל הממוצע לחודשיים;
מדד נוסף של פיזור הוא מקדם וריאציה. תראה פה איך לחשב את זה!
מאת אמנדה גונסאלבס
בוגר מתמטיקה
מָקוֹר: בית ספר ברזיל - https://brasilescola.uol.com.br/matematica/medidas-dispersao-variancia-desvio-padrao.htm