O סטיית תקן הוא מדד לפיזור, וכך גם השונות ומקדם השונות. בעת קביעת סטיית התקן, נוכל לקבוע טווח סביב הממוצע האריתמטי (חלוקה בין סכום המספרים ברשימה למספר המספרים שנוספו) שבו מרוכזים רוב הנתונים. ככל שהערך של סטיית התקן גדול יותר, השונות של הנתונים גדולה יותר, כלומר, הסטייה מהממוצע האריתמטי גדלה.
קראו גם: מצב, ממוצע וחציון - המדדים העיקריים של נטיות מרכזיות
נושאי מאמר זה
- 1 - סיכום סטיית התקן
- 2 - מהי סטיית תקן?
- 3 - איך מחשבים את סטיית התקן?
- 4 - מהם סוגי סטיית התקן?
- 5 - מהם ההבדלים בין סטיית תקן לשונות?
- 6 - תרגילים פתורים על סטיית תקן
סיכום סטיית תקן
- סטיית תקן היא מדד לשונות.
- סימון סטיית התקן הוא האות היוונית הקטנה סיגמא (σ) או האות s.
- סטיית התקן משמשת לאימות השונות של הנתונים סביב הממוצע.
- סטיית התקן קובעת טווח \(\left[\mu-\sigma,\mu+\sigma\right]\), שבו נמצאים רוב הנתונים.
- כדי לחשב את סטיית התקן, עלינו למצוא את השורש הריבועי של השונות:
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
מהי סטיית תקן?
סטיית התקן היא א מדד פיזור שאומץ בסטטיסטיקה. השימוש בו מקושר ל פרשנות שונות, שהיא גם מדד לפיזור.
בפועל, סטיית התקן קובע מרווח, שבמרכזו הממוצע האריתמטי, שבו מרוכזים רוב הנתונים. לפיכך, ככל שהערך של סטיית התקן גדול יותר, כך גדל אי הסדירות של הנתונים (מידע נוסף הטרוגנית), וככל שהערך של סטיית התקן קטן יותר, אי הסדירות של הנתונים קטנה יותר (מידע נוסף הוֹמוֹגֵנִי).
אל תפסיק עכשיו... יש עוד אחרי הפרסום ;)
איך מחשבים את סטיית התקן?
כדי לחשב את סטיית התקן של מערך נתונים, עלינו למצוא את השורש הריבועי של השונות. אז, הנוסחה לחישוב סטיית התקן היא
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
- \(x_1,x_2,x_3,\ldots, x_N\) → נתונים מעורבים.
- μ → ממוצע אריתמטי של הנתונים.
- N → כמות נתונים.
- \( \sum_{i=1}^{N}\left (x_i-\mu\right)^2\ =\ \left (x_1-\mu\right)^2+\left (x_2-\mu\right) )^2+\left (x_3-\mu\right)^2+...+\left (x_N-\mu\right)^2 \)
הפריט האחרון, המתייחס למונה של הרדיקנד, מציין את סכום הריבועים של ההפרש בין כל נקודת נתונים לבין הממוצע האריתמטי. שים לב ש יחידת המידה של סטיית התקן היא אותה יחידת מידה כמו הנתונים איקס1,איקס2,איקס3,…,איקסלא.
למרות שהכתיבה של נוסחה זו מעט מורכבת, היישום שלה פשוט וישיר יותר. להלן דוגמה כיצד להשתמש בביטוי זה כדי לחשב את סטיית התקן.
- דוגמא:
במשך שבועיים נרשמו הטמפרטורות הבאות בעיר:
יוֹם חוֹל |
יוֹם רִאשׁוֹן |
שְׁנִיָה |
שְׁלִישִׁי |
רביעי |
חמישי |
יוֹם שִׁישִׁי |
יום שבת |
שבוע 1 |
29 מעלות צלזיוס |
30 מעלות צלזיוס |
31 מעלות צלזיוס |
31.5 מעלות צלזיוס |
28 מעלות צלזיוס |
28.5 מעלות צלזיוס |
29 מעלות צלזיוס |
שבוע 2 |
28.5 מעלות צלזיוס |
27 מעלות צלזיוס |
28 מעלות צלזיוס |
29 מעלות צלזיוס |
30 מעלות צלזיוס |
28 מעלות צלזיוס |
29 מעלות צלזיוס |
באיזה מהשבועיים הטמפרטורה נשארה סדירה יותר בעיר זו?
פתרון הבעיה:
כדי לנתח את סדירות הטמפרטורה, עלינו להשוות את סטיות התקן של הטמפרטורות שנרשמו בשבועות 1 ו-2.
- בואו נסתכל תחילה על סטיית התקן עבור שבוע 1:
שימו לב שהממוצע μ1 זה לא1 הם
\(\mu_1=\frac{29+30+31+31.5+28+28.5+29}{7}\approx29.57\)
\(N_1=7 \) (7 ימים בשבוע)
כמו כן, עלינו לחשב את ריבוע ההפרש בין כל טמפרטורה לטמפרטורה הממוצעת.
\(\left (29-29.57\right)^2=0.3249\)
\(\left (30-29.57\right)^2=0.1849\)
\(\left (31-29.57\right)^2=2.0449\)
\(\left (31.5-29.57\right)^2=3.7249\)
\(\left (28-29.57\right)^2=2.4649\)
\(\left (28.5-29.57\right)^2=1.1449\)
\(\left (29-29.57\right)^2=0.3249\)
אם מוסיפים את התוצאות, יש לנו שמונה הרדיקנד בנוסחת סטיית התקן הוא
\(0,3249\ +\ 0,1849\ +2,0449+3,7249+2,4649+1,1449+0,3249\ =\ 10,2143\)
אז סטיית התקן של שבוע 1 היא
\(\sigma_1=\sqrt{\frac{\sum_{i=1}^{7}\left (x_i-\mu_1\right)^2}{N_1}}=\sqrt{\frac{10,2143} {7}}\ \approx1.208\ °C\)
הערה: תוצאה זו פירושה שרוב שבוע 1 הטמפרטורות נמצאות במרווח [28.36 מעלות צלזיוס, 30.77 מעלות צלזיוס], כלומר, המרווח \(\left[\mu_1-\sigma_1,\mu_1+\sigma_1\right]\).
- עכשיו בואו נסתכל על סטיית התקן של שבוע 2:
בעקבות אותו נימוק, יש לנו
\(\mu_2=\frac{28.5+27+28+29+30+28+29}{7}=28.5\)
\(N_2=7\)
\(\left (28.5-28.5\right)^2=0\)
\(\left (27-28.5\right)^2=2.25\)
\(\left (28-28.5\right)^2=0.25\)
\(\left (29-28.5\right)^2=0.25\)
\(\left (30-28.5\right)^2=2.25\)
\(\left (28-28.5\right)^2=0.25\)
\(\left (29-28.5\right)^2=0.25\)
\(0\ +\ 2,25\ +\ 0,25\ +\ 0,25+2,25+0,25+0,25\ =\ 5,5\)
אז סטיית התקן של שבוע 2 היא
\(\sigma_2=\sqrt{\frac{\sum_{i=1}^{7}\left (x_i-\mu_1\right)^2}{N_2}}=\sqrt{\frac{5,5} {7}}\ \approx0.89\ °C\)
תוצאה זו אומרת שרוב הטמפרטורות בשבוע 2 הן בטווח \(\left[\mu_2-\sigma_2,\mu_2+\sigma_2\right]\), כלומר הטווח \(\left[\mu_2-\sigma_2,\mu_2+\sigma_2\right]\).
תבין את זה \(\sigma_2, כלומר, סטיית התקן של שבוע 2 פחותה מסטיית התקן של שבוע 1. לכן, שבוע 2 הציג טמפרטורות קבועות יותר משבוע 1.
מהם סוגי סטיית התקן?
סוגי סטיית התקן קשורים לסוג ארגון הנתונים. בדוגמה הקודמת, עבדנו עם סטיית התקן של נתונים לא מקובצים. כדי לחשב את סטיית התקן של קבוצה של נתונים מאורגנים אחרת (נתונים מקובצים, למשל), תצטרך להתאים את הנוסחה.
מה ההבדלים בין סטיית תקן לשונות?
סטיית התקן הוא השורש הריבועי של השונות:
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
\(V=\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}\)
כאשר משתמשים בשונות כדי לקבוע את השונות של מערך נתונים, לתוצאה יש את יחידת הנתונים בריבוע, מה שמקשה על הניתוח שלה. לפיכך, סטיית התקן, בעלת יחידה זהה לנתונים, היא כלי אפשרי לפרש את תוצאת השונות.
יודע יותר:תדירות מוחלטת - מספר הפעמים שאותה תגובה הופיעה במהלך איסוף הנתונים
פתרו תרגילים על סטיית תקן
שאלה 1
(FGV) בכיתה של 10 תלמידים ציוני התלמידים בהערכה היו:
6 |
7 |
7 |
8 |
8 |
8 |
8 |
9 |
9 |
10 |
סטיית התקן של רשימה זו היא בערך
א) 0.8.
ב) 0.9.
ג) 1.1.
ד) 1.3.
ה) 1.5.
פתרון הבעיה:
חלופה C.
לפי ההצהרה, N = 10. הממוצע של רשימה זו הוא
\( \mu=\frac{6+7+7+8+8+8+8+9+9+10}{10}=8 \)
יתר על כן,
\(\left (6-8\right)^2=4\)
\(\left (7-8\right)^2=1\)
\(\left (8-8\right)^2=0\)
\(\left (9-8\right)^2=1\)
\(\left (10-8\right)^2=4\)
\(4+1+1+0+0+0+0+1+1+4=12\)
אז סטיית התקן של רשימה זו היא
\(\sigma=\sqrt{\frac{\sum_{i=1}^{10}\left (x_i-8\right)^2}{10}}=\sqrt{\frac{12}{10} }\approx1.1\)
שאלה 2
שקול את ההצהרות שלהלן ודרג כל אחת כ-T (נכון) או F (שקר).
אני. השורש הריבועי של השונות הוא סטיית התקן.
II. לסטיית התקן אין קשר לממוצע האריתמטי.
III. שונות וסטיית תקן הן דוגמאות למדדי פיזור.
הסדר הנכון, מלמעלה למטה, הוא
א) V-V-F
ב) פ-ו-ו
ג) ו-ו-ו
ד) פ-ו-ו
ה) ו-ו-ו
פתרון הבעיה:
אלטרנטיבה E.
אני. השורש הריבועי של השונות הוא סטיית התקן. (נָכוֹן)
II. לסטיית התקן אין קשר לממוצע האריתמטי. (שֶׁקֶר)
סטיית התקן מצביעה על מרווח סביב הממוצע האריתמטי שבו רוב הנתונים נופלים.
III. שונות וסטיית תקן הן דוגמאות למדדי פיזור. (נָכוֹן)
מאת מריה לואיזה אלבס ריזו
מורה למתמטיקה
ראה כאן את המושגים והעקרונות העיקריים של סטטיסטיקה. ראה גם כיצד מתחלק חקר הסטטיסטיקה ועקוב אחר חלק מיישומיו.
לחץ ולמד את מדדי הפיזור המכונים משרעת וסטייה וראה דוגמאות ליישום של דרכים אלו לניתוח מידע.
בדוק את ההגדרה וכיצד ליישם שונות וסטיית תקן, שני מדדים חשובים לפיזור.
לחץ ולמד כיצד לחשב את הממוצע האריתמטי, מדד מרכזיות שהתוצאה שלו מייצגת רשימה של מידע.
שורש ריבועי הוא פעולה מתמטית המשמשת בכל רמות בית הספר. למד את המינוחים וההגדרות, כמו גם את הפרשנות הגיאומטרית שלהם.
אתה יודע מה זה שונות? למד כיצד לחשב וכיצד להשתמש במדד הפיזור המעניין הזה!