O סטיית תקן הוא מדד לפיזור, וכך גם השונות ומקדם השונות. בעת קביעת סטיית התקן, נוכל לקבוע טווח סביב הממוצע האריתמטי (חלוקה בין סכום המספרים ברשימה למספר המספרים שנוספו) שבו מרוכזים רוב הנתונים. ככל שהערך של סטיית התקן גדול יותר, השונות של הנתונים גדולה יותר, כלומר, הסטייה מהממוצע האריתמטי גדלה.
קראו גם: מצב, ממוצע וחציון - המדדים העיקריים של נטיות מרכזיות
סיכום סטיית תקן
- סטיית תקן היא מדד לשונות.
- סימון סטיית התקן הוא האות היוונית הקטנה סיגמא (σ) או האות s.
- סטיית התקן משמשת לאימות השונות של הנתונים סביב הממוצע.
- סטיית התקן קובעת טווח \(\left[\mu-\sigma,\mu+\sigma\right]\), שבו נמצאים רוב הנתונים.
- כדי לחשב את סטיית התקן, עלינו למצוא את השורש הריבועי של השונות:
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
מהי סטיית תקן?
סטיית התקן היא א מדד פיזור שאומץ בסטטיסטיקה. השימוש בו מקושר ל פרשנות שונות, שהיא גם מדד לפיזור.
בפועל, סטיית התקן קובע מרווח, שבמרכזו הממוצע האריתמטי, שבו מרוכזים רוב הנתונים. לפיכך, ככל שהערך של סטיית התקן גדול יותר, כך גדל אי הסדירות של הנתונים (מידע נוסף הטרוגנית), וככל שהערך של סטיית התקן קטן יותר, אי הסדירות של הנתונים קטנה יותר (מידע נוסף הוֹמוֹגֵנִי).
איך מחשבים את סטיית התקן?
כדי לחשב את סטיית התקן של מערך נתונים, עלינו למצוא את השורש הריבועי של השונות. אז, הנוסחה לחישוב סטיית התקן היא
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
- \(x_1,x_2,x_3,\ldots, x_N\) → נתונים מעורבים.
- μ → ממוצע אריתמטי של הנתונים.
- N → כמות נתונים.
- \( \sum_{i=1}^{N}\left (x_i-\mu\right)^2\ =\ \left (x_1-\mu\right)^2+\left (x_2-\mu\right) )^2+\left (x_3-\mu\right)^2+...+\left (x_N-\mu\right)^2 \)
הפריט האחרון, המתייחס למונה של הרדיקנד, מציין את סכום הריבועים של ההפרש בין כל נקודת נתונים לבין הממוצע האריתמטי. שים לב ש יחידת המידה של סטיית התקן היא אותה יחידת מידה כמו הנתונים איקס1,איקס2,איקס3,…,איקסלא.
למרות שהכתיבה של נוסחה זו מעט מורכבת, היישום שלה פשוט וישיר יותר. להלן דוגמה כיצד להשתמש בביטוי זה כדי לחשב את סטיית התקן.
- דוגמא:
במשך שבועיים נרשמו הטמפרטורות הבאות בעיר:
יוֹם חוֹל |
יוֹם רִאשׁוֹן |
שְׁנִיָה |
שְׁלִישִׁי |
רביעי |
חמישי |
יוֹם שִׁישִׁי |
יום שבת |
שבוע 1 |
29 מעלות צלזיוס |
30 מעלות צלזיוס |
31 מעלות צלזיוס |
31.5 מעלות צלזיוס |
28 מעלות צלזיוס |
28.5 מעלות צלזיוס |
29 מעלות צלזיוס |
שבוע 2 |
28.5 מעלות צלזיוס |
27 מעלות צלזיוס |
28 מעלות צלזיוס |
29 מעלות צלזיוס |
30 מעלות צלזיוס |
28 מעלות צלזיוס |
29 מעלות צלזיוס |
באיזה מהשבועיים הטמפרטורה נשארה סדירה יותר בעיר זו?
פתרון הבעיה:
כדי לנתח את סדירות הטמפרטורה, עלינו להשוות את סטיות התקן של הטמפרטורות שנרשמו בשבועות 1 ו-2.
- בואו נסתכל תחילה על סטיית התקן עבור שבוע 1:
שימו לב שהממוצע μ1 זה לא1 הם
\(\mu_1=\frac{29+30+31+31.5+28+28.5+29}{7}\approx29.57\)
\(N_1=7 \) (7 ימים בשבוע)
כמו כן, עלינו לחשב את ריבוע ההפרש בין כל טמפרטורה לטמפרטורה הממוצעת.
\(\left (29-29.57\right)^2=0.3249\)
\(\left (30-29.57\right)^2=0.1849\)
\(\left (31-29.57\right)^2=2.0449\)
\(\left (31.5-29.57\right)^2=3.7249\)
\(\left (28-29.57\right)^2=2.4649\)
\(\left (28.5-29.57\right)^2=1.1449\)
\(\left (29-29.57\right)^2=0.3249\)
אם מוסיפים את התוצאות, יש לנו שמונה הרדיקנד בנוסחת סטיית התקן הוא
\(0,3249\ +\ 0,1849\ +2,0449+3,7249+2,4649+1,1449+0,3249\ =\ 10,2143\)
אז סטיית התקן של שבוע 1 היא
\(\sigma_1=\sqrt{\frac{\sum_{i=1}^{7}\left (x_i-\mu_1\right)^2}{N_1}}=\sqrt{\frac{10,2143} {7}}\ \approx1.208\ °C\)
הערה: תוצאה זו פירושה שרוב שבוע 1 הטמפרטורות נמצאות במרווח [28.36 מעלות צלזיוס, 30.77 מעלות צלזיוס], כלומר, המרווח \(\left[\mu_1-\sigma_1,\mu_1+\sigma_1\right]\).
- עכשיו בואו נסתכל על סטיית התקן של שבוע 2:
בעקבות אותו נימוק, יש לנו
\(\mu_2=\frac{28.5+27+28+29+30+28+29}{7}=28.5\)
\(N_2=7\)
\(\left (28.5-28.5\right)^2=0\)
\(\left (27-28.5\right)^2=2.25\)
\(\left (28-28.5\right)^2=0.25\)
\(\left (29-28.5\right)^2=0.25\)
\(\left (30-28.5\right)^2=2.25\)
\(\left (28-28.5\right)^2=0.25\)
\(\left (29-28.5\right)^2=0.25\)
\(0\ +\ 2,25\ +\ 0,25\ +\ 0,25+2,25+0,25+0,25\ =\ 5,5\)
אז סטיית התקן של שבוע 2 היא
\(\sigma_2=\sqrt{\frac{\sum_{i=1}^{7}\left (x_i-\mu_1\right)^2}{N_2}}=\sqrt{\frac{5,5} {7}}\ \approx0.89\ °C\)
תוצאה זו אומרת שרוב הטמפרטורות בשבוע 2 הן בטווח \(\left[\mu_2-\sigma_2,\mu_2+\sigma_2\right]\), כלומר הטווח \(\left[\mu_2-\sigma_2,\mu_2+\sigma_2\right]\).
תבין את זה \(\sigma_2, כלומר, סטיית התקן של שבוע 2 פחותה מסטיית התקן של שבוע 1. לכן, שבוע 2 הציג טמפרטורות קבועות יותר משבוע 1.
מהם סוגי סטיית התקן?
סוגי סטיית התקן קשורים לסוג ארגון הנתונים. בדוגמה הקודמת, עבדנו עם סטיית התקן של נתונים לא מקובצים. כדי לחשב את סטיית התקן של קבוצה של נתונים מאורגנים אחרת (נתונים מקובצים, למשל), תצטרך להתאים את הנוסחה.
מה ההבדלים בין סטיית תקן לשונות?
סטיית התקן הוא השורש הריבועי של השונות:
\(\sigma=\sqrt{\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}}\)
\(V=\frac{\sum_{i=1}^{N}\left (x_i-\mu\right)^2}{N}\)
כאשר משתמשים בשונות כדי לקבוע את השונות של מערך נתונים, לתוצאה יש את יחידת הנתונים בריבוע, מה שמקשה על הניתוח שלה. לפיכך, סטיית התקן, בעלת יחידה זהה לנתונים, היא כלי אפשרי לפרש את תוצאת השונות.
יודע יותר:תדירות מוחלטת - מספר הפעמים שאותה תגובה הופיעה במהלך איסוף הנתונים
פתרו תרגילים על סטיית תקן
שאלה 1
(FGV) בכיתה של 10 תלמידים ציוני התלמידים בהערכה היו:
6 |
7 |
7 |
8 |
8 |
8 |
8 |
9 |
9 |
10 |
סטיית התקן של רשימה זו היא בערך
א) 0.8.
ב) 0.9.
ג) 1.1.
ד) 1.3.
ה) 1.5.
פתרון הבעיה:
חלופה C.
לפי ההצהרה, N = 10. הממוצע של רשימה זו הוא
\( \mu=\frac{6+7+7+8+8+8+8+9+9+10}{10}=8 \)
יתר על כן,
\(\left (6-8\right)^2=4\)
\(\left (7-8\right)^2=1\)
\(\left (8-8\right)^2=0\)
\(\left (9-8\right)^2=1\)
\(\left (10-8\right)^2=4\)
\(4+1+1+0+0+0+0+1+1+4=12\)
אז סטיית התקן של רשימה זו היא
\(\sigma=\sqrt{\frac{\sum_{i=1}^{10}\left (x_i-8\right)^2}{10}}=\sqrt{\frac{12}{10} }\approx1.1\)
שאלה 2
שקול את ההצהרות שלהלן ודרג כל אחת כ-T (נכון) או F (שקר).
אני. השורש הריבועי של השונות הוא סטיית התקן.
II. לסטיית התקן אין קשר לממוצע האריתמטי.
III. שונות וסטיית תקן הן דוגמאות למדדי פיזור.
הסדר הנכון, מלמעלה למטה, הוא
א) V-V-F
ב) פ-ו-ו
ג) ו-ו-ו
ד) פ-ו-ו
ה) ו-ו-ו
פתרון הבעיה:
אלטרנטיבה E.
אני. השורש הריבועי של השונות הוא סטיית התקן. (נָכוֹן)
II. לסטיית התקן אין קשר לממוצע האריתמטי. (שֶׁקֶר)
סטיית התקן מצביעה על מרווח סביב הממוצע האריתמטי שבו רוב הנתונים נופלים.
III. שונות וסטיית תקן הן דוגמאות למדדי פיזור. (נָכוֹן)
מאת מריה לואיזה אלבס ריזו
מורה למתמטיקה
מָקוֹר: בית ספר ברזיל - https://brasilescola.uol.com.br/matematica/desvio-padrao.htm