מתאם פירושו דמיון או מערכת יחסים בין שני דברים, אנשים או רעיונות. זהו דמיון או שקילות שקיימים בין שתי השערות, סיטואציות או אובייקטים שונים.
בתחום הסטטיסטיקה והמתמטיקה, מתאם מתייחס למדד בין שני משתנים או יותר שקשורים.
המונח קורלציה הוא שם עצם נשי שמקורו בלטינית לְתַאֵם.
ניתן להחליף את המילה מתאם במילים נרדפות כמו: יחס, שקילות, קשר, התכתבויות, אנלוגיה וחיבור.
מקדם התאמה
בסטטיסטיקה ה מקדם המתאם של פירסון (r), המכונה גם מקדם המתאם בין תוצר למומנטום, מודד את הקשר הקיים בין שני משתנים באותו סולם מדד.
תפקיד מקדם המתאם הוא לקבוע את חוזק הקשר הקיים בין קבוצות של נתונים או מידע ידועים.
הערך של מקדם המתאם יכול לנוע בין -1 ל -1 והתוצאה המתקבלת מגדירה האם המתאם הוא שלילי או חיובי.
כדי לפרש את המקדם, צריך לדעת ש- 1 פירושו שהמתאם בין המשתנים הוא מושלם חיובי ו- -1 פירושו שהוא שלילי מושלם. אם המקדם שווה ל- 0 המשמעות היא שהמשתנים אינם תלויים זה בזה.
בסטטיסטיקה יש גם את מקדם המתאם של Spearman, על שמו של הסטטיסטיקאי צ'רלס ספירמן. תפקיד מקדם זה הוא למדוד את עוצמת הקשר בין שני משתנים, בין אם הם לינאריים ובין אם לא.
המתאם של Spearman משמש להערכת האם עוצמת הקשר בין שני המשתנים הניתוחים ניתן למדוד על ידי פונקציה מונוטונית (פונקציה מתמטית המשמרת או הופכת את יחס הסדר התחלתי).
חישוב מקדם המתאם של פירסון
שיטה 1) חישוב מקדם המתאם של פירסון באמצעות משתנות וסטיית תקן.
איפה
סXYהוא המשותף;
סאיקס ו סyמייצגים את סטיית התקן, בהתאמה, של המשתנים x ו- y.
במקרה זה, החישוב כולל תחילה מציאת המשתנות בין המשתנים, וסטיית התקן של כל אחד מהם. ואז חלק את המשתנות על ידי הכפלת סטיות התקן.
לעתים קרובות, ההצהרה כבר מספקת את סטיות התקן של המשתנים, או את המשתנות ביניהם, רק על ידי יישום הנוסחה.
שיטה 2) חישוב מקדם המתאם של פירסון לנתונים גולמיים (ללא משתנות או סטיית תקן).
בשיטה זו, הנוסחה הישירה ביותר היא כדלקמן:
לדוגמא, בהנחה שיש לנו נתונים עם n = 6 תצפיות של שני משתנים: רמת הגלוקוז (y) והגיל (x), החישוב מתבצע לפי השלבים הבאים:
שלב 1) בנה את הטבלה עם נתונים קיימים: i, x, y, והוסף עמודות ריקות עבור xy, x² ו- y²:
שלב 2: הכפל את x ו- y כדי למלא את העמודה "xy". לדוגמא, בשורה 1 יהיה לנו: x1y1 = 43 × 99 = 4257.
שלב 3: ריבוע הערכים בעמודה x והקליט את התוצאות בעמודה x². לדוגמא, בשורה הראשונה יהיה לנו x12 = 43 × 43 = 1849.
שלב 4: בצע את אותו הדבר כמו בשלב 3, כעת השתמש בעמודה y ורשום את ריבוע הערכים שלך בעמודה y². לדוגמא, בשורה הראשונה יהיה לנו: y12 = 99 × 99 = 9801.
שלב 5: קבל את הסכום של כל מספרי העמודות והניח את התוצאה בכותרת התחתונה של העמודה. לדוגמא, סכום העמודה גיל X שווה 43 + 21 + 25 + 42 + 57 + 59 = 247.
שלב 6: השתמש בנוסחה שלעיל כדי להשיג את מקדם המתאם:
אז יש לנו:
חישוב מקדם המתאם של ספירמן
חישוב מקדם המתאם של ספירמן שונה מעט. לשם כך עלינו לארגן את הנתונים שלנו בטבלה הבאה:
1. בהצהרה שני זוגות נתונים, עלינו להציג אותם בטבלה. לדוגמה:
2. בעמודה "דירוג A" נמיין את התצפיות הנמצאות ב"תאריך A "בעלייה "1" הערך הנמוך ביותר בעמודה, ו- n (המספר הכולל של תצפיות) הערך הגבוה ביותר בעמודה "תאריך" ה". בדוגמה שלנו זה:
3. אנו עושים את אותו הדבר כדי להשיג את העמודה "דירוג B", תוך שימוש כעת בתצפיות בעמודה "נתונים B":
4. בעמודה "ד" שמנו את ההבדל בין שני הדירוגים (A - B). כאן האות לא משנה.
5. ריבוע כל אחד מהערכים בעמודה "d" והקליט בעמודה d²:
6. סכם את כל הנתונים מעמודה "d²". ערך זה הוא ²d². בדוגמה שלנו Σd² = 0 + 1 + 0 + 1 = 2
7. כעת אנו משתמשים בנוסחה של ספירמן:
במקרה שלנו, n שווה ל -4, כאשר אנו מסתכלים על מספר קווי הנתונים (המתאים למספר התצפיות).
8. לבסוף החלפנו את הנתונים בנוסחה הקודמת:
רגרסיה לינארית
רגרסיה לינארית היא נוסחה המשמשת לאמידת הערך האפשרי של משתנה (y) כאשר הערכים של משתנים אחרים (x) ידועים. הערך של "x" הוא המשתנה הבלתי תלוי או ההסבר ו "y" הוא המשתנה או התגובה התלויים.
נעשה שימוש ברגרסיה לינארית כדי לראות כיצד הערך של "y" יכול להשתנות כפונקציה של המשתנה "x". השורה המכילה את ערכי בדיקת השונות נקראת קו רגרסיה לינארית.
אם למשתנה ההסבר "x" יש ערך יחיד, ייקרא הרגרסיה רגרסיה לינארית פשוטה.