az összefüggés hasonlóságot vagy két dolog, ember vagy ötlet kapcsolata. Két különböző hipotézis, helyzet vagy objektum között fennálló hasonlóság vagy ekvivalencia.
A statisztika és a matematika területén a korreláció két vagy több összefüggő változó közötti mértékre vonatkozik.
A korreláció kifejezés egy női főnév, amely latinból származik korrelál.
A korreláció szó helyettesíthető olyan szinonimákkal, mint: reláció, ekvivalencia, nexus, levelezés, analógia és kapcsolat.
Korrelációs együttható
A statisztikában a Pearson korrelációs együtthatója Az (r), amelyet termék-impulzus korrelációs együtthatónak is neveznek, méri a két változó közötti kapcsolatot ugyanabban a metrikus skálán.
A korrelációs együttható funkciója az ismert adatok vagy információk halmazai között fennálló kapcsolat erősségének meghatározása.
A korrelációs együttható értéke -1 és 1 között változhat, és a kapott eredmény határozza meg, hogy a korreláció negatív vagy pozitív.
Az együttható értelmezéséhez tudnunk kell, hogy az 1 azt jelenti, hogy a változók közötti korreláció
tökéletes pozitív a -1 pedig azt jelenti tökéletes negatív. Ha az együttható értéke 0, az azt jelenti, hogy a változók nem függnek egymástól.A statisztikában ott van a Spearman-korrelációs együttható, Charles Spearman statisztikusról kapta a nevét. Ennek az együtthatónak a feladata két változó közötti kapcsolat intenzitásának mérése, függetlenül attól, hogy lineárisak-e vagy sem.
A Spearman-korreláció annak értékelésére szolgál, hogy a két elemzett változó közötti kapcsolat intenzitása-e monoton függvénnyel mérhető (matematikai függvény, amely megőrzi vagy megfordítja a sorrend relációt a kezdeti).
Pearson korrelációs együtthatójának kiszámítása
1. módszer Pearson korrelációs együtthatójának kiszámítása kovariancia és szórás alkalmazásával.
![Korreláció - Pearson-együttható](/f/610b44044e1f916af442137bcd2f5d8a.png)
Hol
sXYa kovariancia;
sx és syaz x és y változók szórását jelöli.
Ebben az esetben a számítás során először meg kell találni a változók közötti kovarianciát, és mindegyikük szórását. Ezután ossza meg a kovarianciát a szórások szorzásával.
Gyakran csak a képlet alkalmazásával adja meg az utasítás vagy a változók szórását, vagy a közöttük lévő kovarianciát.
2. módszer) Pearson korrelációs együtthatójának kiszámítása a nyers adatokkal (nincs kovariancia vagy szórás).
Ezzel a módszerrel a legközvetlenebb képlet a következő:
![Korreláció - Pearson-együttható 2](/f/7263d4ea40b4a7f31a07d38cd934469d.png)
Például feltételezve, hogy n = 6 megfigyeléssel rendelkezünk adatokkal két változóra: glükózszint (y) és életkor (x), a számítás a következő lépéseket követi:
1. lépés: Készítse el a táblázatot a meglévő adatokkal: i, x, y, és adjon hozzá üres oszlopokat az xy, x² és y² értékekhez:
![táblázat - összefüggés](/f/d47800590abeaa041214e28d0fd5be59.png)
2. lépés: Szorozza x és y számokat az „xy” oszlop kitöltéséhez. Például az 1. sorban: x1y1 = 43 × 99 = 4257.
![táblázat - 2. összefüggés](/f/df5dba327f17e484b4406ed32a0de1da.png)
3. lépés: Szögezze be az értékeket az x oszlopba, és rögzítse az eredményeket az x2 oszlopba. Például az első sorban x lesz12 = 43 × 43 = 1849.
![táblázat - 3. összefüggés](/f/2e9ece7cec41a332e644355ca6b87f57.png)
4. lépés: Tegye ugyanezt, mint a 3. lépésben, most használja az y oszlopot, és az értékek négyzetét rögzítse az y² oszlopba. Például az első sorban: y12 = 99 × 99 = 9801.
![táblázat - 4. összefüggés](/f/ce4183acdaff7c6be400ea484d232ee1.png)
5. lépés: Szerezze meg az összes oszlop számának összegét, és helyezze az eredményt az oszlop láblécébe. Például az X kor oszlopának összege 43 + 21 + 25 + 42 + 57 + 59 = 247.
![táblázat - 5. összefüggés](/f/9745d532abe9d9a7e93f0a4ced806b0e.png)
6. lépés: Használja a fenti képletet a korrelációs együttható megszerzéséhez:
![egyenlet - összefüggés - 6. lépés](/f/fb5a0beaf2a9625b3b6aa352f06c2ff8.png)
Tehát:
![egyenlet - összefüggés - 7. lépés](/f/713670bb12d062eec4e78c16207658b3.png)
Spearman korrelációs együtthatójának kiszámítása
Spearman korrelációs együtthatójának kiszámítása kissé eltér. Ehhez az alábbi táblázatba kell rendeznünk adatainkat:
![1. táblázat - Összefüggés](/f/1ac895c513dbc9ad40c33343ac9f60b0.png)
1. Mivel az utasításban 2 adatpár van, be kell mutatnunk a táblázatba. Például:
![2. táblázat - Összefüggés](/f/cef8b8425636089251b308243299f7a0.png)
2. Az "A rangsor" oszlopban rendezni fogjuk azokat a megfigyeléseket, amelyek az "A dátum" oszlopban vannak, növekvő módon „1” a legalacsonyabb érték az oszlopban, és n (a megfigyelések teljes száma) a legmagasabb érték a „Date” oszlopban A". Példánkban ez:
![3. táblázat - Összefüggés](/f/15849f2568254f2db3aa37412e60839d.png)
3. Ugyanezt tesszük a „B rangsor” oszlop megszerzéséhez, a „B adat” oszlopban található megfigyelések felhasználásával:
![4. táblázat - Összefüggés](/f/c67f5794aa46ab7ca6f553bc6e827251.png)
4. A „d” oszlopba tesszük a két rangsor (A - B) közötti különbséget. Itt a jel nem számít.
![5. táblázat - Összefüggés](/f/a6377daa013c51c77a6163ae25ff635f.png)
5. Jelölje négyzetbe a "d" oszlopban szereplő értékeket, és rögzítse a d² oszlopba:
![6. táblázat - Összefüggés](/f/f96185cd6531a6f4044fc27d632bc0e2.png)
6. Összegezze az összes adatot a "d²" oszlopból. Ez az érték Σd². Példánkban Σd² = 0 + 1 + 0 + 1 = 2
7. Most Spearman képletét használjuk:
![Spearman képlete](/f/f9212558029373598b9948086fbeda41.png)
Esetünkben n értéke 4, mivel az adatsorok számát nézzük (ami megfelel a megfigyelések számának).
8. Végül kicseréltük az előző képlet adatait:
![Eredmény - összefüggés](/f/5a36e561aa4377f6056d94b79971cc17.png)
lineáris regresszió
A lineáris regresszió egy olyan képlet, amelyet egy változó (y) lehetséges értékének becslésére használnak, ha más változók (x) értéke ismert. Az "x" értéke a független vagy magyarázó változó, az "y" pedig a függő változó vagy válasz.
A lineáris regresszió segítségével megtudhatjuk, hogyan változhat az "y" értéke az "x" változó függvényében. A varianciaellenőrzési értékeket tartalmazó vonalat lineáris regressziós vonalnak nevezzük.
Ha az "x" magyarázó változónak egyetlen értéke van, akkor a regressziót hívjuk meg egyszerű lineáris regresszió.
![Egyszerű lineáris regressziós modell](/f/5239beaa3ad5c1378318e204d6e38480.png)