korrelatsioon tähendab sarnasust või suhe kahe asja, inimese või idee vahel. See on sarnasus või samaväärsus, mis eksisteerib kahe erineva hüpoteesi, olukorra või objekti vahel.
Statistika ja matemaatika valdkonnas viitab korrelatsioon mõõdule kahe või enama seotud muutuja vahel.
Mõiste korrelatsioon on naissoost nimisõna, mis pärineb ladina keelest korreleeruma.
Sõna korrelatsioon võib asendada sünonüümidega nagu: seos, samaväärsus, seos, kirjavahetus, analoogia ja seos.
Korrelatsioonikordaja
Statistikas Pearsoni korrelatsioonikordaja (r), mida nimetatakse ka toote ja impordi korrelatsioonikordajaks, mõõdab suhet, mis eksisteerib kahe muutuja vahel ühes meetrises skaalas.
Korrelatsioonikordaja ülesandeks on teadaolevate andmete või teabe kogumite vahelise seose tugevuse määramine.
Korrelatsioonikordaja väärtus võib varieeruda vahemikus -1 kuni 1 ja saadud tulemus määratleb, kas korrelatsioon on negatiivne või positiivne.
Koefitsiendi tõlgendamiseks on vaja teada, et 1 tähendab, et muutujate korrelatsioon on
ideaalne positiivne ja -1 tähendab, et on täiuslik negatiivne. Kui koefitsient on võrdne 0, tähendab see, et muutujad ei sõltu üksteisest.Statistikas on ka Spearmani korrelatsioonikordaja, mille nimi on statistik Charles Spearman. Selle koefitsiendi ülesanne on mõõta kahe muutuja vahelise suhte intensiivsust, olenemata sellest, kas need on lineaarsed või mitte.
Spearmani korrelatsioon aitab hinnata, kas kahe analüüsitud muutuja vahelise seose intensiivsus saab mõõta monotoonse funktsiooniga (matemaatiline funktsioon, mis säilitab või pöörab järjestuse seose esialgne).
Pearsoni korrelatsioonikordaja arvutamine
Meetod 1) Pearsoni korrelatsioonikordaja arvutamine kovariantsuse ja standardhälbe abil.
Kus
sXYon kovariantsus;
sx ja sytähistavad vastavalt muutujate x ja y standardhälvet.
Sellisel juhul hõlmab arvutus kõigepealt muutujate kovariantsuse ja nende kõigi standardhälbe leidmist. Seejärel jagage kovariants, korrutades standardhälbed.
Sageli pakub lause juba muutujate standardhälbeid või nende vahelist kovarianti, kasutades lihtsalt valemit.
Meetod 2) Pearsoni korrelatsioonikordaja arvutamine algandmetega (kovariantsus ja standardhälve puuduvad).
Selle meetodi puhul on kõige otsesem valem järgmine:
Näiteks eeldades, et meil on andmeid kahe muutuja n: 6 vaatlusega: glükoositase (y) ja vanus (x), tehakse arvutus järgmiselt:
1. samm. Ehitage tabel olemasolevate andmetega: i, x, y ja lisage xy, x² ja y² jaoks tühjad veerud:
2. samm: veeru „xy“ täitmiseks korrutage x ja y. Näiteks real 1 on meil: x1y1 = 43 × 99 = 4257.
3. samm: ruudutage väärtused veerus x ja registreerige tulemused veergu x². Näiteks esimeses reas on meil x12 = 43 × 43 = 1849.
4. samm: tehke samamoodi nagu 3. etapis, kasutades nüüd veergu y ja salvestage oma väärtuste ruut veergu y². Näiteks esimeses reas on meil: y12 = 99 × 99 = 9801.
5. samm: hankige kõigi veergude numbrite summa ja asetage tulemus veeru jalusse. Näiteks veeru Vanus X summa on 43 + 21 + 25 + 42 + 57 + 59 = 247.
6. samm: kasutage korrelatsioonikordaja saamiseks ülaltoodud valemit:
Nii et meil on:
Spearmani korrelatsioonikordaja arvutamine
Spearmani korrelatsioonikordaja arvutamine on veidi erinev. Selleks peame korrastama oma andmed järgmises tabelis:
1. Võttes avalduses 2 paari andmeid, peame need tabelis tutvustama. Näiteks:
2. Veerus "Edetabel A" sorteerime vaatlused, mis on "Kuupäev A", kasvavalt, olles „1“ on veeru väikseim väärtus ja n (vaatluste koguarv) kõrgeim väärtus veerus „Date“ THE ". Meie näites on see:
3. Sama teeme veeru „Edetabel B” saamiseks, kasutades nüüd veerus „Andmed B” olevaid vaatlusi:
4. Veergu “d” panime vahe kahe paremusjärjestuse (A - B) vahel. Siin pole signaal oluline.
5. Ruudutage veerus "d" olevad väärtused ja kirjendage veergu d²:
6. Summeerige kõik veeru "d²" andmed. See väärtus on Σd². Meie näites Σd² = 0 + 1 + 0 + 1 = 2
7. Nüüd kasutame Spearmani valemit:
Meie puhul on n võrdne 4-ga, kui vaatame andmeridade arvu (mis vastab vaatluste arvule).
8. Lõpuks asendasime eelmise valemi andmed:
lineaarne regressioon
Lineaarne regressioon on valem, mida kasutatakse muutuja (y) võimaliku väärtuse hindamiseks, kui teiste muutujate (x) väärtused on teada. "X" väärtus on sõltumatu või selgitav muutuja ja "y" on sõltuv muutuja või vastus.
Lineaarset regressiooni kasutatakse selleks, et näha, kuidas "y" väärtus võib muutuja "x" funktsioonina erineda. Dispersiooni kontrollväärtusi sisaldavat joont nimetatakse lineaarseks regressioonijooneks.
Kui seletaval muutujal "x" on üks väärtus, kutsutakse regressioon lihtne lineaarne regressioon.