koreliacija reiškia panašumą arba dviejų dalykų, žmonių ar idėjų, santykis. Tai yra panašumas ar ekvivalentiškumas, egzistuojantis tarp dviejų skirtingų hipotezių, situacijų ar objektų.
Statistikos ir matematikos srityje koreliacija nurodo matą tarp dviejų ar daugiau susijusių kintamųjų.
Sąvoka koreliacija yra moteriškas daiktavardis, kilęs iš lotynų kalbos koreliuoja.
Žodį koreliacija galima pakeisti tokiais sinonimais kaip: santykis, ekvivalentiškumas, ryšys, korespondencija, analogija ir ryšys.
Koreliacijos koeficientas
Statistikoje Pearsono koreliacijos koeficientas (r), kuris dar vadinamas produkto ir impulso koreliacijos koeficientu, matuojamas ryšys, egzistuojantis tarp dviejų kintamųjų toje pačioje metrinėje skalėje.
Koreliacijos koeficiento funkcija yra nustatyti ryšį, kuris egzistuoja tarp žinomų duomenų ar informacijos rinkinių.
Koreliacijos koeficiento vertė gali svyruoti nuo -1 iki 1, o gautas rezultatas apibrėžia, ar koreliacija yra neigiama, ar teigiama.
Norint interpretuoti koeficientą, būtina žinoti, kad 1 reiškia, kad koreliacija tarp kintamųjų yra
tobulas teigiamas ir -1 reiškia, kad yra tobulas neigiamas. Jei koeficientas lygus 0, tai reiškia, kad kintamieji nepriklauso vienas nuo kito.Statistikoje taip pat yra Spearmano koreliacijos koeficientas, pavadintas statistiko Charleso Spearmano vardu. Šio koeficiento funkcija yra išmatuoti dviejų kintamųjų santykio intensyvumą, nesvarbu, ar jie yra tiesiniai, ar ne.
„Spearman“ koreliacija padeda įvertinti, ar santykis tarp dviejų analizuojamų kintamųjų yra intensyvus gali būti matuojamas monotonine funkcija (matematine funkcija, kuri išsaugo arba apvers užsakymo sąryšį pradinis).
Pearsono koreliacijos koeficiento apskaičiavimas
1 metodas) Pearsono koreliacijos koeficiento apskaičiavimas naudojant kovariaciją ir standartinį nuokrypį.

Kur
sXYyra kovariacija;
sx ir syreiškia x ir y kintamųjų standartinį nuokrypį.
Šiuo atveju atliekant skaičiavimą pirmiausia nustatoma kintamumas tarp kintamųjų ir kiekvieno iš jų standartinis nuokrypis. Tada padalykite kovariaciją padauginę standartinius nuokrypius.
Dažnai teiginyje jau pateikiami arba standartiniai kintamųjų nuokrypiai, arba kovariacija tarp jų, tik taikant formulę.
2 metodas) Pearsono koreliacijos koeficiento su pirminiais duomenimis apskaičiavimas (nėra kovariacijos ar standartinio nuokrypio).
Taikant šį metodą, tiesiausia formulė yra tokia:

Pavyzdžiui, darant prielaidą, kad turime dviejų kintamųjų: gliukozės lygio (y) ir amžiaus (x) duomenų su n = 6 stebėjimais, skaičiuojant atliekami šie žingsniai:
1 žingsnis. Sukurkite lentelę naudodami esamus duomenis: i, x, y ir pridėkite tuščius stulpelius xy, x² ir y²:

2 žingsnis: padauginkite x ir y, kad užpildytumėte stulpelį „xy“. Pavyzdžiui, 1 eilutėje turėsime: x1y1 = 43 × 99 = 4257.

3 žingsnis: kvadratuokite vertes x stulpelyje, o rezultatus įrašykite į x² stulpelį. Pavyzdžiui, pirmoje eilutėje turėsime x12 = 43 × 43 = 1849.

4 žingsnis: atlikite tą patį, kaip ir 3 veiksme, dabar naudokite y stulpelį ir įrašykite savo verčių kvadratą į stulpelį y². Pavyzdžiui, pirmoje eilutėje turėsime: y12 = 99 × 99 = 9801.

5 žingsnis: Gaukite visų stulpelių skaičių sumą ir rezultatą padėkite į stulpelio poraštę. Pavyzdžiui, X amžiaus stulpelio suma lygi 43 + 21 + 25 + 42 + 57 + 59 = 247.

6 žingsnis: Norėdami gauti koreliacijos koeficientą, naudokite aukščiau pateiktą formulę:

Taigi mes turime:

Spearmano koreliacijos koeficiento apskaičiavimas
Spearmano koreliacijos koeficiento skaičiavimas yra šiek tiek kitoks. Tam turime sutvarkyti duomenis šioje lentelėje:

1. Turėdami sakinyje 2 poras duomenų, turime juos pateikti lentelėje. Pavyzdžiui:

2. Stulpelyje „A reitingas“ surūšiuosime stebėjimus, esančius „Data A“, didėjantį, esantį „1“ - mažiausia vertė stulpelyje, o n (bendras stebėjimų skaičius) - didžiausia reikšmė stulpelyje „Data“ THE ". Mūsų pavyzdyje tai:

3. Mes darome tą patį, kad gautume stulpelį „B reitingas“, dabar naudodami stebėjimus stulpelyje „Duomenys B“:

4. „D“ stulpelyje pateikiame skirtumą tarp dviejų reitingų (A - B). Čia signalas nesvarbu.

5. Kvadratizuokite kiekvieną „d“ stulpelio vertę ir įrašykite į stulpelį d²:

6. Susumuokite visus duomenis iš „d²“ stulpelio. Ši vertė yra Σd². Mūsų pavyzdyje Σd² = 0 + 1 + 0 + 1 = 2
7. Dabar mes naudojame „Spearman“ formulę:

Mūsų atveju n yra lygus 4, nes mes žiūrime į duomenų eilučių skaičių (kuris atitinka stebėjimų skaičių).
8. Galiausiai pakeitėme ankstesnės formulės duomenis:

tiesinė regresija
Linijinė regresija yra formulė, naudojama įvertinti galimą kintamojo (y) vertę, kai žinomos kitų kintamųjų (x) reikšmės. „X“ reikšmė yra nepriklausomas arba aiškinamasis kintamasis, o „y“ - priklausomas kintamasis ar atsakas.
Linijinė regresija naudojama norint sužinoti, kaip „y“ reikšmė gali skirtis kaip kintamojo „x“ funkcija. Linija, kurioje yra dispersijos tikrinimo vertės, vadinama tiesine regresijos tiese.
Jei aiškinamasis kintamasis „x“ turi vieną reikšmę, bus iškviesta regresija paprasta tiesinė regresija.
