korrelaatio tarkoittaa samankaltaisuutta tai kahden asian, ihmisten tai ideoiden, suhde. Se on samankaltaisuus tai vastaavuus, joka esiintyy kahden eri hypoteesin, tilanteen tai objektin välillä.
Tilastojen ja matematiikan alalla korrelaatio viittaa kahden tai useamman toisiinsa liittyvän muuttujan väliseen mittaan.
Termi korrelaatio on naispuolinen substantiivi, joka tulee latinasta korreloivat.
Sana korrelaatio voidaan korvata synonyymeillä, kuten: suhde, vastaavuus, yhteys, vastaavuus, analogia ja yhteys.
Korrelaatiokerroin
Tilastoissa Pearsonin korrelaatiokerroin (r), jota kutsutaan myös tuotteen ja impulssin korrelaatiokertoimeksi, mittaa kahden muuttujan välillä saman metrisen asteikon välistä suhdetta.
Korrelaatiokertoimen tehtävänä on määrittää tunnetun tiedon tai tietojoukkojen välisen suhteen vahvuus.
Korrelaatiokertoimen arvo voi vaihdella välillä -1 ja 1, ja saatu tulos määrittää, onko korrelaatio negatiivinen vai positiivinen.
Kertoimen tulkitsemiseksi on välttämätöntä tietää, että 1 tarkoittaa, että muuttujien välinen korrelaatio on
täydellinen positiivinen ja -1 tarkoittaa sitä täydellinen negatiivinen. Jos kerroin on yhtä suuri kuin 0, se tarkoittaa, että muuttujat eivät ole riippuvaisia toisistaan.Tilastoissa on myös Spearman-korrelaatiokerroin, nimetty tilastotieteilijä Charles Spearmanin mukaan. Tämän kertoimen tehtävänä on mitata kahden muuttujan välisen suhteen intensiteetti riippumatta siitä, ovatko ne lineaarisia vai ei.
Spearman-korrelaatio auttaa arvioimaan, onko kahden analysoidun muuttujan välisen suhteen voimakkuus voidaan mitata yksitoikkoisella funktiolla (matemaattinen funktio, joka säilyttää tai kääntää järjestyssuhteen alkukirjain).
Pearsonin korrelaatiokertoimen laskeminen
Menetelmä 1) Pearsonin korrelaatiokertoimen laskeminen käyttämällä kovarianssia ja keskihajontaa.
Missä
sXYon kovarianssi;
sx ja syedustavat muuttujien x ja y keskihajontaa.
Tällöin laskelma edellyttää ensin muuttujien välisen kovarianssin ja kummankin keskihajonnan löytämistä. Jaa sitten kovarianssi kertomalla keskihajonta.
Usein lauseke antaa jo joko muuttujien keskihajonnat tai niiden välisen kovarianssin vain kaavaa soveltamalla.
Menetelmä 2) Pearsonin korrelaatiokertoimen ja raakatietojen laskeminen (ei kovarianssia tai keskihajontaa).
Tällä menetelmällä suorin kaava on seuraava:
Esimerkiksi olettaen, että meillä on tietoja n = 6 havainnolla kahdesta muuttujasta: glukoositaso (y) ja ikä (x), laskelma seuraa näitä vaiheita:
Vaihe 1) Rakenna taulukko olemassa olevilla tiedoilla: i, x, y ja lisää tyhjät sarakkeet xy, x² ja y²:
Vaihe 2: Kerro x ja y täyttääksesi "xy" -sarakkeen. Esimerkiksi rivillä 1 meillä on: x1y1 = 43 × 99 = 4257.
Vaihe 3: Neliä sarakkeen x arvot ja tallenna tulokset sarakkeeseen x². Esimerkiksi ensimmäisellä rivillä on x12 = 43 × 43 = 1849.
Vaihe 4: Tee sama kuin vaiheessa 3, käytä nyt saraketta y ja kirjoita arvojesi neliö sarakkeeseen y². Esimerkiksi ensimmäisellä rivillä on: y12 = 99 × 99 = 9801.
Vaihe 5: Hanki kaikkien sarakkeiden numeroiden summa ja aseta tulos sarakkeen alatunnisteeseen. Esimerkiksi sarakkeen Ikä X summa on 43 + 21 + 25 + 42 + 57 + 59 = 247.
Vaihe 6: Käytä yllä olevaa kaavaa saadaksesi korrelaatiokerroin:
Joten meillä on:
Spearmanin korrelaatiokertoimen laskeminen
Spearmanin korrelaatiokertoimen laskeminen on hieman erilainen. Tätä varten meidän on järjestettävä tietomme seuraavaan taulukkoon:
1. Kun lausekkeessa on 2 tietoparia, ne on esitettävä taulukossa. Esimerkiksi:
2. "Sijoitus A" -sarakkeessa lajitellaan havainnot, jotka ovat "Päivämäärä A" -kohdassa nousevassa muodossa ”1” sarakkeen pienin arvo ja n (havaintojen kokonaismäärä) korkein arvo “päivämäärä” -sarakkeessa THE ". Esimerkissämme se on:
3. Teemme samoin saadaksemme “Ranking B” -sarakkeen käyttämällä nyt Data ”-sarakkeen havaintoja:
4. Sarakkeeseen "d" laitetaan ero kahden sijoittelun (A - B) välillä. Tässä signaalilla ei ole merkitystä.
5. Neliö kukin sarakkeen "d" arvoista ja kirjoita sarakkeeseen d²:
6. Summa kaikki sarakkeen "d²" tiedot. Tämä arvo on Σd². Esimerkissämme Σd² = 0 + 1 + 0 + 1 = 2
7. Nyt käytämme Spearmanin kaavaa:
Meidän tapauksessamme n on yhtä suuri kuin 4, kun tarkastellaan tietorivien määrää (mikä vastaa havaintojen määrää).
8. Lopuksi korvattiin edellisen kaavan tiedot:
lineaarinen regressio
Lineaarinen regressio on kaava, jota käytetään arvioimaan muuttujan (y) mahdollinen arvo, kun muiden muuttujien (x) arvot tunnetaan. "X": n arvo on riippumaton tai selittävä muuttuja ja "y" on riippuva muuttuja tai vaste.
Lineaarista regressiota käytetään selvittämään, kuinka "y": n arvo voi vaihdella muuttujan "x" funktiona. Varianssitarkistusarvoja sisältävää viivaa kutsutaan lineaariseksi regressioviivaksi.
Jos selittävällä muuttujalla "x" on yksi arvo, regressio kutsutaan yksinkertainen lineaarinen regressio.