sammenheng betyr en likhet eller forholdet mellom to ting, mennesker eller ideer. Det er en likhet eller ekvivalens som eksisterer mellom to forskjellige hypoteser, situasjoner eller objekter.
Innen statistikk og matematikk refererer korrelasjon til et mål mellom to eller flere variabler som er relatert.
Begrepet korrelasjon er et kvinnelig substantiv som kommer fra latin korrelere.
Ordet korrelasjon kan erstattes av synonymer som: forhold, ekvivalens, nexus, korrespondanse, analogi og sammenheng.
Korrelasjonskoeffisient
I statistikken Pearsons korrelasjonskoeffisient (r), som også kalles korrelasjonskoeffisienten produkt-momentum, måler forholdet som eksisterer mellom to variabler innenfor samme metriske skala.
Funksjonen til korrelasjonskoeffisienten er å bestemme styrken av forholdet som eksisterer mellom sett med kjente data eller informasjon.
Verdien av korrelasjonskoeffisienten kan variere mellom -1 og 1, og resultatet oppnådd definerer om korrelasjonen er negativ eller positiv.
For å tolke koeffisienten er det nødvendig å vite at 1 betyr at korrelasjonen mellom variablene er
perfekt positiv og -1 betyr at det er perfekt negativ. Hvis koeffisienten er lik 0 betyr det at variablene ikke er avhengige av hverandre.I statistikken er det også Spearman korrelasjonskoeffisient, oppkalt etter statistikeren Charles Spearman. Funksjonen til denne koeffisienten er å måle intensiteten i forholdet mellom to variabler, enten de er lineære eller ikke.
Spearman-korrelasjonen tjener til å vurdere om intensiteten i forholdet mellom de to analyserte variablene kan måles med en monoton funksjon (matematisk funksjon som bevarer eller inverterer rekkefølgen første).
Beregning av Pearsons korrelasjonskoeffisient
Metode 1) Beregning av Pearsons korrelasjonskoeffisient ved bruk av kovarians og standardavvik.
Hvor
sXYer kovariansen;
sx og syrepresenterer standardavviket til henholdsvis x- og y-variablene.
I dette tilfellet innebærer beregningen først å finne kovariansen mellom variablene, og standardavviket til hver av dem. Del deretter kovariansen ved å multiplisere standardavvikene.
Ofte gir uttalelsen allerede standardavvikene til variablene, eller kovariansen mellom dem, bare ved å bruke formelen.
Metode 2) Beregning av Pearsons korrelasjonskoeffisient med rådata (ingen kovarians eller standardavvik).
Med denne metoden er den mest direkte formelen som følger:
For eksempel, forutsatt at vi har data med n = 6 observasjoner av to variabler: glukosenivå (y) og alder (x), følger beregningen disse trinnene:
Trinn 1) Bygg tabellen med eksisterende data: i, x, y, og legg til tomme kolonner for xy, x² og y²:
Trinn 2: Multipliser x og y for å fylle "xy" -kolonnen. For eksempel vil vi i linje 1 ha: x1y1 = 43 × 99 = 4257.
Trinn 3: Kvadrat verdiene i kolonne x, og registrer resultatene i kolonne x². For eksempel i første linje vil vi ha x12 = 43 × 43 = 1849.
Trinn 4: Gjør det samme som i trinn 3, bruk nå kolonne y og registrer kvadratet av verdiene dine i kolonne y². For eksempel vil vi i første linje ha: y12 = 99 × 99 = 9801.
Trinn 5: Få summen av alle kolonnetall og plasser resultatet i kolonnefoten. For eksempel er summen av kolonne Alder X lik 43 + 21 + 25 + 42 + 57 + 59 = 247.
Trinn 6: Bruk formelen ovenfor for å oppnå korrelasjonskoeffisienten:
Så vi har:
Beregning av Spearmans korrelasjonskoeffisient
Beregningen av Spearmans korrelasjonskoeffisient er litt annerledes. For det må vi organisere dataene våre i følgende tabell:
1. Når vi har i setningen to par data, må vi introdusere dem i tabellen. For eksempel:
2. I "Rangering A" -kolonnen vil vi sortere observasjonene som er i "Dato A" stigende "1" den laveste verdien i kolonnen, og n (totalt antall observasjoner) den høyeste verdien i "Dato" -kolonnen DE". I vårt eksempel er det:
3. Vi gjør det samme for å oppnå "Rangering B" -kolonnen, og bruker nå observasjonene i "Data B" -kolonnen:
4. I kolonne “d” setter vi forskjellen mellom de to rangeringene (A - B). Her betyr ikke signalet noe.
5. Firkant hver av verdiene i kolonne "d" og registrer i kolonne d²:
6. Sum alle data fra kolonne "d²". Denne verdien er Σd². I vårt eksempel Σd² = 0 + 1 + 0 + 1 = 2
7. Nå bruker vi Spearmans formel:
I vårt tilfelle er n lik 4, ettersom vi ser på antall datalinjer (som tilsvarer antall observasjoner).
8. Til slutt erstattet vi dataene i forrige formel:
lineær regresjon
Lineær regresjon er en formel som brukes til å estimere den mulige verdien til en variabel (y) når verdiene til andre variabler (x) er kjent. Verdien av "x" er den uavhengige eller forklarende variabelen, og "y" er den avhengige variabelen eller responsen.
Lineær regresjon brukes for å se hvordan verdien av "y" kan variere som en funksjon av variabelen "x". Linjen som inneholder avvikskontrollverdiene kalles den lineære regresjonslinjen.
Hvis den forklarende variabelen "x" har en enkelt verdi, vil regresjonen bli kalt enkel lineær regresjon.