korelasyon bir benzerlik veya iki şey, insanlar veya fikirler arasındaki ilişki. İki farklı hipotez, durum veya nesne arasında var olan benzerlik veya eşdeğerliktir.
İstatistik ve matematik alanında korelasyon, birbiriyle ilişkili iki veya daha fazla değişken arasındaki bir ölçüyü ifade eder.
Korelasyon terimi Latinceden gelen dişil bir isimdir. ilişkilendirmek.
Korelasyon kelimesi, ilişki, denklik, nexus, yazışma, analoji ve bağlantı gibi eşanlamlılarla değiştirilebilir.
Korelasyon katsayısı
istatistiklerde Pearson korelasyon katsayısı Çarpım-momentum korelasyon katsayısı olarak da adlandırılan (r), aynı metrik ölçekte iki değişken arasındaki ilişkiyi ölçer.
Korelasyon katsayısının işlevi, bilinen veri veya bilgi kümeleri arasında var olan ilişkinin gücünü belirlemektir.
Korelasyon katsayısının değeri -1 ile 1 arasında değişebilmekte ve elde edilen sonuç korelasyonun negatif mi pozitif mi olduğunu belirlemektedir.
Katsayıyı yorumlamak için, 1'in değişkenler arasındaki korelasyonun olduğu anlamına geldiğini bilmek gerekir.
mükemmel pozitif ve -1 olduğu anlamına gelir mükemmel negatif. Katsayının 0 olması, değişkenlerin birbirine bağlı olmadığı anlamına gelir.istatistiklerde de var Spearman korelasyon katsayısıadını istatistikçi Charles Spearman'dan almıştır. Bu katsayının işlevi, doğrusal olsun veya olmasın iki değişken arasındaki ilişkinin yoğunluğunu ölçmektir.
Spearman korelasyonu, analiz edilen iki değişken arasındaki ilişkinin yoğunluğunun değerlendirilmesine hizmet eder. monoton bir fonksiyon (sıra ilişkisini koruyan veya tersine çeviren matematiksel fonksiyon) ile ölçülebilir. başlangıç).
Pearson korelasyon katsayısının hesaplanması
Yöntem 1) Pearson korelasyon katsayısının kovaryans ve standart sapma kullanılarak hesaplanması.
Nerede
sXYkovaryans;
sx ve sysırasıyla x ve y değişkenlerinin standart sapmasını temsil eder.
Bu durumda, hesaplama önce değişkenler arasındaki kovaryansı ve her birinin standart sapmasını bulmayı içerir. Ardından, standart sapmaları çarparak kovaryansı bölün.
Çoğu zaman, ifade, yalnızca formülü uygulayarak, değişkenlerin standart sapmalarını veya aralarındaki kovaryansı zaten sağlar.
Yöntem 2) Pearson korelasyon katsayısının ham verilerle hesaplanması (kovaryans veya standart sapma yok).
Bu yöntemle en doğrudan formül şu şekildedir:
Örneğin, iki değişkenin n=6 gözlemine sahip verilerimiz olduğunu varsayarsak: glikoz seviyesi (y) ve yaş (x), hesaplama şu adımları takip eder:
Adım 1) Tabloyu mevcut verilerle oluşturun: i, x, y ve xy, x² ve y² için boş sütunlar ekleyin:
Adım 2: "xy" sütununu doldurmak için x ve y'yi çarpın. Örneğin, 1. satırda x1y1 = 43 × 99 = 4257 olacaktır.
Adım 3: x sütunundaki değerlerin karesini alın ve sonuçları x² sütununa kaydedin. Örneğin, ilk satırda x olacak12 = 43 × 43 = 1849.
Adım 4: Adım 3'teki gibi yapın, şimdi y sütununu kullanın ve değerlerinizin karesini y² sütununa kaydedin. Örneğin, ilk satırda şunlar olacak: y12 = 99 × 99 = 9801.
Adım 5: Tüm sütun numaralarının toplamını alın ve sonucu sütun altbilgisine yerleştirin. Örneğin, X Çağı sütununun toplamı 43+21+25+42+57+59 = 247'ye eşittir.
Adım 6: Korelasyon katsayısını elde etmek için yukarıdaki formülü kullanın:
Böylece sahibiz:
Spearman Korelasyon Katsayının Hesaplanması
Spearman'ın korelasyon katsayısının hesaplanması biraz farklıdır. Bunun için verilerimizi aşağıdaki tabloda düzenlememiz gerekiyor:
1. İfadede 2 çift veriye sahip olarak, bunları tabloda tanıtmalıyız. Örneğin:
2. "Sıralama A" sütununda, "A Tarihi"ndeki gözlemleri artan şekilde sıralayacağız. "1" sütundaki en düşük değer ve n (toplam gözlem sayısı) "Tarih" sütunundaki en yüksek değer ". Örneğimizde:
3. Şimdi "Veri B" sütunundaki gözlemleri kullanarak "Sıralama B" sütununu elde etmek için aynısını yapıyoruz:
4. “d” sütununda iki Sıralama (A - B) arasındaki farkı koyarız. Burada sinyal önemli değil.
5. "d" sütunundaki değerlerin her birinin karesini alın ve d² sütununa kaydedin:
6. "d²" sütunundaki tüm verileri toplayın. Bu değer Σd²'dir. Örneğimizde Σd² = 0+1+0+1 = 2
7. Şimdi Spearman'ın formülünü kullanıyoruz:
Bizim durumumuzda, veri hatlarının sayısına (gözlem sayısına karşılık gelen) baktığımızda n, 4'e eşittir.
8. Son olarak, önceki formüldeki verileri değiştirdik:
doğrusal regresyon
Doğrusal regresyon, diğer değişkenlerin (x) değerleri bilindiğinde bir değişkenin (y) olası değerini tahmin etmek için kullanılan bir formüldür. "x" değeri bağımsız veya açıklayıcı değişkendir ve "y" bağımlı değişken veya yanıttır.
Doğrusal regresyon, "y" değerinin "x" değişkeninin bir fonksiyonu olarak nasıl değişebileceğini görmek için kullanılır. Varyans kontrol değerlerini içeren çizgiye lineer regresyon çizgisi denir.
Açıklayıcı değişken "x" tek bir değere sahipse, regresyon çağrılır. basit doğrusal regresyon.