
KORELASYON
Bundan
önceki bölümlerde tek bir değişken üzerinde yapılan gözlemlerden elde ettiğimiz
verileri anlamlı hale getirmede yaralanabileceğimiz bazı tekniklerden söz
etmiştik. Bu bölümde ise, iki ayrı değişkeni birlikte ele alacak ve bunların
birlikte değişimini inceleyerek bu konuda yararlı olabilecek bazı tekniklerden
söz edeceğiz.
Gerek günlük yaşamımız süresince,gerekse bilimsel incelemelerde karşılaştığımız sorunların birçoğu iki ya da daha çok değişken arasında bir ilişki olup olmadığının saptanması ile ilgilidir. Örneğin; insanların boy uzunlukları ile ağırlıkları arasında bir ilişki var mıdır? Zeka düzeyi ile okul başarısı arasında bir ilişki var mıdır? Madenlerin sertlik dereceleri ile özgül ağırlıkları arasında bir ilişki var mıdır? Beslenme koşulları ile hastalıklara yakalanmama arasında bir ilişki var mıdır? Cinsiyet ile sigara içip içmemek arasında bir ilişki var mıdır? Bu gibi sorunlar, hem günlük yaşamımızda birçoğumuzu meşgul eder hem de birçok bilimsel araştırmanın konusu olmaktadır.
Değişkenler
arasındaki ilişkiyi saptamak genellikle iki tür sorun için gerekli olabilir.
Bunlardan birisi bir değişkene ilişkin bilgi yada ölçümlerden öteki, değişken
üzerindeki ölçümü ne derece doğrulukla tahmin edebildiğimizle,
kestirebildiğimizle ya da yordayabileceğimizle
ilgilidir. Bu durumda bu tür davranış ya da niteliği başka tür davranışlar ya
da niteliklerden tahmin etmek ya da yordamak söz
konusudur. İkincisi ise, değişkenler üzerinde gözlenen farklılıkların ne
dereceye kadar belirleyici bazı etmenlere bağlanabileceği ile ilgilidir. Bu
durumda, bireyleri ya da elementelri değişken
üzerinde farklı yapan etmenleri saptama ve anlamaya çalışma söz konusu olur.
Yukarıda belirtilen iki tür sorundan birincisi genellikle uygulamada karşılaşılan türdendir. Örneğin, üniversite giriş sınavında aldığı puanı bilinen bir kişinin üniversite düzeyinde gösterebileceği başarıyı ne derece doğrulukla yordamak mümkündür? Eğer giriş sınavında alınan puanlar ile üniversitede gösterilen başarı arasında yüksek derecede bir ilişki varsa bir kişinin puanından üniversitedeki başarısını “yeter” sayılabilecek doğruluk derecesinde yordamak mümkündür. İkinci tür sorun ise daha çok kurumsal çalışmalarla ilgilidir. Örneğin zekanın ölçülmesinde dil ve sayı nitelikleri ile bellek ve genel genel bilgi gibi yeterliklerin rolü ve bunların zekayı etkileme derecesini saptama çalışmaları.
Değişkenler
Arasındaki İlişki Miktarının Ölçüsü:
Korelasyon Katsayısı:
Değişkenler arasındaki ilişkiyi incelemede korelasyon olarak bilinen yöntem büyük önem taşır. Çünkü, korelasyon teknikleri gelişinceye kadar bilim adamları değişkenler arasındaki ilişkiyi bugünkü seviyede inceleme olanaklarına sahip değillerdi.
Korelasyon, iki, bazen de daha çok sayıda değişken arasındaki ilişkiyi gösterir. ilişkinin miktarı bir sayı ile belirtilir. Bu sayıya korelasyon katsayısı ya da ilişki katsayısı denir. Gerek bilimsel çalışmalarımızda gerekse günlük sorunlarla uğraşırken “İki ya da daha fazla değişken arasında ilişki vardır.” demenin ötesinde söz konusu ilişkiyi en iyi açıklayacak matematiksel eşitliği de bulmak isteriz. Değişkenler arasındaki ilişkiyi saptamak, aslında bu ilişkiyi gösteren matematiksel eşitliği saptamaktır. Söz konusu matematiksel eşitlik saptanırken kural olarak, bağımsız değişkene bağlı olarak bağımlı değişken üzerindeki ortalama değişmeyi gösteren eşitlik aranır. İlişkiyi gösterecek eşitliği önemi değişkenin durumuna, sayısına ve aralarındaki ilişkinin biçimine bağlıdır.
Değişkenler arasındaki ilişki değişik biçimlerde olabilir. Eğer ilişkiyi birinci dereceden bir matematiksel eşitlikle göstermek olanağı varsa ilişki doğrusaldır denir. Değişkenler arasındaki ilişkiyi birinci dereceden bir matematiksel eşitlikle gösterme olanağı yoksa , bu durumda ilişki doğrusal değildir denir ya da doğrusal olmayan ilişki vardır denir. İlişkinin doğrusal olmadığı durumlarda durumu yeterince belirleyebilmek için birinci dereceden bir matematiksel eşitlik yeterli olmayacağından daha üst düzeyde eşitliklere ihtiyaç vardır. Şekil 1 ve sekil 2 deki durumları inceleyelim:
![]()
![]()
Şekil 1
Şekil 2
![]()
![]()

Şekil1
de değişkenlerden biri üzerinde azalıp çoğalma olduğunda öteki değişken
üzerinde e bir miktar azalıp çoğalma görülmektedir. Noktaların oluşturduğu
dağılımın uygun bir yerinden geçecek bir doğru ile X ve Y arasındaki ilişkiyi
yeterince betimleme olanağı vardır. Şekil 2 de ise biri üzerinde bir yönde
değişme olunca erken yaşlarda öteki
değişken üzerinde de aynı yönde, yaş ilerledikçe de ters yönde bir değişme
olmaktadır. Yani yaş ilerledikçe önceleri kelime ezberleme yeteneğinde bir
artma belirli yaştan sonra önce duraklama sonra da azalma olmaktadır. Bu
durumda, noktaların oluşturduğu dağılımı ve bunun gösterdiği ilişkiyi bir doğru
yerine bir eğri ile betimlemek daha uygun düşmektedir. Eğrinin matematiksel
eşitliği de birinci dereceden olmayacaktır. Buna göre Şekil2 deki durum ve buna
benzeyen durumlarda X ve Y değişkenleri arasındaki ilişki doğrusaldır denir.
Çünkü ilişkiyi göstermek için birinci derecede bir matematiksel eşitlik yeterli
olmaktadır. Şekil 2 ve buna benzer durumlar için de X ve Y değişkenleri
arasında doğrusal olmayan bir ilişki vardır denir. Çünkü ilişkiyi göstermek
için grafiği bir doğruyu göstermeyen bir matematiksel eşitlik ancak yeterli
olmaktadır. O halde değişkenler arasındaki ilişkiyi saptarken ilişkinin
biçimine (doğrusal olup olmayışına) göre farklı eşitlikler kullanıp farklı
işlemler yapmamız gerekir. Farklı işlemlerle çoğu kez farklı sonuçlar elde
edileceğinden istatistikte tek tip korelasyon katsayısı yerine her biri
birbirinden farklı matematiksel eşitlikler gerektiren değişik korelasyon
katsayılarından söz edilir. Bu amaç için de farklı korelasyon teknikleri
geliştirilmiştir.
Değişkenler arasındaki ilişkiyi saptarken kullanacağımız teknik, ilişkinin biçimine göre değiştiği gibi, aralarında ilişki bulunacak değişken sayısına ve ayrıca değişkenlerin sürekli ya da süreksiz oluşlarına göre de değişir. İki değişken arasındaki ilişkiyi saptamada kullanılan korelasyon tekniklerine basit korelasyon teknikleri denir. Öte yandan aralarında ilişki aranacak değişken sayısı üç ya da daha çoksa bu durumda kullanılabilecek tekniklere çoklu ya da bileşik ve duruma göre kısmi korelasyon teknikleri denir.
Değişkenler arasındaki ilişki miktarını saptamada kullanılacak tekniğin, doğru olarak seçilmesi gerekir. Aksi halde koşullara uymayan bir teknikle saptanacak ilişki miktarı yanıltıcı olur. Böyle ölçülere dayanarak verilen kararlar da hatalı olacaktır. Bu bakımdan ilişki miktarını saptamadan önce üzerinde gözlem yapılan değişken sayısının, değişkenlerin durumlarının ( sürekli yapay ya da gerçek süreksiz) ve biçimin (doğrusal ya da doğrusal değil) doğru saptanması ve buna göre en uygun tekniğin seçilip uygulanması gerekir. Böyle yapılmadığı takdirde kullanılan istatistiksel teknik bir yardımcı olmaktan çok yanıltıcı olur.
Pearson Momentler Çarpımı Korelasyonu:
İnsanları boy uzunluklarını ve ağırlıklarını ele alırsak boy uzunluğu ve ağırlık birer değişkendir ve bu değişkenlerin ikisi de sürekli değişken tanımına uymaktadır. Bu iki değişken arasındaki ilişkinin doğrusal olduğunu düşünerek şöyle bir soru soralım: belirli bir üniversiteye devam eden öğrencilerin boy uzunlukları ve ağırlıkları arasında bir ilişki var mıdır, varsa bunun miktarı nedir? Bir başka değişle uzun boylu olanlar daha ağır(doğru orantılı) ya da daha hafif(ters orantılı) olma eğilimi gösteriyorlar mı, yoksa boy uzunluğu ile ağırlık arasında doğru ya da ters orantılı bir ilişkiden söz etme olanağı yok mudur? Bu belirtilen koşullara altında ilgili soruları cevaplandırmada yararlanabileceğimiz tekniğe Pearson momentler çarpımı korelasyonu denir. Bu katsayı istatistikte r sembolü ile gösterilir. Bu teknik o kadar çok kullanılır ki korelasyon denince çoğu kez bu tip korelasyon anlaşılır.
Sürekli iki değişken arasındaki doğrusal ilişki miktarını gösteren Pearson momentler çarpımı korelasyon katsayısı +1.00 ile-1.00 arasında değişen değerler alabilir. Değişkenlerin ikisi de aynı yönde değişme gösterirse, aralarındaki ilişki pozitiftir; korelasyon katsayısının işareti de (+) dır. Değişkenlerin biri bir yönde değişirken diğeri ters yönde değişme gösterirse ( biri azalırken diğeri çoğalırsa) bu durumda ilişki negatiftir; korelasyon katsayısının işareti de (-) dir. Değişkenler arasında ne pozitif ne de negatif yönde bir değişme yoksa, bu durumda korelasyon katsayısı sıfırdır. Yani korelasyon katsayısının sıfır oluşu da değişkenler arasında hiçbir ilişki olmadığını gösterir.
Korelasyon katsayıları +1.00 ile –1.00; 0.95 ile –0.95; +0.25 ile –0.25 vb. aynı miktarda ilişki gösterir. Korelasyon katsayıları arasında miktar yönünden bir karşılaştırma yapılırken, katsayıların sayısal değerleri yerine mutlak değerleri dikkate alınır. Mutlak değeri büyük olan katsayı, küçük olandan daha çok ilişki gösterir. Örneğin, r=-0.85 durumundaki ilişki miktarı, r=+0.50 durumundaki ilişki miktarından daha fazladır. Çünkü |-0.85|>|0.50| dir.
Değişkenler arasındaki ilişkiyi göstermenin en uygun yolu, söz konusu ilişki miktarını sayısal olarak belirtmektir. İlişkiyi göstermenin ve anlamanın bir başka yolu da eldeki verileri bir iki yönlü değişim tablosu haline getirmektir. Böyle b,r tablo, özlediğimiz kişilerin her biri için gözlem sonucunu(ölçümü), ili boyutlu geometrik bir düzlem üzerinde gösterir. Tıpkı analitik geometride X ve Y değerlerini dikkate alarak koordinatlar sistemi üzerinde bir P noktasını işaretlediğimiz gibi. Bu nokta ya da işaretlerin gösterdiği dağılımın yönü ve şekli, değişkenler arasındaki ilişkinin miktarı ve işaretiyle ilgilidir. Böyle bir tablo korelasyon katsayısının hesaplanmasında da kullanılabilir. Daha iyi anlayabilmek için bazı örnekler inceleyelim.
Elimizde her biri 15 kişilik beş grup olsun (n=15). Bunların her birine X ve Y ile gösterebileceğimiz bir matematik(X), bir de istatistik (Y) testi verilerek tablo1 den tablo 5 e kadar olan 5 tane tabloda gösterilen sonuçlar elde edilmiş olsun. Tabloların yan tarafında ilgili veriler, yukarıda açıklandığı şekliyle ikili değişim tabloları haline getirilip şekil 1 den 5 e kadar gösterilmiştir.
İki yönlü değişim tablosu üzerindeki noktaların oluşturduğu şekil bir doğruya yaklaştıkça, korelasyon katsayısı +1 ya da –1 ‘e yaklaşır; dağılıp bir daireye yaklaştıkça da düşer ve en yaygın halde sıfır olur. Noktaların oluşturduğu şekil sol alt köşeden sağ üst köşeye doğru uzanıyorsa, korelasyon katsayısının işareti (+), sol üst köşeden sağ alt köşeye uzanıyorsa işareti (-) olur.
|
|
|
|
Test-X |
Test-Y |
|
24 |
26 |
|
25 |
27 |
|
26 |
28 |
|
28 |
30 |
|
29 |
31 |
|
30 |
32 |
|
31 |
33 |
|
32 |
34 |
|
33 |
35 |
|
34 |
36 |
|
35 |
37 |
|
38 |
40 |
|
39 |
41 |
|
40 |
42 |
|
42 |
44 |
Şekil-1 deki
noktalar sol alt köşeden başlayıp, sağ üst köşe yönünde ve bir doğru halinde
uzanıyor. Bu durumda korelasyon katsayısı +1.00 dir.
Çünkü değişken üzerinde artış oldukça diğer değişken üzerinde de mutlaka bir
artış vardır. Bu da ilgili açıklamalarımıza uymakta ve tablo-1 de
görülmektedir.
|
|
|
|
Test-X |
Test-Y |
|
22 |
23 |
|
23 |
25 |
|
25 |
27 |
|
26 |
25 |
|
28 |
29 |
|
30 |
28 |
|
30 |
34 |
|
32 |
30 |
|
32 |
38 |
|
34 |
38 |
|
35 |
34 |
|
35 |
40 |
|
37 |
42 |
|
38 |
38 |
Şekil-2 de sol alt
köşeden sağ üst köşe yönünde yükselen dağılım görülüyor. Ancak bu dağılım bir
doğru biçiminde olma yerine elipse benzemektedir. Bu durumda korelasyon
katsayısı pozitiftir, fakat+1.00 den küçüktür.
|
|
|
|
Test-X |
Test-Y |
|
22 |
38 |
|
23 |
42 |
|
25 |
40 |
|
26 |
34 |
|
26 |
38 |
|
28 |
38 |
|
30 |
30 |
|
30 |
34 |
|
32 |
28 |
|
32 |
29 |
|
34 |
32 |
|
35 |
25 |
|
35 |
27 |
|
37 |
25 |
|
39 |
27 |
Şekil-3 te korelasyon katsayısı negatif ancak -1.00 den büyüktür.
|
|
|
|
Test-X |
Test-Y |
|
23 |
45 |
|
24 |
44 |
|
26 |
42 |
|
27 |
41 |
|
28 |
40 |
|
29 |
39 |
|
31 |
37 |
|
32 |
36 |
|
33 |
35 |
|
34 |
34 |
|
37 |
31 |
|
39 |
29 |
|
41 |
27 |
|
42 |
26 |
|
44 |
24 |

|
Tablo-5 |
|
|
Test-X |
Test-Y |
|
25 |
34 |
|
26 |
29 |
|
26 |
38 |
|
29 |
33 |
|
29 |
43 |
|
33 |
24 |
|
32 |
30 |
|
33 |
39 |
|
34 |
32 |
|
40 |
26 |
|
40 |
34 |
|
40 |
42 |
|
43 |
39 |
|
44 |
30 |
|
44 |
36 |
Şekil-4 te korelasyon katsayısı –1.00, şekil-5 te sıfırdır.
Şekillerin incelenmesinden anlaşılacağı gibi,
noktaların oluşturduğu dağılımın şekli bir elipse yaklaştıkça ve elips
daraldıkça, korelasyon sayısının mutlak değeri artmakta, +1.00 ya da –1.00 a
yaklaşmaktadır. Noktaların dağılımının oluşturduğu dağılımın şekli elipsten
uzaklaşıp daire şekline yaklaştıkça, korelasyon katsayısı sıfıra
yaklaşmaktadır.