Veri Dönüştürme

Logaritmik dönüşüm, z = log y

Logaritmik dönüşüm, z = log y

Logaritmik dönüşümü 10 tabanına (log10 veya log diye ifade edilir) veya e tabanına (loge veya ln olarak ifade edilir) göre yapabiliriz. Negatif sayıların ve sıfırın logaritmasını alamayacağımıza dikkat ediniz. Logaritmanın geri dönüşümüne ise antilog denir. Örn. 100’ün logaritmasını alacak olursak;

log10 (100) = 2
Antilog (2) = 102 = 100

  • y sağa eğimli olduğunda “z = log y” genelde yaklaşık olarak normal dağılıma sahip olur. Bu durumda y’nin lognormal dağılıma sahip olduğundan bahsederiz.
  • y ile x değişkeni arasında üstsel bir ilişki olduğunda yatay eksende x, dikey eksende y olacak şekilde grafik çizildiğinde yukarıya doğru eğimli bir grafik oluşuyorsa “z = log y” ile x arasında lineer bir ilişki olur.
  • Farklı gruplarda sürekli bir değişken olan y’yi (örn. boy) ölçtüğümüzü varsayalım. y büyük olan gruplarda varyans da büyük olacaktır. Özellikle varyans katsayısının (standart sapma / ortalama) gruplar arasında eşit olması halinde “z = log y” değişkeni için varyanslar eşit olacaktır.

Yorumlanmasının kolay olması ve verilerin genelde sağa eğimli olması nedeniyle tıpta log dönüşümü sıklıkla kullanılır.

Örn.:

İleride göreceğimiz gibi, normal dağılıma uygunluk birçok parametrik hipotez testi için önemli bir varsayımdır. www.aile.net/agep/istat/08_09/diyabet.sav veri setinde “Weight” değişkenini incelediğimizde histogram grafiğinde çan eğrisinin kuyruğunun sağa doğru olduğunu (sağa eğimli) görürüz:

Wieght değişkeninin normal dağılmadığını Kolmogorov Smirnov veya Skewness analizleri ile de gösterebiliriz:

Analyze > Descriptive statistics > Frequencies [“Weight” değişkenini Variables kısmına geçirin, Statistics butonunu tıklayıp Skewness kutucuğunu seçiniz] > Continue > OK. Aşağıdaki çıktı oluşacaktır:

Statistics
N Valid 424
Missing 6
Skewness 1,329
Std. Error of Skewness ,119

Skewness değeri (1,329) Standart sapmasının (0,119) iki katından büyük ve pozitif olduğundan verimizin sağa doğru eğimli olduğunu söyleyebiliriz.

Analyze > Nonparametric Tests > 1- Sample K-S [“Weight” değişkenini Variables kısmına geçirin] > Continue > OK. Aşağıdaki çıktı oluşacaktır:

One-Sample Kolmogorov-Smirnov Test
Weight
N 424
Normal Parameters(a,b) Mean 74,266
Std. Deviation 15,1381
Most Extreme Differences Absolute ,094
Positive ,094
Negative -,045
Kolmogorov-Smirnov Z 1,926
Asymp. Sig. (2-tailed) ,001
a Test distribution is Normal.
b Calculated from data

Asymp. Sig. (2-tailed) (0,001) 0,05’ten küçük olduğundan verimizin normal dağılmadığı sonucuna varırız.

Şimdi “weight” değişkeninin logaritmasını alarak yeni bir değişken oluşturalım:

Transform>Compute variable>[“Target Variable” alanına “LogWeight”, “Numeric Expression” alanına ise “LG10(weight)” yazalım]>OK

SPSS veri setimizde “LogWeight” adında yeni bir değişken oluşacaktır. Şimdi bu değişkenin histogram grafiğine bakalım:

Graphs>Interactive>Histogram [X eksenine “LogWeight” değişkenini sürükleyelim. Üstteki “Histogram” sekmesini tıklayıp “Normal curve” kutucuğunu işaretleyelim]>OK

Aşağıdaki grafiği elde ederiz:

Histogram

Görüldüğü gibi çan eğrisi simetrik hale gelmiştir.

Yeni değişkenimizin Skewness değerine baktığımızda:

Statistics
LogWeight
N Valid 424
Missing 6
Skewness ,248
Std. Error of Skewness ,11

Standart sapmasının iki katına yakındır.

Kolmogorov Smirnov ile bakıldığında ise:

One-Sample Kolmogorov-Smirnov Test
lgweight
N 424
Normal Parameters(a,b) Mean 1,86
Std. Deviation ,084
Most Extreme Differences Absolute ,053
Positive ,053
Negative -,038
Kolmogorov-Smirnov Z 1,091
Asymp. Sig. (2-tailed) ,185
a Test distribution is Normal.
b Calculated from dat

p değerinin (0,185) 0,05’ten büyük olduğunu, yani normal dağıldığını görüyoruz.

Bu arada, istatistik hesaplarımızda ve makalelerimizde normal dağılımı kontrol etmemiz ve sonuçlarını bildirmemiz gerektiğini, ancak parametrik testlerin çoğunun da (ileride görüleceği gibi) normallikten hafif sapmalara karşı toleranslı olduğunu belirtmeliyiz.

Number of children değişkeninin cinsiyetle karşılaştırması buraya eklenecek. Varyanslar homojen değil. Log dönüşümle düzeliyor..

You may also like...

Bir yanıt yazın