Regresyon Analizi

21 Mayıs 2010 0 Yazar: İbrahim AY
1 Star2 Stars3 Stars4 Stars5 Stars (Oy verilmemiş. İlk oy veren olur musun?)
Loading...

Giriş

Regresyon Analizi</

Regresyon analizi birçok yazılım ile rahatça çözülebilmektedir. Bu makalede, çok değişkenli regresyon analizinde ki katsayıların, sayısal olarak hesaplanması anlatılmıştır. Ders sonunda (eğer hiç işiniz gücünüz yoksa) hesap makinesini elinize alıp regresyon analizi yapabilmenizi hedefliyorum “,

Regresyon analizi bağımsız değişkenlerin bağımlı değişken üzerindeki etkilerini incelememizi sağlayan analiz yöntemlerinden biridir. Regresyonda x bağımsız ve y bağımlı değişken olmak üzere; [ y = a0 + a1x1 + a2x2 + a3x3 + a4x4 + amxm + hata ] şeklindeki denklemi oluşturmak için gerekli olan sabitler (a0,a1,a2,am) bulunur. Elde edilen denklem, bilmediğimiz bağımsız değişkenler ile elde edilecek bağımlı değişkeni de tahmin etmemizi sağlar. Denklemde, sabitlerin aldıkları değerlerin büyüklükleri ve işaretleri, bağımsız değişkenlerin bağımlı değişken üzerindeki etkilerini gösterir.

Regresyonu eğri uydurma işlemi olarakta ifade edebiliriz. Regresyon denklemi, x’e bağımlı y değişkenimiz ile oluşturulan eğriye yakın bir eğri verir. Regresyon analizindeki denklem sabitlerinin belirlenmesi, en küçük kareler yönteminin bir sonucudur.

Aşağıda bir veri setinin örnek görünümü verilmiştir. Burada n deney numarası, y bağımlı değişken, x’ler ise bağımsız değişkenlerdir. Burada m bağımsız değişken sayısını ifade eder.

Nryx1x2x3x4xm
1y1x11x21x31x41xm1
2y2x12x22x32x42xm2
3y3x13x23x33x43xm3
n-1y(n-1)x1(n-1)x2(n-1)x3(n-1)x4(n-1)xm(n-1)
nynx1nx2nx3nx4nxmn

Deney setimizde 1 bağımlı değişken y ve m adet bağımsız değişken x vardır. Regresyona başlarken m+1 satırlı matris oluşturulur. Bu matris bize m+1 tane denklem sunar. Bu denklemler yardımı ile sabitler bulunur ve

y = a0 + a1x1 + a2x2 + a3x3 + a4x4 + amxm

şeklinde denklem elde edilir. Burada a0,a1,a2,a3,am regresyon analizi ile bulacağımız sabitlerdir.

Matrisin Kurulumu

Kurulacak matris düzeni şu şekildedir:

n∑x1∑x2∑x3∑x4∑xmao∑y
∑x1∑(x12)∑(x1*x2)∑(x1*x3)∑(x1*x4)∑(x1*xm)a1∑(x1*y)
∑x2∑(x2*x1)∑(x22)∑(x2*x3)∑(x2*x4)∑(x2*xm)a2∑(x2*y)
∑x3∑(x3*x1)∑(x3*x2)∑(x32)∑(x3*x4)∑(x3*xm))a3∑(x3*y)
∑x4∑(x4*x1)∑(x4*x2)∑(x4*x3)∑(x42)∑(x4*xm)a4∑(x4*y)
∑xm∑(xm*x1)∑(xm*x2)∑(xm*x3)∑(xm*x4)∑(xm2)am∑(xm*y)

Matrisimizin satır sayısı değişken sayımıza bağlıdır. Burada kullandığım xm için m ifadesi, değişken sayısını ifade etmektedir. Eğer değişken sayısınız 5 ise m yerinde 5 vardır, 8 ise matrise 3 satır ve 3 sütun daha eklenir. Matrisin kurulumunu çözerseniz matris kendiliğinden oluşur.

Matrisin 1. satırın ilk sütununa veri sayısı (n) yazılır. Sonraki sütunlara değişkenlerin toplamları sırasıyla yazılır.

Örneğin ∑x1 = x11 + x12 + x13 + x14 + x1m ‘dir.

Sonraki sütuna ilk sabitimizi ifade eden a0 yazılır. Son sütunumuza ise bağımlı değişkenin toplamı yazılır.

Yani ∑y = y1 + y2 + y3 + y4 + ym ‘dir.

İlk satırımız bu şekilde basitçe oluşturulabilmektedir.

İkinci ve diğer satırlar biraz daha uzun işlem gerektirir. İkinci satırın ilk sütununa birinci değişkenimizin toplamı yazılır. Yani ∑x1 = x11 + x12 + x13 + x14 + x1m (Birinci satır ikinci sütundaki aynı değer)

İkinci sütunda  ∑x12 = x112 + x122 + x132 + x1(n-1)2 + x1n2 ‘dir. Yani verilerimizdeki ilgili değişkenin karelerinin toplamıdır. (Dikkat; toplamının karesi değil, karelerinin toplamı)

Üçüncü sütunda  ∑(x1*x2) = (x11*x21) + (x12*x22) + (x13*x23) + (x1(n-1)*x2(n-1)) + (x1n*x2n)’dir.

Dördüncü ve diğer sütunlarda aynı şekildedir. Son sütunda  ∑(x1*y) =  (x11*y1) + (x12*y2) + (x13*y3) + (x1(n-1)*y(n-1)) + (x1n*yn)’dir.

Bu arada  ∑(x1*x2) = ∑(x2*x1) vb. olduğunu hatırlayınız ki alt satıra geçtiğinizde bir daha hesap yapmak ile uğraşmayın.

Diğer satırlarda bu şekilde doldurularak matris bitirilir. Sıra denklemleri yazmaya geldi.

Matris Denklemlerinin Yazılışı

Matris k satırlı ise ile elde edilen denklemde k tanedir.  Yukarıdaki anlatıma göre denklemlerimiz şu şekildedir;

∑y = n*a0 +  ∑x1*a1 +  ∑x2*a2 +  ∑x3*a3 +  ∑x4*a4 +  ∑xm*am

∑(x1*y) = ∑x1*a0 + ∑x12*a1 + ∑(x1*x2)*a2 + ∑(x1*x3)*a3 + ∑(x1*x4)*a4 + ∑(x1*xm)*am

∑(x2*y) = ∑x2*a0 + ∑(x2*x1)*a1 + ∑x22*a2 + ∑(x2*x3)*a3 + ∑(x2*x4)*a4 + ∑(x2*xm)*am

∑(x3*y) = ∑x3*a0 + ∑(x3*x1)*a1 + ∑(x3*x2)*a2 + ∑x32*a3 + ∑(x3*x4)*a4 + ∑(x3*xm)*am

∑(x4*y) = ∑x4*a0 + ∑(x4*x1)*a1 + ∑(x4*x2)*a2 + ∑(x4*x3)*a3 + ∑x42*a4 + ∑(x4*xm)*am

∑(xm*y) = ∑xm*a0 + ∑(xm*x1)*a1 + ∑(xm*x2)*a2 + ∑(xm*x3)*a3 + ∑(xm*x4)*a4+ ∑xm2*am

Denklemler bu şekilde yazıldıktan sonra bilinmeyen sabitler bulunur.  Bulduğumuz sabitler ile denklemimiz elde edilmiş olur.

y = a0 + a1x1 + a2x2 + a3x3 + a4x4 + amxm

Anlatımı mümkün olduğunca basitleştirmeye çalıştım ama örnek yapmadan olmayacak “,

Örnek:

Regresyondaki matris kurulumu ve denklemlerin elde edilişini kavrayabilmek için basit bir dizi ile örnek vereceğim.

Aşağıdaki veri seti ile regresyon için denklem kuralım.

yx1x2
-1,49436
49,91892
19,9021-4
24,7152
-6,802

Matrisimizi kuralım

n∑x1∑x2ao∑y
∑x1∑(x12)∑(x1*x2)a1∑(x1*y)
∑x2∑(x2*x1)∑(x22)a2∑(x2*y)

53+9+1+5+06+2-4+2+2ao-1,494+49,918+19,902+24,71-6,8
3+9+1+5+032+92+12+52+023*6 + 9*2 + 1*-4 + 5*2 + 0*2a13*-1,494 + 9*49,918 + 1*19,902 + 5*24,71 – 0*6,8
6+2-4+2+23*6 + 9*2 + 1*-4 + 5*2 + 0*262+22+(-4)2+22+22a26*-1,494 + 2*49,918 – 4*19,902 + 2*24,71 – 2*6,8

5188ao86,236
1811642a1588,232
84264a247,084

Matris denklemlerimizi yazalım.

5*ao+18*a1+8*a2 = 86,236

18*ao+116*a1+42*a2 = 588,232

8*ao+42*a1+64*a2 = 47,084

3 Bilinmeyenli 3 denklemi çözersiniz artık.

Denklemi çözdüğümüzde regresyonu tamamlamış oluruz.

ao=0

a1=6,302

a2=-3,4

y = 6,302*x1 – 3,4*x2

Denklemi kısaca yorumlarsak bağımlı değişkenimiz x1 ile doğru x2 ile ters orantılıdır. Mesela y’yi arttırmak istediğimizde ya x1 arttırılmalı ya da x2 azaltılmalıdır.

Sonuçları karşılaştıralım

yx1x2Regresyon
-1,49436-1,494
49,9189249,918
19,9021-419,902
24,715224,71
-6,802-6,8

Regresyon ile veriler yukarıda ki gibi %100 doğru çıkmaz. Benim veri setim belli bir denkleme aitti ve regresyon aynı denklemi verdi. Bu yöntem daha çok belli bir denkleme tabi olmayan deneysel veya istatistiksel verilerde kullanılır ve gerçek değer ile regresyon sonucu arasındaki farklar çoğunlukla kabul edilebilir.

İçindekiler