Minitab İle Regresyon Analizi

Minitab İle Regresyon Analizi

9 Kasım 2017 0 Yazar: İbrahim AY
1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading...

Giriş

Bu çalışmada Minitab İstatistik Yazılımı ile regresyon modelleri nasıl kurulur ve nasıl yorumlanır gibi temel bilgileri vermeye çalıştım. İçerikte grafik çizimlerini ve yorumlarını işlemedim. Çalışmaları yaparken Graphs… seçeneği olan pencerelerde seçim yaparak artıkların dağılımını ister normal plot üzerinde ister histogram üzerinde görsel olarak görebilir ve ekrana bastırabilirsiniz. İçeriğin faydalı olmasını dilerim.

Uygulamalar yapılırken Minitab 16 yazılımı kullanılmıştır. Veri seti olarak Y.Lisans tezim olan Süper Alaşımların Aşındırıcılı Sujeti İle İşlenebilirliğinin Araştırılması başlıklı çalışmamdaki değişkenler kullanılmıştır.

Veri setimiz şöyle:

Girdiler (Bağımsız değişkenler):
P:Basınç V:İlerleme Hızı m:Aşındırıcı sarfiyatı h:Kesim yüksekliği

Çıktı (Bağımlı değişken): E:Eğim

PVmhE
3006010023,967
3006017533,050
3006025043,273
30010010024,695
30010017534,703
30015010025,425
30015017534,874
30015025043,921
3406010034,042
3406017544,036
3406025022,646
34010010034,855
34010017544,220
34010025023,324
34015010035,147
34015017545,100
34015025023,339
3806010045,035
3806017523,297
3806025032,720
38010010045,331
38010017523,579
38010025033,345
38015010045,871
38015017524,096
38015025033,397

 

Bu dersin sonunda Minitab ile;

-Klasik regresyon analizi yapabilmeniz;
-Dilediğinizde, regresyona etkisiz kabul edilen değişkenleri ihmal ederek regresyon analizi yapabilmeniz;
-Kendi modelinizi kurup bu modele göre regresyon analizi yapabilmeniz ve
-En iyi regresyon modelini bulabilmeniz hedeflenmektedir.

Menüden Stat–>Regression–>Regression adımlarını takip ederek aşağıdaki panomuza ulaşıyoruz. Response kısmına bağımlı değişkenimizi (Eğim); Predictors kısmına da bağımsız değişkenlerimizi (P,V,m,h) atıyoruz.

Regresyon

Regresyon

Regresyon

Regresyon

Daha sonra Storage… menüsünü tıklayarak regresyon denkleminin çıktısını ekrana basmak için

*Fits kutucuğunu;
*Gerçek değer ile regresyon değeri arasındaki farkları ekrana basmak için Residuals kutucuğunu;
*Regresyon sabitlerini ekrana basmak için Coefficients kutucuğunu işaretliyoruz.

Bu seçimleri yaparak işlemi tamamladığımızda minitab tablosuna regresyon çıktısı, artıklar(residuals) ve regresyon sabitleri olmak üzere 3 sütun daha eklenmiş olacaktır. Eğer bunları ekrana basmak istemezseniz bu işlemi es geçin.

OK ve OK diyerek işlem sonucunu alıyoruz.

Regresyon Storage

Regresyon Storage

Session sayfamızda ise aşağıda görüldüğü gibi analiz sonuçlarımızı almış olmaktayız.

Regression Session

Regression Session

Çıktımızda “The regression equation is” başlığı altında regresyon denklemimiz verilmiş oluyor. Bizim sonucumuz şöyle:

Eğim = 4,28 – 0,00121 P + 0,0111 V – 0,0109 m + 0,336 h

Denklemimizde basınç (P) ve aşındırıcı sayfiyatı (m) negatif çarpanlı olduğuna göre bu iki değer arttıkça eğimin azaldığı, diğerleri arttığında ise eğimin arttığı yorumunu yapabiliriz.

Denklemden sonra bulunan katsayıların verildiği aşağıdaki tabloda bulunan P sütunudaki değerler, değişkenin istatiksel olarak anlamlı olup olmadığını anlamamıza yaramakta. Varyans analizlerinde de aynı yorum geçerli.

PredictorCoefSE CoefTP
Constant4,27900,67116,380,000
P-0,0012120,001792-0,680,506
V0,0110960,0015387,220,000
m-0,01093870,0009559-11,440,000
h0,336380,071704,690,000

P değeri 0,05’ten küçük ise değişkenimiz istatistiksel olarak anlamlı bir değişkendir, aksi durumda etkisiz olduğu kanaatine varabiliriz. Hipotezlerimizde anlamlılık için %95’i yeterli görmeyip %99 anlamlılık istersek 0,05 yerine 0,01 değerine göre yorum yapmamız gerekir.

Tablomuzda basıncın istatiksel olarak anlamsız olduğu kanaatine varıyoruz.

P (basınç)–>P (0,506)>0,05

Daha sonra ki satırımızda Rkare ve düzeltilmiş Rkare değerlerimiz veriliyor.

S = 0,294091   R-Sq = 91,0%   R-Sq(adj) = 89,3%

Regresyon denklemimiz deneyin %91’ini açıklıyor. Düzeltilmiş Rkare değerimiz %89’dur ve Rkareden çokta uzak değildir. Bu nedenle denklemimizin sağlıklı olduğunu söyleyebiliriz. Bazen Rkare yüksek olur ama düzeltilmiş Rkare çok düşüktür. O denklem sakat bir denklemdir, aklınızda olsun.

Daha sonra regresyon denklemine ait varyans analizi de veriliyor. P değeri 0,05’ten küçük ve dolayısıyla istatiksel olarak anlamlı bir denklemimiz var.

Analysis of Variance
SourceDFSSMSFP
Regression418,46844,617153,380,000
Residual Error211,81630,0865
Total2520,2847

Devamında “Unusual Observations” başlığı altında deney seti içinde olağandışı görülen deney satırlarına ait değerler verilmektedir. O satırları ister silin, ister deneyi yenileyin, isterseniz doğal karşılayın. Bana kalırsa doğal karşılayın. Zira o satırları silseniz başka değerleri olağandışı görmesi yüksek olasıdır. Deneyi yenilemek her zaman mümkün olmayabilir, mümkün olsa da sonuç muhtemelen değişmeyecektir. Bilginiz olsun yeter diye düşünüyorum.

Obs    P    Eğim     Fit      SE Fit  Residual  St Resid
2  300  3,0500  3,6759  0,1160   -0,6259     -2,32R
5  300  4,7030  4,1198  0,0947    0,5832      2,09R

Bu kısımda regresyon modelimizi kendi istediğimiz formatta nasıl kurarız onu göreceğiz.

PVmh bağımsız değişkenlerimizdi. Klasik bir regresyon modeli

S:sabit , a, b, c ve d değerleride değişkenlerin çarpanları olmak üzere şöyle idi:

Eğim=S+aP+bV+cm+dh

Diyelim ki ben şöyle bir modeli regresyon yöntemi ile kurmak istiyorum:

Eğim=P*V+ m*h+V*V

Bu modelde P ile V’nin çarpımını, m ile h nin çarpımıyla ve V’nin karesiyle toplamışız.

Bunun için

Stat–>Regression–>General Regression

adımlarını izledikten sonra General Regression penceresindeki model kısmına P*V+ m*h+V*V  modelini işliyorum. Kopyala yapıştır yapmayın çalışmaz hata alırsınız. Modelde – kullanınca da hata alabilirsiniz, hep + kullanın. Negatifse zaten analizde çıkıyor ve kendi negatif yapıyor. Response kısmında ise bağımlı değişkenimiz, çıktımız olan eğim olacak. OK deyip sonuçları alıyorum.

General Regression

General Regression

General Regression Session

General Regression Session

İşlem sonucunda oluşan model:

Eğim  =  4,54791 – 1,21987e-005 P*V + 7,02361e-005 V*V – 0,00165992 m*h

oldu.

Modelin Rkaresi 37,92 düzeltilmiş Rkaresi 29,46 çıktı.

Varyans analizinde ise PV ile VV çarpanlarının istatiksel olarak anlamsız oldukları görülüyor.

Analysis of Variance
SourceDFSeq SSAdj SSAdj MSFP
Regression37,69247,69242,564124,479740,01338
P*V13,6650,05970,059660,104230,749858
m*h13,30653,54523,545186,193750,020874
V*V10,72080,72080,720771,259240,273893
Error2212,592412,59240,57238
Total2520,2847

Gerek rkare değerlerine, gerek varyans analizine bakınca kurduğumuz modelin başarısız bir model olduğunu ve kimseye göstermememiz gerektiği sonucuna varıyoruz. Uydurma model bu kadar olur zaten. Siz daha güzel modeller kurmak isteyebilir ve kurabilirsiniz. Nasıl yapıldığını öğrendiniz.

Kullanımına kendi çalışmalarımda çok rastlamamakla beraber bahsetmekte yarar gördüğüm bir işlem de şöyle. Eğer herhangi bir veya daha fazla değişkenin her düzeyi için farklı sabitlere sahip regresyon modelleri kurulması istenirse Categorical Predictors kısmına bu değişkenleri eklemek gerekiyor. Tek değişken üzerinden konuşursak, örneğin hız değişkeninin her düzeyi için ayrı regresyon modelimiz olsun isteyebiliriz. Yani v=60 iken başka, v=100 iken başka sabitli regresyon denklemi elde edebiliriz. Veya bu değişken sayımızı 2 veya daha fazla seçersek aralarındaki her bir kombinasyon için ayrı birer denklem elde edebiliriz. Bahsettiğim gibi aslında burada elde ettiğimiz regresyon modellerinde diğer değişkenlerin çarpanları değişmemekte sadece regresyona ait sabit değişmektedir.

Bir örnek yapalım.

Yine Stat–>Regression–>General Regression adımlarını takip edelim. Çıkan pencerede model kısmına bütün değişkenlerimizi doğrudan atalım. Bu şekilde olunca bize klasik bildiğimiz şekildeki regresyon modelini oluşturacaktır. Response yine eğim. Categorical Predictors kısmında V ile h değişkenlerini atayalım ve OK diyelim.

Categorical Predictors

Categorical Predictors

Categorical Predictors Session

Categorical Predictors Session

Sonuçlar alındığında

V    h
60   2  Eğim  =  5,67045 – 0,00153385 P – 0,0107671 m
….
150  3  Eğim  =  6,87811 – 0,00153385 P – 0,0107671 m

şeklinde V ile h değerleri sabit tutularak ayrı ayrı modeller alabiliyoruz.

Şimdiki yapacağımız işlemde en iyi modeli tanımlayan değişkenler belirlenip, modele faydası görülmeyen diğer değişkenler ihmal edilir. İşlemi yapalım ve yorumlayalım.

için Stat–>Regression–> Stepwise adımını izledikten sonra karşımıza gelen Stepwise Regression penceresindeki Response kısmına bağımlı değişkenimiz (çıktı) olan Eğimi, Predictors kısmına da bağımsız değişkenlerimizi (girdileri) ekleyerek OK diyelim ve sonuçlara bakalım.

Stepwise Regression

Stepwise Regression

Stepwise Regression

Stepwise Regression

Stepwise Regression Session

Stepwise Regression Session

Aldığımız sonuçlar şöyle oldu:

Step123
Constant6,0584,9113,881
m-0,01122-0,01125-0,01098
T-Value-5,91-8,63-11,66
P-Value000
V0,01110,0111
T-Value5,297,31
P-Value00
h0,333
T-Value4,72
P-Value0
S0,5870,4030,29
R-Sq59,2481,690,85
R-Sq(adj)57,548089,6
Mallows Cp73,623,13,5

Burada en güçlü değişkenden başlanarak teker teker diğer değişkenler modele dahil edilerek sonuçlar basılmış. Sonuçlarda sadece m,V ve h değişkeni ekrana basılmış ve üçü ile kurulan modelin Rkaresi için 90,85, düzeltilmiş Rkaresi için 89,6 değeri hesaplanmış. Sadece m veya sadece m ve V ile kurulan modellerin hem Rkareler daha küçük hemde Mallows Cp değerleri büyük olduğunu için seçim yapacağımız bir model olmadıkları aşikar. Bu sonuçlar daha önce gördüğümüz Best Subsets çalışmamızdaki 5. satır değerleri ile aynıdır.

Burada ki mVh değişkenleri ile kurulan model şöyle (yukarıdan aşağıya okuyoruz):

Eğim=3,881-0,01098m+0,0111V+0,333h

Sonuçta P değişkenimizin istatiksel olarak modelimize anlamlı bir katkısı olmadığı sonucuna ulaşıyoruz. Buna rağmen burada verdiğim örnekten daha fazla girdisi olupta modele katkısı olmadığı için yoksayılan herhangi bir değişkenimizi modele dahil etmek isteyebiliriz. Mesela A B C D E F G gibi 7 tane bağımsız değişkenimiz varken stepwise uyguladık ve C D ve F değerleri yok sayıldı. Ama ben düşündüm ki C ve D değerlerinden taviz verebilirim ama modelimde muhakkak F değişkeni olmalı dersem ne yapacağım. Şimdi ben çalışmamızdaki verilere göre konuşursam illa ki P değişkenim modele dahil olmalı diyorum. Bunun için

Baştaki gibi Stat–>Regression–> Stepwise adımlarını takip edip Predictors kısmına da bağımsız değişkenlerimi ekledikten sonra “Predictors to include in every model” altına P değişkenimi atayarak OK diyor ve sonuçları alıyorum. Böylece P değişkenim yok edilmeden stepwise işlemini gerçekleştirmiş oluyorum.

Stepwise Regression Every Model

Stepwise Regression Every Model

Aldığımız sonuçlar aşağıdaki gibidir:

Step1234
Constant4,8136,3015,1344,279
P-0,002-0,0007-0,0007-0,0012
T-Value-0,36-0,2-0,27-0,68
P-Value0,7210,8440,7930,506
m-0,0112-0,01123-0,01094
T-Value-5,76-8,42-11,44
P-Value000
V0,01110,0111
T-Value5,187,22
P-Value00
h0,336
T-Value4,69
P-Value0
S0,9170,5990,4110,294
R-Sq0,5459,3181,6691,05
R-Sq(adj)055,7779,1689,34
Mallows Cp211,375,4255

Görüldüğü gibi P değerimiz silinmeden stepwise sonuçlarını aldık. Her ne kadar P değişkeni için verilen P-Value değeri 0,506 gibi 0,05’den büyük bir değer göstererek istatiksel olarak anlamsız bir değişken olarak görülsede Rkareler ve Cp değerimiz fena değil. Dikkat ederseniz regresyon eleme yaparken en güçlü gördüğü m değişkeni ile değil P değişkeni ile elemeya başladı ve P değişkenini ihmal etmeden işlemini sürdürdü.

Bazı makalelerde ve/veya çalışmalarda uzun regresyon modelleri görmüş olabilirsiniz.  Bizim kurduğumuz regresyon modellerinin çoğu lineerdirler, doğrusaldırlar. Bahsettiğim modeller lineer yapılardan fazlasını araştırır ve içerir.

S sabit, a,b,c ve d değerleri çarpanlar olmak üzere oluşturduğumuz klasik regresyon modeli şöyle idi: Eğim=s + aP + bV + cm + dh

Bazen modellerimizi, değişkenlerimizin kareleri üzerine kurmak isteyebiliriz. Rahat anlatmak için çarpanları yazmıyorum:

Eğim=P*P + V*V + m*m + h*h gibi.

Veya birbirleri ile etkileşimleri şeklinde de model kurmak isteyebiliriz (yine çarpanları yazmadan):

Eğim=P*V + P*m + P*h + V*m+V*h+m*h gibi.

Veya bunların birleşimi veya kombinasyonu şeklinde.

Bu tip işlemleri Generel Regresyon ile model kurarken anlattığım şekilde kendi kuracağımız bir model ile hesap edebilirdik. Ancak bu işlemleri daha sağlıklı yapmak için Yüzey Modellemesini (Response Surface) kullanacağız. Başlayalım.

Stat–>DOE–>Response Surface–>Analyze Response Surface Design

Response Surface

Response Surface

Bu seçimi yaptığımızda bize aşağıdaki gibi bir uyarı gelecektir. Çünkü yüzey modellemesi için faktörleri tanıtmamız gerekmekte.  Evet diyerek devam edelim.

Response Surface Alert

Response Surface Alert

Onay verdikten sonra aşağıdaki gibi faktörleri tanıtmamızı isteyen pencere gelecektir. Factors kutucuğuna bağımsız değişkenlerimizi attıktan sonra Low/High düğmesine basıyoruz. Burada değişkenlerimizin en büyük ve en küçük değerleri görülüyor ve aşağıda da Uncoded seçili geliyor. Her hangi bir şey yapmadan OK ve OK diyoruz.

Response Surface Factors

Response Surface Factors

Response Surface Low-High

Response Surface Low-High

Karşımıza bağımlı değişkenlerimizi tanıtmamızı isteyen pencere geliyor. Burada responses kısmına bağımlı değişkenimizi (çıktımızı) atıyoruz, aşağıdan da Uncoded Units’i seçiyoruz  ve Terms’e tıklıyoruz.

Response Surface Responses

Response Surface Responses

Terms penceresinde kurulacak modelin hangi yapıda olacağını soruyor. Sağdaki kutu kullanılacak modele ait faktör yapıları gösteriliyor. Buradaki faktörlere ekleme veya çıkarma yapma özgürlüğüne sahipsiniz. Pencerenin üstünde açılır menü şeklinde 4 temel yapı sunuluyor.

1-Linear
2- Linear+Squares
3-Linear+Interactions
4-Full Quadratic

Response Surface Linear

Response Surface Linear

Response Surface Linear+Squares

Response Surface Linear+Squares

Response Surface Linear+Interactions

Response Surface Linear+Interactions

Response Surface Full-Quadratic

Response Surface Full-Quadratic

Bunlardan dilediğinizi seçebilirsiniz. Eğer sadece Linear model seçerseniz daha önce kurduğumuz klasik regresyon modelimiz oluşur. Sağ ve soldaki faktör listelerinde, faktörlere çift tıklayarak ekleme çıkarma yapabilirsiniz. Full Quadratic model için Ok ve Ok diyerek sonuçları alalım.

Response Surface Session 1

Response Surface Session 1

Response Surface Session 2

Response Surface Session 2

Oluşan model tablomuz şöyle:

TermCoefSE CoefTP
Constant7,09258,380930,8460,414
P-0,025320,0466-0,5430,597
V0,063240,019633,2220,007
m0,017580,018310,960,356
h-2,220441,16613-1,9040,081
P*P0,000030,000070,4570,656
V*V-0,000090,00006-1,6380,127
m*m-0,000020,00002-0,90,386
h*h0,074960,124360,6030,558
P*V-0,000070,00004-1,7190,111
P*m-0,000050,00004-1,1460,274
P*h0,006210,003211,9310,077
V*m-0,000040,00002-1,5750,141
V*h-0,000670,00167-0,3990,697

Bunu formüle dökersek;

Eğim= 7,0925-0,02532*P+0,06324*V+0,01758*m-2,22044*h+0,00003*P*P-0,00009*V*V-0,00002*m*m+0,07496*h*h-0,00007*P*V-0,00005*P*m+0,00621*P*h-0,00004*V*m-0,00067*V*h

Denklemini elde etmiş oluruz. Modelin Rkare değeri  95,98 olup düzeltilmiş Rkare değeri 91,62’dir.

Benden bu kadar.

İyi dersler.

Not: Herhangi bir hata görürseniz lütfen uyarınız. İletişim

İçindekiler