##Bölüm 6

##Çoklu Regresyon Analizi : İleri Konular

Bu bölümde çoklu regresyon analizinin geniş çaptaki uygulamalı problemlerle yapılması önemlidir.

6.1 Veri Ölçeğinin SEKK İstatistiklerine Etkileri:

Çocuk doğum ağırlığını sigara kullanımı ve aile geliriyle ilişkilendiren bir denklemle başlayalım :

\[ \hat(bwght)=\hat{\beta}_0+\hat{beta}_1\cdot cigs+\hat{\beta}_2 faminc. \]

Burada; bwght= Çocuk doğum ağırlığı,ons cinsinden cgs= Hamilelik süresince anne tarafından içilen günlük sigara sayısı faminc = Ailenin yıllık geliri, bin dolardır.

library (wooldridge)
data("bwght")
library(rmarkdown)
paged_table(bwght)

Bu denklemin BWGHT.RAW veri seti kullanılarak elde edilen tahmini tablo 6.1’in ilk stünunda verilmiştir.Parantez içinde verilen değerler standart hatalardır. “cigs” değişkeninin tahmin edilen değeri bize bir kadının günde 5 sigara daha fazla içmesi durumunda çocuk doğum ağırlığının 0.4634(5)=2,317 ons daha az olacağının öngörüldüğünü söylemektedir. cigs değişkenine ait t istatistiği -5.06 olup değişken istatiksel olarak oldukça anlamlıdır.

 lm(bwght~cigs + faminc, data = bwght)
## 
## Call:
## lm(formula = bwght ~ cigs + faminc, data = bwght)
## 
## Coefficients:
## (Intercept)         cigs       faminc  
##   116.97413     -0.46341      0.09276
lm(bwght$bwght~ bwght$cigs + bwght$faminc)
## 
## Call:
## lm(formula = bwght$bwght ~ bwght$cigs + bwght$faminc)
## 
## Coefficients:
##  (Intercept)    bwght$cigs  bwght$faminc  
##    116.97413      -0.46341       0.09276

Ons cinsinden olan bwght değişkenini pounda çevirmeliyiz. Bir ons,Bir poundun onaltıda biri olduğunu buluruz.

bwght$bwghtlbs <- bwght$bwght/ 16
lm(bwght$bwghtlbs ~ bwght$cigs + bwght$faminc)
## 
## Call:
## lm(formula = bwght$bwghtlbs ~ bwght$cigs + bwght$faminc)
## 
## Coefficients:
##  (Intercept)    bwght$cigs  bwght$faminc  
##     7.310883     -0.028963      0.005798
lm(I(bwght/16)~ cigs + faminc, data=bwght)
## 
## Call:
## lm(formula = I(bwght/16) ~ cigs + faminc, data = bwght)
## 
## Coefficients:
## (Intercept)         cigs       faminc  
##    7.310883    -0.028963     0.005798
lm(bwght~ I(cigs/20) + faminc, data=bwght)
## 
## Call:
## lm(formula = bwght ~ I(cigs/20) + faminc, data = bwght)
## 
## Coefficients:
## (Intercept)   I(cigs/20)       faminc  
##   116.97413     -9.26815      0.09276
model_1<- lm(bwght~cigs + faminc,data=bwght)
model_2<- lm(I(bwght/16) ~ cigs + faminc,data=bwght)
model_3<- lm(bwght~ I(cigs/20) + faminc,data=bwght) 
library(stargazer)
## 
## Please cite as:
##  Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
##  R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
stargazer(list(model_1,model_2,model_3), type="text")
## 
## =================================================================
##                                        Dependent variable:       
##                                 ---------------------------------
##                                   bwght    I(bwght/16)   bwght   
##                                    (1)         (2)        (3)    
## -----------------------------------------------------------------
## cigs                            -0.463***   -0.029***            
##                                  (0.092)     (0.006)             
##                                                                  
## I(cigs/20)                                             -9.268*** 
##                                                         (1.832)  
##                                                                  
## faminc                           0.093***   0.006***    0.093*** 
##                                  (0.029)     (0.002)    (0.029)  
##                                                                  
## Constant                        116.974***  7.311***   116.974***
##                                  (1.049)     (0.066)    (1.049)  
##                                                                  
## -----------------------------------------------------------------
## Observations                      1,388       1,388      1,388   
## R2                                0.030       0.030      0.030   
## Adjusted R2                       0.028       0.028      0.028   
## Residual Std. Error (df = 1385)   20.063      1.254      20.063  
## F Statistic (df = 2; 1385)      21.274***   21.274***  21.274*** 
## =================================================================
## Note:                                 *p<0.1; **p<0.05; ***p<0.01

Beta Katsayıları:

Örneğin bir değişken,kendi ortalamasından çıkarılıp standart satmasına bölünerek standartlaştırılabilir.

$$ z_y= {ϭ_y}

$$

B6.1 KIELMCR.RAW Veri seti

data("kielmc")
library(rmarkdown)
paged_table(kielmc)
help(kielmc)
## httpd yardım sunucusu başlatılıyor ... tamamlandı

Wooldridge Kaynak: K.A. Kiel ve K.T. McClain (1995), “Yer Belirleme Karar Aşamalarında Ev Fiyatları: Operasyon Yoluyla Söylentilerden Bir Yakma Fırını Örneği,” Çevre Ekonomisi ve Yönetimi Dergisi 28, 241-255. Profesör McClain, yalnızca bir alt kümesini kullandığım verileri nazikçe sağladı. Veriler geç yükleniyor.

kullanım veri(‘kielmc’) Biçim 25 değişken üzerinde 321 gözlem içeren bir data.frame:

yıl: 1978 veya 1981

yaş: evin yaşı

yaşq: yaş^2

nbh: mahalle, 1-6

cbd: dist. sente. otobüs. bölge, ft.

ara: uzak. eyaletler arası, ft.

tiftik: günlük(intst)

fiyat: satış fiyatı

odalar: evde # oda

alan: evin kare görüntüleri

arazi: metrekare arsa

banyolar: # banyo

uzak: uzak. evden incin., ft.

ldist: günlük(dist)

rüzgar: prc. zaman rüzgarı inci. eve

lfiyat: günlük(fiyat)

y81: =1 ise yıl == 1981

larea: günlük(alan)

lland: kütük(arazi)

y81ldist: y81*ldist

lintstsq: tiftik^2

yakın yakın: =1 eğer mesafe <= 15840

y81nrinc: y81*inc yakın

fiyat: fiyat, 1978 dolar

fiyat: log(fiyat)

Sadece 1981 yılı için,KIELMCR.RAW’daki verileri kullanarak,aşağıdaki sorulara cevap veriniz.Veriler 1981’de Kuzey Andover,Massachuatts’te satılan evlerdir.1981 yerel çöp yakma fırınınım kurulmaya başlandığı yıldı.

###(i) Çöp fırının konumunun ev fiyatları üzerindeki etkisini incelemek için şu basit modeli ele alalım :

\[ log(price)=\beta_0 + \beta_1log(dist)+u \] Burada price dolar cinsinden evin fiyatı ve dist,ev ile çöp yakma fırını arasında ki uzaklıktır.Denklemin dikkatli biçimde yorumlanmasında çöp yakma fırınının bulunması ev fiyatını düşürüyorsa \(\beta_1\)’in işaretini ne beklersiniz. Denklemi tahmin edin ve sonuçları yorumlayın.

###(ii)regresyon modeline aşağıda belirtilenleri ekleyelim :

\[ log(price)=\beta_0 +\beta_1log(dist)+\beta_2log(area)+\beta_3log(land)+\beta_4log(rooms)+\beta_5log(baths)+\beta_6log(age)+u \] ### Modele [log(inst)’in karesini ekleyin]:

\[ log(price)=\beta_0 +\beta_1log(dist)+\beta_2log(area)+\beta_3log(land)+\beta_4log(rooms)+\beta_5log(baths)+\beta_6log(age)+\beta_6[log(ints)]^2 +u \]