##Bölüm 6
##Çoklu Regresyon Analizi : İleri Konular
Bu bölümde çoklu regresyon analizinin geniş çaptaki uygulamalı problemlerle yapılması önemlidir.
Çocuk doğum ağırlığını sigara kullanımı ve aile geliriyle ilişkilendiren bir denklemle başlayalım :
\[ \hat(bwght)=\hat{\beta}_0+\hat{beta}_1\cdot cigs+\hat{\beta}_2 faminc. \]
Burada; bwght= Çocuk doğum ağırlığı,ons cinsinden cgs= Hamilelik süresince anne tarafından içilen günlük sigara sayısı faminc = Ailenin yıllık geliri, bin dolardır.
library (wooldridge)
data("bwght")
library(rmarkdown)
paged_table(bwght)
Bu denklemin BWGHT.RAW veri seti kullanılarak elde edilen tahmini tablo 6.1’in ilk stünunda verilmiştir.Parantez içinde verilen değerler standart hatalardır. “cigs” değişkeninin tahmin edilen değeri bize bir kadının günde 5 sigara daha fazla içmesi durumunda çocuk doğum ağırlığının 0.4634(5)=2,317 ons daha az olacağının öngörüldüğünü söylemektedir. cigs değişkenine ait t istatistiği -5.06 olup değişken istatiksel olarak oldukça anlamlıdır.
lm(bwght~cigs + faminc, data = bwght)
##
## Call:
## lm(formula = bwght ~ cigs + faminc, data = bwght)
##
## Coefficients:
## (Intercept) cigs faminc
## 116.97413 -0.46341 0.09276
lm(bwght$bwght~ bwght$cigs + bwght$faminc)
##
## Call:
## lm(formula = bwght$bwght ~ bwght$cigs + bwght$faminc)
##
## Coefficients:
## (Intercept) bwght$cigs bwght$faminc
## 116.97413 -0.46341 0.09276
Ons cinsinden olan bwght değişkenini pounda çevirmeliyiz. Bir ons,Bir poundun onaltıda biri olduğunu buluruz.
bwght$bwghtlbs <- bwght$bwght/ 16
lm(bwght$bwghtlbs ~ bwght$cigs + bwght$faminc)
##
## Call:
## lm(formula = bwght$bwghtlbs ~ bwght$cigs + bwght$faminc)
##
## Coefficients:
## (Intercept) bwght$cigs bwght$faminc
## 7.310883 -0.028963 0.005798
lm(I(bwght/16)~ cigs + faminc, data=bwght)
##
## Call:
## lm(formula = I(bwght/16) ~ cigs + faminc, data = bwght)
##
## Coefficients:
## (Intercept) cigs faminc
## 7.310883 -0.028963 0.005798
lm(bwght~ I(cigs/20) + faminc, data=bwght)
##
## Call:
## lm(formula = bwght ~ I(cigs/20) + faminc, data = bwght)
##
## Coefficients:
## (Intercept) I(cigs/20) faminc
## 116.97413 -9.26815 0.09276
model_1<- lm(bwght~cigs + faminc,data=bwght)
model_2<- lm(I(bwght/16) ~ cigs + faminc,data=bwght)
model_3<- lm(bwght~ I(cigs/20) + faminc,data=bwght)
library(stargazer)
##
## Please cite as:
## Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
## R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
stargazer(list(model_1,model_2,model_3), type="text")
##
## =================================================================
## Dependent variable:
## ---------------------------------
## bwght I(bwght/16) bwght
## (1) (2) (3)
## -----------------------------------------------------------------
## cigs -0.463*** -0.029***
## (0.092) (0.006)
##
## I(cigs/20) -9.268***
## (1.832)
##
## faminc 0.093*** 0.006*** 0.093***
## (0.029) (0.002) (0.029)
##
## Constant 116.974*** 7.311*** 116.974***
## (1.049) (0.066) (1.049)
##
## -----------------------------------------------------------------
## Observations 1,388 1,388 1,388
## R2 0.030 0.030 0.030
## Adjusted R2 0.028 0.028 0.028
## Residual Std. Error (df = 1385) 20.063 1.254 20.063
## F Statistic (df = 2; 1385) 21.274*** 21.274*** 21.274***
## =================================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
Örneğin bir değişken,kendi ortalamasından çıkarılıp standart satmasına bölünerek standartlaştırılabilir.
$$ z_y= {ϭ_y}
$$
data("kielmc")
library(rmarkdown)
paged_table(kielmc)
help(kielmc)
## httpd yardım sunucusu başlatılıyor ... tamamlandı
Wooldridge Kaynak: K.A. Kiel ve K.T. McClain (1995), “Yer Belirleme Karar Aşamalarında Ev Fiyatları: Operasyon Yoluyla Söylentilerden Bir Yakma Fırını Örneği,” Çevre Ekonomisi ve Yönetimi Dergisi 28, 241-255. Profesör McClain, yalnızca bir alt kümesini kullandığım verileri nazikçe sağladı. Veriler geç yükleniyor.
kullanım veri(‘kielmc’) Biçim 25 değişken üzerinde 321 gözlem içeren bir data.frame:
yıl: 1978 veya 1981
yaş: evin yaşı
yaşq: yaş^2
nbh: mahalle, 1-6
cbd: dist. sente. otobüs. bölge, ft.
ara: uzak. eyaletler arası, ft.
tiftik: günlük(intst)
fiyat: satış fiyatı
odalar: evde # oda
alan: evin kare görüntüleri
arazi: metrekare arsa
banyolar: # banyo
uzak: uzak. evden incin., ft.
ldist: günlük(dist)
rüzgar: prc. zaman rüzgarı inci. eve
lfiyat: günlük(fiyat)
y81: =1 ise yıl == 1981
larea: günlük(alan)
lland: kütük(arazi)
y81ldist: y81*ldist
lintstsq: tiftik^2
yakın yakın: =1 eğer mesafe <= 15840
y81nrinc: y81*inc yakın
fiyat: fiyat, 1978 dolar
fiyat: log(fiyat)
Sadece 1981 yılı için,KIELMCR.RAW’daki verileri kullanarak,aşağıdaki sorulara cevap veriniz.Veriler 1981’de Kuzey Andover,Massachuatts’te satılan evlerdir.1981 yerel çöp yakma fırınınım kurulmaya başlandığı yıldı.
###(i) Çöp fırının konumunun ev fiyatları üzerindeki etkisini incelemek için şu basit modeli ele alalım :
\[ log(price)=\beta_0 + \beta_1log(dist)+u \] Burada price dolar cinsinden evin fiyatı ve dist,ev ile çöp yakma fırını arasında ki uzaklıktır.Denklemin dikkatli biçimde yorumlanmasında çöp yakma fırınının bulunması ev fiyatını düşürüyorsa \(\beta_1\)’in işaretini ne beklersiniz. Denklemi tahmin edin ve sonuçları yorumlayın.
###(ii)regresyon modeline aşağıda belirtilenleri ekleyelim :
\[ log(price)=\beta_0 +\beta_1log(dist)+\beta_2log(area)+\beta_3log(land)+\beta_4log(rooms)+\beta_5log(baths)+\beta_6log(age)+u \] ### Modele [log(inst)’in karesini ekleyin]:
\[ log(price)=\beta_0 +\beta_1log(dist)+\beta_2log(area)+\beta_3log(land)+\beta_4log(rooms)+\beta_5log(baths)+\beta_6log(age)+\beta_6[log(ints)]^2 +u \]