\[ price = \beta_0 + \beta_1sqrft + \beta_2bdrms+ ...+ \beta_3sqrft \ . \ bdrms + \beta_4bthrms + u \]
Modelde yatak odası sayısının (bdrms), fiyat (price) üzerindeki etkisi (diğer değişkenler sabitken) türev yardımıyla bulunabilir.
\[ \frac{\partial price}{\partial bdrms} \beta_2 + \beta_3sqrft \]
\(\bullet\) Yatak odası sayısı (bdrms) ile ev büyüklüğü (sqrft) arasında etkileşim etkisi bulunmaktadır.
\(\bullet\) Bir final sınavında standartlaştırılmış sonuçları (stndfnl), devam oranı (atndrte), üniversite öncesi genel ortalaması (PriGPA) ve ACT skorunun yüzdesi olarak açıklayan model
\[ stndfnl = \beta_0 +\beta_1atndrte + \beta_2priGPA + \beta_ÂT... + \beta_4priGPA^2 + \beta_5ACT^2 + \beta_6priGPA . atndrte \] Derse katılım oranının final sonuçları üzerindeki etkisi
\[ \frac{\partial stndfnl}{\partial atndrte} = \beta_1 + beta_6priGPA \]
olur. ‘attend’ veri setini kullanarak modeli tahmin edelim.
library(wooldridge)
library(rmarkdown)
data("attend")
(ornek6_3 <- lm(stndfnl~ atndrte*priGPA + ACT + I(priGPA^2) + I(ACT^2), data=attend))
##
## Call:
## lm(formula = stndfnl ~ atndrte * priGPA + ACT + I(priGPA^2) +
## I(ACT^2), data = attend)
##
## Coefficients:
## (Intercept) atndrte priGPA ACT I(priGPA^2)
## 2.050293 -0.006713 -1.628540 -0.128039 0.295905
## I(ACT^2) atndrte:priGPA
## 0.004533 0.005586
\(\bullet\) 0 noktasında priGPA etkisine bakmak çok anlamlı olmayacaktır.
\(\bullet\) Çünkü priGPA’in max, min ve ortalama değerlerine bakarsak
max(attend$priGPA)
## [1] 3.93
min(attend$priGPA)
## [1] 0.857
mean(attend$priGPA)
## [1] 2.586775
\(\bullet\) en düşük priGPA’in bile 0.857 olduğunu görürüz.
\(\bullet\) bu yüzden ortalama olarak 2.59 seviyesindeki etkisini ölçebiliriz.
\(\bullet\) coef komutu bize herhangi bir katsayıyı verebilir.
\(\bullet\) Örnek
katsayi <- coef(ornek6_3)
katsayi["atndrte"]
## atndrte
## -0.006712928
katsayi["atndrte:priGPA"]
## atndrte:priGPA
## 0.005585907
\[ \frac{\partial stndfnl}{\partial atndrte} = \beta_1 + beta_6priGPA \]
\(\bullet\) bu formülü kullanarak derse katılımın standardize edilmiş final notlarına etkisini ortalama priGPA verisi üzerinden bulabiliriz.
katsayi["atndrte"] + mean(attend$priGPA)*katsayi["atndrte:priGPA"]
## atndrte
## 0.007736558
library(car)
## Loading required package: carData
linearHypothesis(ornek6_3, c("atndrte + 2.59*atndrte:priGPA"))
## Linear hypothesis test
##
## Hypothesis:
## atndrte + 2.59 atndrte:priGPA = 0
##
## Model 1: restricted model
## Model 2: stndfnl ~ atndrte * priGPA + ACT + I(priGPA^2) + I(ACT^2)
##
## Res.Df RSS Df Sum of Sq F Pr(>F)
## 1 674 519.34
## 2 673 512.76 1 6.5772 8.6326 0.003415 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
\(\bullet\) Katılım oranı (atndrte) yüzde olarak ölçüldüğünden, bu derse katılım oranındaki %10 puanlık bir artışın final sınav sonucunu 0,78 final sınavı standart sapması kadar arttırdığı sonucuna varabiliriz.
\(\bullet\) Bu bölümü anlamak için kitabınızdaki Örnek 6.5’i kullanacağız. Üniversite not ortalamasının (colgpa) öngörüsü için aşağıdaki denklem kullanılmış.
\[ colgpa = \beta_0 + \beta_1sat +\beta_2hsperc+\beta_3hsize+\beta_4hsize^2 \] \(\bullet\) regresyon sonuçlarına bakalım
data(gpa2)
ornek6_5 <- lm(colgpa~sat+ hsperc + hsize + I(hsize^2), data=gpa2 )
summary(ornek6_5)
##
## Call:
## lm(formula = colgpa ~ sat + hsperc + hsize + I(hsize^2), data = gpa2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.57543 -0.35081 0.03342 0.39945 1.81683
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.493e+00 7.534e-02 19.812 < 2e-16 ***
## sat 1.492e-03 6.521e-05 22.886 < 2e-16 ***
## hsperc -1.386e-02 5.610e-04 -24.698 < 2e-16 ***
## hsize -6.088e-02 1.650e-02 -3.690 0.000228 ***
## I(hsize^2) 5.460e-03 2.270e-03 2.406 0.016191 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5599 on 4132 degrees of freedom
## Multiple R-squared: 0.2781, Adjusted R-squared: 0.2774
## F-statistic: 398 on 4 and 4132 DF, p-value: < 2.2e-16
\(\bullet\) Örnek sat=1200, hsperc=30 ve hsize=5’ken öngörülen GPA’in bulunan betalar yardımıyla bulunmasının basit olduğundan bahsediyor.
\(\bullet\) bu tahmini yapabilmek için bu bilgilerden oluşan bir veri seti oluşturalım.
tahmin_verileri = data.frame(sat=1200, hsperc=30, hsize=5)
tahmin_verileri
## sat hsperc hsize
## 1 1200 30 5
\(\bullet\) Tahmin verilerini kullanarak bu özelliklere sahip öğrencinin not ortalaması ‘predict’ komutuyla bulunabilir ve bu tahminin %95 güven aralığı çıkarılabilir
predict(ornek6_5, tahmin_verileri, interval = "confidence" )
## fit lwr upr
## 1 2.700075 2.661104 2.739047