Etkileşim terimli modeller

\[ price = \beta_0 + \beta_1sqrft + \beta_2bdrms+ ...+ \beta_3sqrft \ . \ bdrms + \beta_4bthrms + u \]

Modelde yatak odası sayısının (bdrms), fiyat (price) üzerindeki etkisi (diğer değişkenler sabitken) türev yardımıyla bulunabilir.

\[ \frac{\partial price}{\partial bdrms} \beta_2 + \beta_3sqrft \]

\(\bullet\) Yatak odası sayısı (bdrms) ile ev büyüklüğü (sqrft) arasında etkileşim etkisi bulunmaktadır.

Örnek 6.3

\(\bullet\) Bir final sınavında standartlaştırılmış sonuçları (stndfnl), devam oranı (atndrte), üniversite öncesi genel ortalaması (PriGPA) ve ACT skorunun yüzdesi olarak açıklayan model

\[ stndfnl = \beta_0 +\beta_1atndrte + \beta_2priGPA + \beta_ÂT... + \beta_4priGPA^2 + \beta_5ACT^2 + \beta_6priGPA . atndrte \] Derse katılım oranının final sonuçları üzerindeki etkisi

\[ \frac{\partial stndfnl}{\partial atndrte} = \beta_1 + beta_6priGPA \]

olur. ‘attend’ veri setini kullanarak modeli tahmin edelim.

library(wooldridge)
library(rmarkdown)
data("attend")
(ornek6_3 <- lm(stndfnl~ atndrte*priGPA + ACT + I(priGPA^2) + I(ACT^2), data=attend))
## 
## Call:
## lm(formula = stndfnl ~ atndrte * priGPA + ACT + I(priGPA^2) + 
##     I(ACT^2), data = attend)
## 
## Coefficients:
##    (Intercept)         atndrte          priGPA             ACT     I(priGPA^2)  
##       2.050293       -0.006713       -1.628540       -0.128039        0.295905  
##       I(ACT^2)  atndrte:priGPA  
##       0.004533        0.005586

\(\bullet\) 0 noktasında priGPA etkisine bakmak çok anlamlı olmayacaktır.

\(\bullet\) Çünkü priGPA’in max, min ve ortalama değerlerine bakarsak

max(attend$priGPA)
## [1] 3.93
min(attend$priGPA)
## [1] 0.857
mean(attend$priGPA)
## [1] 2.586775

\(\bullet\) en düşük priGPA’in bile 0.857 olduğunu görürüz.

\(\bullet\) bu yüzden ortalama olarak 2.59 seviyesindeki etkisini ölçebiliriz.

\(\bullet\) coef komutu bize herhangi bir katsayıyı verebilir.

\(\bullet\) Örnek

katsayi <- coef(ornek6_3)
katsayi["atndrte"]
##      atndrte 
## -0.006712928
katsayi["atndrte:priGPA"]
## atndrte:priGPA 
##    0.005585907

\[ \frac{\partial stndfnl}{\partial atndrte} = \beta_1 + beta_6priGPA \]

\(\bullet\) bu formülü kullanarak derse katılımın standardize edilmiş final notlarına etkisini ortalama priGPA verisi üzerinden bulabiliriz.

katsayi["atndrte"] + mean(attend$priGPA)*katsayi["atndrte:priGPA"]
##     atndrte 
## 0.007736558
library(car)
## Loading required package: carData
linearHypothesis(ornek6_3, c("atndrte + 2.59*atndrte:priGPA"))
## Linear hypothesis test
## 
## Hypothesis:
## atndrte  + 2.59 atndrte:priGPA = 0
## 
## Model 1: restricted model
## Model 2: stndfnl ~ atndrte * priGPA + ACT + I(priGPA^2) + I(ACT^2)
## 
##   Res.Df    RSS Df Sum of Sq      F   Pr(>F)   
## 1    674 519.34                                
## 2    673 512.76  1    6.5772 8.6326 0.003415 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Öngörü ve Artık Analizi

\(\bullet\) Katılım oranı (atndrte) yüzde olarak ölçüldüğünden, bu derse katılım oranındaki %10 puanlık bir artışın final sınav sonucunu 0,78 final sınavı standart sapması kadar arttırdığı sonucuna varabiliriz.

\(\bullet\) Bu bölümü anlamak için kitabınızdaki Örnek 6.5’i kullanacağız. Üniversite not ortalamasının (colgpa) öngörüsü için aşağıdaki denklem kullanılmış.

\[ colgpa = \beta_0 + \beta_1sat +\beta_2hsperc+\beta_3hsize+\beta_4hsize^2 \] \(\bullet\) regresyon sonuçlarına bakalım

data(gpa2)
ornek6_5 <- lm(colgpa~sat+ hsperc + hsize + I(hsize^2), data=gpa2 )
summary(ornek6_5)
## 
## Call:
## lm(formula = colgpa ~ sat + hsperc + hsize + I(hsize^2), data = gpa2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.57543 -0.35081  0.03342  0.39945  1.81683 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.493e+00  7.534e-02  19.812  < 2e-16 ***
## sat          1.492e-03  6.521e-05  22.886  < 2e-16 ***
## hsperc      -1.386e-02  5.610e-04 -24.698  < 2e-16 ***
## hsize       -6.088e-02  1.650e-02  -3.690 0.000228 ***
## I(hsize^2)   5.460e-03  2.270e-03   2.406 0.016191 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.5599 on 4132 degrees of freedom
## Multiple R-squared:  0.2781, Adjusted R-squared:  0.2774 
## F-statistic:   398 on 4 and 4132 DF,  p-value: < 2.2e-16

\(\bullet\) Örnek sat=1200, hsperc=30 ve hsize=5’ken öngörülen GPA’in bulunan betalar yardımıyla bulunmasının basit olduğundan bahsediyor.

\(\bullet\) bu tahmini yapabilmek için bu bilgilerden oluşan bir veri seti oluşturalım.

tahmin_verileri = data.frame(sat=1200, hsperc=30, hsize=5)
tahmin_verileri
##    sat hsperc hsize
## 1 1200     30     5

\(\bullet\) Tahmin verilerini kullanarak bu özelliklere sahip öğrencinin not ortalaması ‘predict’ komutuyla bulunabilir ve bu tahminin %95 güven aralığı çıkarılabilir

predict(ornek6_5, tahmin_verileri, interval = "confidence" )
##        fit      lwr      upr
## 1 2.700075 2.661104 2.739047