ARAÇSAL DEĞİŞKEN TAHMİNİ VE İKİ AŞAMALI EN KÜÇÜK KARELER

library(AER);library(stargazer)
## Warning: package 'AER' was built under R version 4.2.3
## Zorunlu paket yükleniyor: car
## Warning: package 'car' was built under R version 4.2.3
## Zorunlu paket yükleniyor: carData
## Warning: package 'carData' was built under R version 4.2.3
## Zorunlu paket yükleniyor: lmtest
## Warning: package 'lmtest' was built under R version 4.2.3
## Zorunlu paket yükleniyor: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Zorunlu paket yükleniyor: sandwich
## Warning: package 'sandwich' was built under R version 4.2.3
## Zorunlu paket yükleniyor: survival
## 
## Please cite as:
##  Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
##  R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
data(mroz, package='wooldridge')

eksik olmayan ücret gözlemleriyle sınırlandırın

oursamples <- subset(mroz, !is.na(wage))

OLS eğim parametresi manuel olarak

with (oursamples, cov (log (wage), educ) / var (educ))
## [1] 0.1086487

IV eğim parametresi manuel

with (oursamples, cov (log (wage), fatheduc)/ cov (educ, fatheduc))
## [1] 0.05917348

OLS otomatik olarak

reg.ols <-   lm (log (wage) ~ educ, data=oursamples)

IV otomatik olarak

 reg.iv <- ivreg (log (wage) ~ educ  | fatheduc, data=oursamples)

regresyon tablosu

stargazer (reg.ols, reg.iv, type="text")
## 
## ===================================================================
##                                        Dependent variable:         
##                                ------------------------------------
##                                             log(wage)              
##                                          OLS           instrumental
##                                                          variable  
##                                          (1)               (2)     
## -------------------------------------------------------------------
## educ                                  0.109***            0.059*   
##                                        (0.014)           (0.035)   
##                                                                    
## Constant                               -0.185             0.441    
##                                        (0.185)           (0.446)   
##                                                                    
## -------------------------------------------------------------------
## Observations                             428               428     
## R2                                      0.118             0.093    
## Adjusted R2                             0.116             0.091    
## Residual Std. Error (df = 426)          0.680             0.689    
## F Statistic                    56.929*** (df = 1; 426)             
## ===================================================================
## Note:                                   *p<0.1; **p<0.05; ***p<0.01

#Example 15.1

Basit regresyon modelinde eğitime dönüşü tahmin etmek için MROZ.RAW’daki evli çalışan kadınlara ilişkin verileri kullanıyoruz.

\[log(wage) = \beta_0 + \beta_1educ +e\] Karşılaştırma için önce OLS tahminlerini alıyoruz

\[log(wage) = .185 + .109educ\]

\[ n=428, R^2=.118.\]

bir eğitim yılı daha için neredeyse %11’lik bir getiri anlamına gelir.

Daha sonra, eğitim için araçsal bir değişken olarak babanın eğitimini (fateduc) kullanıyoruz. İlk olarak fateduc’un u ile ilişkisiz olduğunu savunmak. İkinci koşul, eğitim ve fateduc ilişkilidir. Eğitimin basit bir regresyonunu kullanarak bunu kolayca kontrol edebiliriz.

\[educ = 10.24 + .269fateduc\]
\[ n=428, R^2=.173.\] Fatheduc’a ilişkin t istatistiği 9.28’dir; bu, educ ve fateduc’un istatistiksel olarak anlamlı bir pozitif korelasyona sahip olduğunu gösterir. Educ aslında fateduc varyasyonun yaklaşık %17’sini açıklar.

\[log(wage) = .441 + .059educ\]
\[ n=428, R^2=.093.\] Tahmin eğitime geri dönüşün , OLS tahmininin yaklaşık yarısı olan %5,9’dur.Bu, OLS tahmininin çok yüksek olduğunu ve ihmal edilen yetenekle tutarlı olduğunu gösterir..109’un eğitime gerçek dönüşün üzerinde olup olmadığını veya .059’un o eğitime daha yakın olup olmadığını öğreneceğiz.OLS kullanan 1 için %95 güven aralığıdır;

#Example 15.2

Artık erkeklerin eğitime geri dönüşünü tahmin etmek için WAGE2.RAW kullanıyoruz. Sibs (kardeş sayısı) değişkenini eğitim için bir araç olarak kullanıyoruz. Bunlar negatif olarak ilişkilidir, çünkü basit bir regresyondan doğrulayabiliriz.

\[educ = 14.14-0,228sibs\] \[n=935 , R^2=0,057\]

Bu, her kardeşin ortalama olarak yaklaşık 0,23 daha az eğitim yılı ile ilişkili olduğunu gösterir.

\[log(wage) = 5,13+0,122educ\] \[n=935\] R-kare negatif olarak hesaplanmıştır, bu yüzden bunu bildirmiyoruz.OLS tahmini 1.006 dır.bu kardeşler aynı zamanda yetenekle de ilişkilidir: daha fazla kardeş, ortalama olarak, daha az ebeveyn ilgisi anlamına gelir ve bu da daha düşük yetenekle sonuçlanabilir.

 library (AER); library (stargazer)
data(card, package='wooldridge')
redf<-lm (educ ~ nearc4+exper+I (exper^2) +black+smsa+south+smsa66+reg662+ reg663+reg664+reg665+reg666+reg667+reg668+reg669, data=card)

OLS(EN KÜÇÜK KARELER YÖNTEMİ)

ols<-lm (log (wage) ~educ+exper+I(exper^2) +black+smsa+south+smsa66+reg662+reg663+reg664+reg665+reg666+reg667+reg668+reg669, data=card)

IV Tahmin

 iv <-ivreg (log (wage)~ educ+exper+I (exper^2)+black+smsa+south+smsa66+ reg662+reg663+reg664+reg665+reg666+reg667+reg668+reg669| nearc4+exper+I (exper^2) +black+smsa+south+smsa66+ reg662+reg663+reg664+reg665+reg666+reg667+reg668+reg669 , data=card)

seçilen katsayıların regresyon tablosu

stargazer(redf, ols, iv, type="text", keep=c("ed", "near", "exp", "bl"), keep.stat=c("n", "rsq"))
## 
## =============================================
##                    Dependent variable:       
##              --------------------------------
##                educ          log(wage)       
##                 OLS       OLS    instrumental
##                                    variable  
##                 (1)       (2)        (3)     
## ---------------------------------------------
## nearc4       0.320***                        
##               (0.088)                        
##                                              
## educ                   0.075***    0.132**   
##                         (0.003)    (0.055)   
##                                              
## exper        -0.413*** 0.085***    0.108***  
##               (0.034)   (0.007)    (0.024)   
##                                              
## I(exper2)      0.001   -0.002***  -0.002***  
##               (0.002)  (0.0003)    (0.0003)  
##                                              
## black        -0.936*** -0.199***  -0.147***  
##               (0.094)   (0.018)    (0.054)   
##                                              
## ---------------------------------------------
## Observations   3,010     3,010      3,010    
## R2             0.477     0.300      0.238    
## =============================================
## Note:             *p<0.1; **p<0.05; ***p<0.01

\[log(wage) = β_0+β_1educ+β_2exper+β_3exper^2+u_1\] \[educ = π_0+π_1educ+π_2exper_2+π_3motheduc+π_4fatheduc+u_1\]

library (AER); library (stargazer)
data(mroz, package='wooldridge')
oursample <- subset(mroz, !is.na (wage))
stagel <- lm (educ~exper+I(exper^2)+motheduc+fatheduc, data=oursample)
man.2SLS<-lm (log (wage)~fitted(stagel) +exper+I (exper^2), data=oursample)
aut.2SLS<-ivreg(log (wage)~educ+exper+I(exper^2) | motheduc+fatheduc+exper+I(exper^2), data=oursample)
stargazer(stagel,man.2SLS,aut.2SLS, type="text",keep.stat=c("n","rsq"))
## 
## =============================================
##                     Dependent variable:      
##                ------------------------------
##                  educ         log(wage)      
##                  OLS      OLS    instrumental
##                                    variable  
##                  (1)      (2)        (3)     
## ---------------------------------------------
## fitted(stagel)           0.061*              
##                         (0.033)              
##                                              
## educ                                0.061*   
##                                    (0.031)   
##                                              
## exper           0.045   0.044***   0.044***  
##                (0.040)  (0.014)    (0.013)   
##                                              
## I(exper2)       -0.001  -0.001**   -0.001**  
##                (0.001)  (0.0004)   (0.0004)  
##                                              
## motheduc       0.158***                      
##                (0.036)                       
##                                              
## fatheduc       0.190***                      
##                (0.034)                       
##                                              
## Constant       9.103***  0.048      0.048    
##                (0.427)  (0.420)    (0.400)   
##                                              
## ---------------------------------------------
## Observations     428      428        428     
## R2              0.211    0.050      0.136    
## =============================================
## Note:             *p<0.1; **p<0.05; ***p<0.01
library (AER); library (lmtest)
data(mroz, package='wooldridge')
oursample <- subset (mroz, !is.na (wage))
stagel<-lm (educ~exper+I(exper^2) +motheduc+fatheduc, data=oursample)
 stage2<-lm (log (wage)~educ+exper+I(exper^2) +resid (stagel), data=oursample)
coeftest(stage2)
## 
## t test of coefficients:
## 
##                  Estimate  Std. Error t value  Pr(>|t|)    
## (Intercept)    0.04810030  0.39457526  0.1219 0.9030329    
## educ           0.06139663  0.03098494  1.9815 0.0481824 *  
## exper          0.04417039  0.01323945  3.3363 0.0009241 ***
## I(exper^2)    -0.00089897  0.00039591 -2.2706 0.0236719 *  
## resid(stagel)  0.05816661  0.03480728  1.6711 0.0954406 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

2SLS ile tahmin ettiğimizde, denklemimiz

\[log(wage) = 0,048+0,061educ+0,044exper-0,0009exper^2\] \[n=428, R^2=0,136\] eğitim ebeveynlerin eğitimi ile ilişkilidir.

data (mroz, package='wooldridge')
oursample <- subset(mroz, !is.na (wage))

IV regresyon

summary(res.2sls <- ivreg(log(wage)~educ+exper+I(exper^2) | exper+I(exper^2)+motheduc+fatheduc,data=oursample) )
## 
## Call:
## ivreg(formula = log(wage) ~ educ + exper + I(exper^2) | exper + 
##     I(exper^2) + motheduc + fatheduc, data = oursample)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.0986 -0.3196  0.0551  0.3689  2.3493 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  0.0481003  0.4003281   0.120  0.90442   
## educ         0.0613966  0.0314367   1.953  0.05147 . 
## exper        0.0441704  0.0134325   3.288  0.00109 **
## I(exper^2)  -0.0008990  0.0004017  -2.238  0.02574 * 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6747 on 424 degrees of freedom
## Multiple R-Squared: 0.1357,  Adjusted R-squared: 0.1296 
## Wald test: 8.141 on 3 and 424 DF,  p-value: 2.787e-05

\[log(wage) = 0,048+0,061educ+0,044exper-0,00089exper^2\]

res.aux <- lm(resid(res.2sls) ~ exper+I(exper^2)+motheduc+fatheduc, data = oursample)
(r2 <- summary(res.aux)$r.squared)
## [1] 0.0008833444
(n <-nobs (res.aux))
## [1] 428
(teststat <- n*r2)
## [1] 0.3780714
(pval <- 1-pchisq(teststat, 1))
## [1] 0.5386372
library (plm)
## Warning: package 'plm' was built under R version 4.2.3
data (jtrain, package='wooldridge')

Panel verileri tanımlamak için aşağıdaki işlem uygulanır (yalnızca 1987 ve 1988 için)

jtrain.87.88 <- subset (jtrain, year<=1988)
jtrain.p<-pdata.frame(jtrain.87.88, index=c("fcode","year"))
summary(plm (log(scrap)~hrsemp|grant, model="fd", data=jtrain.p))
## Oneway (individual) effect First-Difference Model
## Instrumental variable estimation
##    (Balestra-Varadharajan-Krishnakumar's transformation)
## 
## Call:
## plm(formula = log(scrap) ~ hrsemp | grant, data = jtrain.p, model = "fd")
## 
## Unbalanced Panel: n = 47, T = 1-2, N = 92
## Observations used in estimation: 45
## 
## Residuals:
##       Min.    1st Qu.     Median    3rd Qu.       Max. 
## -2.3088292 -0.2188848 -0.0089255  0.2674362  2.4305637 
## 
## Coefficients:
##               Estimate Std. Error z-value Pr(>|z|)  
## (Intercept) -0.0326684  0.1269512 -0.2573  0.79692  
## hrsemp      -0.0141532  0.0079147 -1.7882  0.07374 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    17.29
## Residual Sum of Squares: 17.015
## R-Squared:      0.061927
## Adj. R-Squared: 0.040112
## Chisq: 3.19767 on 1 DF, p-value: 0.073743

\[hrsemp=0,051+27,88δgrant\] \[ n=45,R^2=0,392\] çalışan başına iş eğitimi saatindeki değişikliğin, 1988’de bir iş eğitimi hibesi almakla pozitif şekilde ilişkili olduğu görülmektedir.

Bir iş eğitimi hibesi almak, çalışan başına eğitimi yaklaşık 28 saat arttırmıştır.

\[log(scarp)=-0,033-0,014δhrsemp\] \[ n=45,R^2=0,016\] şçi başına 10 saat daha iş eğitiminin hurda oranı yaklaşık %14 oranında azaltacağını göstermektedir.