İleri Panel Veri Yöntemleri

Sabit Etkiler Tahmini

Panel verimizin yıllardan ve bireylerden oluştuğunu düşünelim. Her sene, bireylerden veriler toplanmış ve bireyler i (individual), seneler ise t (time) ile gösterilsin.

Herbiri için model şu şekilde yazılabilir.

\[y_{it} = \beta_1 x_{it} + \alpha_i + u_{it}\]

t=1,2,…,T

Her bir i için zamana göre ortalama alacak olursak

\[\bar{y_i} = \beta_1 \bar{x_i} + \alpha_i + \bar{u_i}\]

İkinci denklemi birinci denklemden çıkarırsak

\[y_{it} - \bar{y_i} = \beta_1 (x_{it} - \bar{x_i}) + (u_{it} - \bar{u_i})\]

Bu eşitlik aynı zamanda şu şekilde de yazılabilir

\[\ddot{y_{it}} = \beta_1 \ddot{x_{it}} + \ddot{u_{it}}\]

Burada \(\ddot{y_{it}} = y_{it} - \bar{y_i}\), y’nin zaman ortalamasından farkı alınmış (time-demeaned data) verisidir. Sabit etkiler dönüşümü (The fixed effects transformation) veya içinde dönüşüm (within transformation) olarak da adlandırılır. Bu yaptığımız regresyona Sabit Etkiler Tahmincisi (fixed effects estimator) veya İçinde Tahminci (within estimator) olarak bilinir.

Örnek:

Panel verileri analiz etmek için çoklu regresyonlar içim kullandığımız lm() komutu yerine plm paketini kullanacağız.

library(plm)

Örnek için wooldridge wagepan veri setini kullanıyoruz.

library(wooldridge)
data("wagepan")
library(rmarkdown)
paged_table(wagepan)

wagepan veriseti Vella ve Verbeek (1998)’den elde edilmiştir.

Örnekteki 545 erkek 1980’den 1987 yılına kadar tüm yıllarda çalışmıştır. nr her bir erkeğin verisetinde numara verilmiş halidir. Fark edeceğiniz gibi bazı değişkenler her bir birey için zamana göre değişmekte bazı değişkenler değişmemektedir. Örneğin 13. bireyin black olma durumu zamana göre değişmezken, deneyimi tanımlayan exper değişkeni hersene 1 artmıştır. Irk ve eğitimi tanımlayan değişkenlerde zamana göre değişmez. Zamana göre değişen diğer bazı değişkenler ise medeni durum (married) ve sendika (union) olarak örneklendirilebilir.

Eğer kullanacağımız modelde Sabit etkileri (fixed effect veya first differencing) kullanırsak denklemde ırk, eğitim ve tecrübeye yer veremeyiz.Ancak eğitimin etkisinin incelenen zaman diliminde bir etkisi olup olmadığını anlamak için 1981’den 1987’ye kadar olan yıllar için yıl kuklaları ile eğitimi gösteren educ değişkeninin etkileşimini regresyona ekleyebiliriz.

Bağımlı değişken wage (ücret) yerine log(wage) kullanmak daha yararlı olabilir.

library(plm)

Burada, within tahmincisi kullanırken sadece zaman içinde değişen değişkenleri kullanabiliyoruz. Bu regresyon için, medeni durum kuklası (married), sendika kuklası (union) ve sene kuklalarıyla eğitimin (educ) etkileşimini kullanarak lwage (logaritmik maaş)’ı anlamaya çalışılmıştır.

Veriseti panel verisetine çevrilmeliyiz bunun için pdata.frame komutu verisetinizi panel verisetine çevirmenize yardımcı olur.

wagepanpd <- pdata.frame(wagepan, index = c("nr", "year"))

Bu komut sayesinde birey ve zaman indexlerini verisetine tanıtabildik. Artık bu verisitini kullanarak plm komutunu kullanabilirsiniz

pdim(wagepanpd)
## Balanced Panel: n = 545, T = 8, N = 4360

plm paketinin içinde bulunan pdim komutu sayesinde verisetinin balansını kontrol edebilir, kaç kişi için toplam kaç yıl veri toplandığını görebiliriz. n burada 545 kişiden, T, 8 yıl boyunca toplam 4360 tane gözlem toplanıldığını göstermektedir.

withinmodel1 <- plm(lwage ~ married + union + factor(year)*educ, data = wagepanpd, model = "within")
summary(withinmodel1)
## Oneway (individual) effect Within Model
## 
## Call:
## plm(formula = lwage ~ married + union + factor(year) * educ, 
##     data = wagepanpd, model = "within")
## 
## Balanced Panel: n = 545, T = 8, N = 4360
## 
## Residuals:
##      Min.   1st Qu.    Median   3rd Qu.      Max. 
## -4.152111 -0.125630  0.010897  0.160800  1.483401 
## 
## Coefficients:
##                         Estimate Std. Error t-value  Pr(>|t|)    
## married                0.0548205  0.0184126  2.9773  0.002926 ** 
## union                  0.0829785  0.0194461  4.2671 2.029e-05 ***
## factor(year)1981      -0.0224158  0.1458885 -0.1537  0.877893    
## factor(year)1982      -0.0057611  0.1458558 -0.0395  0.968495    
## factor(year)1983       0.0104297  0.1458579  0.0715  0.942999    
## factor(year)1984       0.0843743  0.1458518  0.5785  0.562965    
## factor(year)1985       0.0497253  0.1458602  0.3409  0.733190    
## factor(year)1986       0.0656064  0.1458917  0.4497  0.652958    
## factor(year)1987       0.0904448  0.1458505  0.6201  0.535216    
## factor(year)1981:educ  0.0115854  0.0122625  0.9448  0.344827    
## factor(year)1982:educ  0.0147905  0.0122635  1.2061  0.227872    
## factor(year)1983:educ  0.0171182  0.0122633  1.3959  0.162830    
## factor(year)1984:educ  0.0165839  0.0122657  1.3521  0.176437    
## factor(year)1985:educ  0.0237085  0.0122738  1.9316  0.053479 .  
## factor(year)1986:educ  0.0274123  0.0122740  2.2334  0.025583 *  
## factor(year)1987:educ  0.0304332  0.0122723  2.4798  0.013188 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    572.05
## Residual Sum of Squares: 474.35
## R-Squared:      0.1708
## Adj. R-Squared: 0.048567
## F-statistic: 48.9069 on 16 and 3799 DF, p-value: < 2.22e-16

Etkileşim terimlerinin çoğu anlamsız olmasına rağmen pozitif katsayıya sahip ve giderek artıyor. En büyük katsayı son yılın (1987) eğitimle etkileşimi ve 0.03, t değer ise 2.48. Bu katsayıyı eğitimin temel yıl 1980’e göre etkisinin maaşlar üzerinde yüzde 3 daha büyük ve anlamlı olduğu söylenebilir.

Rassal Etkiler Modeli (Random Effect Models)

Bu modelde ortalama değişkenlerden farkı bir ağırlıklandırma farkıyla dönüşümün yapılmasından kaynaklanır. Bu parametre λ’dır.

\[y_{it} - \lambda \bar{y_i} = \beta_0 (1 - \lambda) + \beta_1 (x_{it} - \lambda \bar{x_i}) + (u_{it} - \lambda \bar{u_i})\]

Eğer λ=0 olursa, bildiğimiz lm regresyonu yapılabilir. Eğer λ=1 ise, dönüşüm fixed effect dönüşümü olur. Eğer λ 1 ile 0 arasında ise bu dönüşüm Rassal etkiler modeli olarak adlandırılır.

\[\lambda = 1 - [\frac{\sigma_u^2}{\sigma_u^2 + T \sigma_{\alpha}^2}]^{1/2}\]

\(σ^2_u\) 0’a yaklaştıkça λ 1’e yaklaşır. Uygulamada λ asla 0 veya 1 olamaz ancak bu sayılara yaklaşabilir. λ tahmin edilebilir ancak parametre kesinlikle bilinemez. T büyük olursa da λ 1’e yaklaşır.

pvar(wagepanpd)
## no time variation:       nr black hisp educ 
## no individual variation: year d81 d82 d83 d84 d85 d86 d87

plm paketinin içindeki pvar komutu zamanla değişmeyen ve bireye göre değişmeyen değişkenleri göstermektedir.

Öğrendiğimiz üç yöntemle de regresyonları yapalım.

reg_ols <- plm(lwage ~ educ + black + hisp + exper + I(exper^2) + married + union + year, data = wagepanpd, model = "pooling")
reg_random <- plm(lwage ~ educ + black + hisp + exper + I(exper^2) + married + union + year, data = wagepanpd, model = "random")
reg_fe <- plm(lwage ~ educ + black + hisp + exper + I(exper^2) + married + union + year, data = wagepanpd, model = "within")

Stargazer komutu, birkaç modelden regresyon analizi sonuçlarını yan yana tutan iyi biçimlendirilmiş tablolar için LaTeX kodu, HTML kodu ve ASCII metni üretir. Ayrıca özet istatistikler ve veri çerçevesi içeriği de verebilir. Regresyon analizi yapmak için stargazer paketini kullanılmıştır.

library(stargazer)
## 
## Please cite as:
##  Hlavac, Marek (2022). stargazer: Well-Formatted Regression and Summary Statistics Tables.
##  R package version 5.2.3. https://CRAN.R-project.org/package=stargazer
stargazer(reg_ols, reg_random, reg_fe, type = "text", column.labels = c("OLS","RE","FE"))
## 
## ===========================================================================
##                                   Dependent variable:                      
##              --------------------------------------------------------------
##                                          lwage                             
##                         OLS                RE                FE            
##                         (1)               (2)                (3)           
## ---------------------------------------------------------------------------
## educ                 0.091***           0.092***                           
##                       (0.005)           (0.011)                            
##                                                                            
## black                -0.139***         -0.139***                           
##                       (0.024)           (0.048)                            
##                                                                            
## hisp                   0.016             0.022                             
##                       (0.021)           (0.043)                            
##                                                                            
## exper                0.067***           0.106***          0.132***         
##                       (0.014)           (0.015)            (0.010)         
##                                                                            
## I(exper2)            -0.002***         -0.005***          -0.005***        
##                       (0.001)           (0.001)            (0.001)         
##                                                                            
## married              0.108***           0.064***           0.047**         
##                       (0.016)           (0.017)            (0.018)         
##                                                                            
## union                0.182***           0.106***          0.080***         
##                       (0.017)           (0.018)            (0.019)         
##                                                                            
## year1981              0.058*             0.040              0.019          
##                       (0.030)           (0.025)            (0.020)         
##                                                                            
## year1982              0.063*             0.031             -0.011          
##                       (0.033)           (0.032)            (0.020)         
##                                                                            
## year1983              0.062*             0.020            -0.042**         
##                       (0.037)           (0.042)            (0.020)         
##                                                                            
## year1984              0.090**            0.043             -0.038*         
##                       (0.040)           (0.051)            (0.020)         
##                                                                            
## year1985              0.109**            0.058            -0.043**         
##                       (0.043)           (0.061)            (0.020)         
##                                                                            
## year1986             0.142***            0.092             -0.027          
##                       (0.046)           (0.071)            (0.020)         
##                                                                            
## year1987             0.174***            0.135*                            
##                       (0.049)           (0.081)                            
##                                                                            
## Constant               0.092             0.024                             
##                       (0.078)           (0.151)                            
##                                                                            
## ---------------------------------------------------------------------------
## Observations           4,360             4,360              4,360          
## R2                     0.189             0.181              0.181          
## Adjusted R2            0.187             0.178              0.061          
## F Statistic  72.459*** (df = 14; 4345) 957.774*** 83.851*** (df = 10; 3805)
## ===========================================================================
## Note:                                           *p<0.1; **p<0.05; ***p<0.01

Hangi modeli kullanabileceğinizi anlamanız için Hausmann testi kullanıyoruz.

Hausman testi, etkin rassal etkiler tahmincisi ile hesaplanan katsayıların, tutarlı sabit etkiler ile tahmin edilenlerle aynı olduğu boş hipotezini test eder. Bunun için phtest() fonksiyonu kullanılmıştır.

phtest(reg_fe, reg_random)
## 
##  Hausman Test
## 
## data:  lwage ~ educ + black + hisp + exper + I(exper^2) + married +  ...
## chisq = 31.707, df = 10, p-value = 0.000448
## alternative hypothesis: one model is inconsistent

H0 hipotezi random effect tutarlıdır, p değeri 0.000448 olduğu için reddedilebilir. Bu yüzden fixed effect kullanılacaktır.