İLERİ PANEL VERİ YÖNTEMLERİ
Panel veri yıllardan ve bireyler oluşan değişkenlerle oluşturulduğu farzedildiğinde, her sene bireylerden veriler toplanmış bireyler(individual), seneler ise t (time) ile gösterilsin.
\[y_{it} = \beta_1 x_{it} + \alpha_i + u_{it}\]
\(t = 1, 2, ..., T\)
Her bir i için zamana göre ortalama alacak olursak
\[\bar{y_i} = \beta_1 \bar{x_i} + \alpha_i + \bar{u_i}\] ikinci denklemi birinci denklemden çıkarırsak
\[y_{it} - \bar{y_i} = \beta_1 (x_{it} - \bar{x_i}) + (u_{it} - \bar{u_i})\]
Bu eşitlik aynı zamanda şu şekilde de yazılabilir
\[\ddot{y_{it}} = \beta_1 \ddot{x_{it}} + \ddot{u_{it}}\] \[\ddot{y_{it}} = y_{it} - \bar{y_i}\] y’nin zaman ortalamasından farkı alınmış (time-demeaned data) verisidir. Sabit etkiler dönüşümü (The fixed effects transformation) veya içinde dönüşüm (within transformation) olarak da adlandırılır. Bu yaptığımız regresyona Sabit Etkiler Tahmincisi (fixed effects estimator) veya İçinde Tahminci (within estimator) olarak bilinir.
library(plm)
## Warning: package 'plm' was built under R version 4.2.3
library(wooldridge)
## Warning: package 'wooldridge' was built under R version 4.2.3
data("wagepan")
library(rmarkdown)
paged_table(wagepan)
wagepan veriseti Vella ve Verbeek (1998)’den elde edilmiştir. Örnekteki 545 erkek 1980’den 1987 yılına kadar tüm yıllarda çalışmıştır. nr her bir erkeğin verisetinde numara verilmiş halidir. Fark edeceğiniz gibi bazı değişkenler her bir birey için zamana göre değişmekte bazı değişkenler değişmemektedir. Örneğin 13. bireyin black olma durumu zamana göre değişmezken, deneyimi tanımlayan exper değişkeni hersene 1 artmıştır. Irk ve eğitimi tanımlayan değişkenlerde zamana göre değişmez. Zamana göre değişen diğer bazı değişkenler ise medeni durum (married) ve sendika (union) olarak örneklendirilebilir.
Eğer kullanacağımız modelde Sabit etkileri (fixed effect veya first differencing) kullanırsak denklemde ırk, eğitim ve tecrübeye yer veremeyiz.Ancak eğitimin etkisinin incelenen zaman diliminde bir etkisi olup olmadığını anlamak için 1981’den 1987’ye kadar olan yıllar için yıl kuklaları ile eğitimi gösteren educ değişkeninin etkileşimini regresyona ekleyebiliriz.
Daha önce konuştuğumuz gibi bağımlı değişken wage (ücret) yerine log(wage) kullanmak daha yararlı olabilir.
library(plm)
Daha önce de söylediğimiz gibi within tahmincisi kullanırken sadece zaman içinde değişen değişkenleri kullanabiliyoruz. Kitabınız bu regresyon için, medeni durum kuklası (married), sendika kuklası (union) ve sene kuklalarıyla eğitimin (educ) etkileşimini kullanarak lwage (logaritmik maaş)’ı anlamaya çalışmış.
Veriseti panel verisetine çevrilmeli. pdata.frame komutu verisetinizi panel verisetine çevirmenize yardımcı olur.
wagepanpd <- pdata.frame(wagepan, index = c("nr", "year"))
Bu komut sayesinde birey ve zaman indexlerini verisetine tanıtabildik. Artık bu verisitini kullanarak plm komutunu kullanabilirsiniz
pdim(wagepanpd)
## Balanced Panel: n = 545, T = 8, N = 4360
plm paketinin içinde bulunan pdim komutu sayesinde verisetinin balansını kontrol edebilir, kaç kişi için toplam kaç yıl veri toplandığını görebiliriz. n burada 545 kişiden, T, 8 yıl boyunca toplam 4360 tane gözlem toplanıldığını göstermektedir
withinmodel1 <- plm(lwage ~ married + union + factor(year)*educ, data = wagepanpd, model = "within")
summary(withinmodel1)
## Oneway (individual) effect Within Model
##
## Call:
## plm(formula = lwage ~ married + union + factor(year) * educ,
## data = wagepanpd, model = "within")
##
## Balanced Panel: n = 545, T = 8, N = 4360
##
## Residuals:
## Min. 1st Qu. Median 3rd Qu. Max.
## -4.152111 -0.125630 0.010897 0.160800 1.483401
##
## Coefficients:
## Estimate Std. Error t-value Pr(>|t|)
## married 0.0548205 0.0184126 2.9773 0.002926 **
## union 0.0829785 0.0194461 4.2671 2.029e-05 ***
## factor(year)1981 -0.0224158 0.1458885 -0.1537 0.877893
## factor(year)1982 -0.0057611 0.1458558 -0.0395 0.968495
## factor(year)1983 0.0104297 0.1458579 0.0715 0.942999
## factor(year)1984 0.0843743 0.1458518 0.5785 0.562965
## factor(year)1985 0.0497253 0.1458602 0.3409 0.733190
## factor(year)1986 0.0656064 0.1458917 0.4497 0.652958
## factor(year)1987 0.0904448 0.1458505 0.6201 0.535216
## factor(year)1981:educ 0.0115854 0.0122625 0.9448 0.344827
## factor(year)1982:educ 0.0147905 0.0122635 1.2061 0.227872
## factor(year)1983:educ 0.0171182 0.0122633 1.3959 0.162830
## factor(year)1984:educ 0.0165839 0.0122657 1.3521 0.176437
## factor(year)1985:educ 0.0237085 0.0122738 1.9316 0.053479 .
## factor(year)1986:educ 0.0274123 0.0122740 2.2334 0.025583 *
## factor(year)1987:educ 0.0304332 0.0122723 2.4798 0.013188 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Total Sum of Squares: 572.05
## Residual Sum of Squares: 474.35
## R-Squared: 0.1708
## Adj. R-Squared: 0.048567
## F-statistic: 48.9069 on 16 and 3799 DF, p-value: < 2.22e-16
Etkileşim terimlerinin çoğu anlamsız olmasına rağmen pozitif katsayıya sahip ve giderek artıyor. En büyük katsayı son yılın (1987) eğitimle etkileşimi ve 0.03, t değer ise 2.48. Bu katsayıyı eğitimin temel yıl 1980’e göre etkisinin maaşlar üzerinde yüzde 3 daha büyük ve anlamlı olduğu söylenebilir.