Để xác định phương pháp hồi quy nào là phù hợp nhất, bài kiểm tra F được thực hiện để quyết định mô hình nào tốt nhất giữa mô hình hồi quy kết hợp (Pooled OLS) và mô hình hiệu ứng cố định (FEM). Kiểm định F được thực hiện với giả thuyết:
H0: Mô hình Pooled OLS phù hợp hơn.
H1: Mô hình FEM phù hợp hơn.
Nếu P_value bé hơn mức ý nghĩa là 5% thì giả thuyết H0 bị bác bỏ, tức là mô hình FEM phù hợp hơn. Ngược lại, nếu P_value lớn hơn 5% thì chấp nhận giả thuyết H0, chứng minh rằng mô hình Pooled OLS là phù hợp.
Kiểm định Hausman có mục đích là lựa chọn mô hình phù hợp hơn để phân tích mối quan hệ giữa các yếu tố trong nghiên cứu. Trong bối cảnh này, hai mô hình được so sánh là Mô Hình Hiệu Ứng Cố Định (FEM) và Mô Hình Hiệu Ứng Ngẫu Nhiên (REM).
Kiểm định Hausman so sánh các ước lượng từ FEM và REM để xác định mô hình nào phù hợp hơn với dữ liệu. Nếu kết quả kiểm định cho thấy sự khác biệt đáng kể giữa các ước lượng, điều này cho thấy FEM là lựa chọn tốt hơn vì nó không bỏ qua mối liên hệ giữa các yếu tố không quan sát được và các biến độc lập. Ngược lại, nếu không có sự khác biệt đáng kể, REM có thể được chọn vì nó thường hiệu quả hơn trong việc tính toán.
Trong đó, giả thuyết kiểm định là:
H0: Mô hình REM phù hợp hơn. H1: Mô hình FEM phù hợp hơn.
Nếu P_value bé hơn mức ý nghĩa là 5% thì giả thuyết H0 bị bác bỏ, tức là mô hình FEM phù hợp hơn. Ngược lại, nếu P_value lớn hơn 5% thì chấp nhận giả thuyết H0, chứng minh rằng mô hình REM là phù hợp.
library(xlsx)
a <- read.xlsx(file.choose(), sheetIndex = 1, header = T)
Mô hình nghiên cứu có biến phụ thuộc là doanh thu thuần (DTT) và 3 biến độc lập lần lượt là tỷ suất lợi nhuận trên vốn chủ sở hữu (ROE), tổng tài sản (TTS) và tỷ số nợ trên tổng tài sản (DAR). Dữ liệu nghiên cứu bao gồm 10 công ty thuộc lĩnh vực bưu chính viễn thông được niêm yết trên sàn chứng khoán từ quý I/2018 đến quý IV/2022, bao gồm 200 quan sát ứng với từng biến. Ta tiến hành thống kê mô tả cho từng biến như sau:
## DTT ROE TTS DAR
## Min. : 15911 Min. :-764.5700 Min. : 238708 Min. :0.1665
## 1st Qu.: 117879 1st Qu.: 0.6575 1st Qu.: 789254 1st Qu.:0.3282
## Median : 243814 Median : 2.4450 Median : 1412322 Median :0.5810
## Mean :1098784 Mean : 1.7418 Mean : 8300205 Mean :0.5341
## 3rd Qu.:1398030 3rd Qu.: 6.7625 3rd Qu.: 4042116 3rd Qu.:0.6703
## Max. :6327264 Max. : 427.5300 Max. :61821854 Max. :1.2622
Dựa vào bảng trình bày kết quả thống kê mô tả về các biến DTT, ROE, TTS và DAR, ta đưa ra các nhận xét sau:
Doanh thu thuần từ 10 công ty trong 5 năm có giá trị trung bình là 1,398,030 triệu đồng với trung vị có giá trị là 243,814 triệu đồng. Doanh thu thuần đạt giá trị lớn nhất ở mức 6,327,264 triệu đồng và giá trị nhỏ nhất là 15,911 triệu đồng.
Giá trị trung bình của ROE các công ty ngành bưu chính viễn thông là 1.7418%, ứng với giá trị trung vị bằng 2.4450% trong giai đoạn từ quý I/2018 - quý IV/2022. ROE có giá trị lớn nhất trong 5 năm là 427.53% và giá trị nhỏ nhất là -764.57%
Trong suốt 5 năm, giá trị trung bình của tổng tài sản là 8,300,205 triệu đồng và trung vị là 1,412,322 triệu đồng. Tổng tài sản lớn nhất tương ứng với 61,821,854 triệu đồng và 238,708 triệu đồng là giá trị tổng tài sản nhỏ nhất.
DAR từ 10 công ty trong 5 năm có giá trị trung bình là 0.5341% với trung vị có giá trị là 0.5810%. DAR đạt giá trị lớn nhất ở mức 1.2622% và giá trị nhỏ nhất là 0.1665%.
## DTT ROE TTS DAR
## DTT 1.0000000 -0.0226417025 0.8988943787 0.14946168
## ROE -0.0226417 1.0000000000 0.0001010332 -0.24114775
## TTS 0.8988944 0.0001010332 1.0000000000 0.04600868
## DAR 0.1494617 -0.2411477473 0.0460086759 1.00000000
## Warning: package 'corrplot' was built under R version 4.3.3
## corrplot 0.92 loaded
## Warning: package 'plm' was built under R version 4.3.3
##
## Model Formula: DTT ~ ROE + TTS + DAR
##
## Coefficients:
## (Intercept) ROE TTS DAR
## 6.4768e+03 8.9428e+01 8.2838e-02 7.5752e+05
##
## Model Formula: DTT ~ ROE + TTS + DAR
##
## Coefficients:
## ROE TTS DAR
## -8.5456e+02 6.1932e-02 -7.3892e+04
##
## Model Formula: DTT ~ ROE + TTS + DAR
##
## Coefficients:
## (Intercept) ROE TTS DAR
## 5.0978e+05 -8.3493e+02 7.4738e-02 -5.5953e+04
##
## F test for individual effects
##
## data: mohinh
## F = 46.031, df1 = 9, df2 = 187, p-value < 2.2e-16
## alternative hypothesis: significant effects
##
## Hausman Test
##
## data: mohinh
## chisq = 2.4775, df = 3, p-value = 0.4794
## alternative hypothesis: one model is inconsistent
Mô hình được chọn là mô hình REM
##
## Pesaran CD test for cross-sectional dependence in panels
##
## data: DTT ~ ROE + TTS + DAR
## z = 7.8929, p-value = 2.952e-15
## alternative hypothesis: cross-sectional dependence
p_value = 2.952e-15 < 0.05. Mô hình có sự tương quan chéo
##
## Breusch-Godfrey/Wooldridge test for serial correlation in panel models
##
## data: mohinh
## chisq = 79.657, df = 20, p-value = 4.489e-09
## alternative hypothesis: serial correlation in idiosyncratic errors
p_value = 4.489e-09 < 0.05. Mô hình có hiện tượng tự tương quan
## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## Breusch-Pagan test
##
## data: rem
## BP = 66.118, df = 3, p-value = 2.892e-14
p_value = 2.892e-14 < 0.05. Phương sai sai số có thay đổi
## Warning: package 'car' was built under R version 4.3.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.3.3
## ROE TTS DAR
## 1.156961 1.005590 1.162556
Các biến độc lập đều có vif < 10. Mô hình kh có hiện tượng đa cộng tuyến
## Oneway (individual) effect General FGLS model
##
## Call:
## pggls(formula = mohinh, data = data_panel, model = "pooling")
##
## Balanced Panel: n = 10, T = 20, N = 200
##
## Residuals:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -1567621 -455183 -159166 3104 344849 1797790
##
## Coefficients:
## Estimate Std. Error z-value Pr(>|z|)
## (Intercept) 4.4727e+03 7.6406e+03 0.5854 0.5583
## ROE 8.5233e+01 1.3333e+02 0.6393 0.5226
## TTS 8.2756e-02 3.3700e-04 245.5708 <2e-16 ***
## DAR 7.5675e+05 6.6461e+03 113.8634 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Total Sum of Squares: 4.7618e+14
## Residual Sum of Squares: 8.5842e+13
## Multiple R-squared: 0.81973