Lý thuyết

Kiểm định F

Để xác định phương pháp hồi quy nào là phù hợp nhất, bài kiểm tra F được thực hiện để quyết định mô hình nào tốt nhất giữa mô hình hồi quy kết hợp (Pooled OLS) và mô hình hiệu ứng cố định (FEM). Kiểm định F được thực hiện với giả thuyết:

H0: Mô hình Pooled OLS phù hợp hơn.

H1: Mô hình FEM phù hợp hơn.

Nếu P_value bé hơn mức ý nghĩa là 5% thì giả thuyết H0 bị bác bỏ, tức là mô hình FEM phù hợp hơn. Ngược lại, nếu P_value lớn hơn 5% thì chấp nhận giả thuyết H0, chứng minh rằng mô hình Pooled OLS là phù hợp.

Kiểm định Hausman

Kiểm định Hausman có mục đích là lựa chọn mô hình phù hợp hơn để phân tích mối quan hệ giữa các yếu tố trong nghiên cứu. Trong bối cảnh này, hai mô hình được so sánh là Mô Hình Hiệu Ứng Cố Định (FEM) và Mô Hình Hiệu Ứng Ngẫu Nhiên (REM).

Kiểm định Hausman so sánh các ước lượng từ FEM và REM để xác định mô hình nào phù hợp hơn với dữ liệu. Nếu kết quả kiểm định cho thấy sự khác biệt đáng kể giữa các ước lượng, điều này cho thấy FEM là lựa chọn tốt hơn vì nó không bỏ qua mối liên hệ giữa các yếu tố không quan sát được và các biến độc lập. Ngược lại, nếu không có sự khác biệt đáng kể, REM có thể được chọn vì nó thường hiệu quả hơn trong việc tính toán.

Trong đó, giả thuyết kiểm định là:

H0: Mô hình REM phù hợp hơn. H1: Mô hình FEM phù hợp hơn.

Nếu P_value bé hơn mức ý nghĩa là 5% thì giả thuyết H0 bị bác bỏ, tức là mô hình FEM phù hợp hơn. Ngược lại, nếu P_value lớn hơn 5% thì chấp nhận giả thuyết H0, chứng minh rằng mô hình REM là phù hợp.

tải dữ liệu

library(xlsx)
a <- read.xlsx(file.choose(), sheetIndex = 1, header = T)

thống kê mô tả

Mô hình nghiên cứu có biến phụ thuộc là doanh thu thuần (DTT) và 3 biến độc lập lần lượt là tỷ suất lợi nhuận trên vốn chủ sở hữu (ROE), tổng tài sản (TTS) và tỷ số nợ trên tổng tài sản (DAR). Dữ liệu nghiên cứu bao gồm 10 công ty thuộc lĩnh vực bưu chính viễn thông được niêm yết trên sàn chứng khoán từ quý I/2018 đến quý IV/2022, bao gồm 200 quan sát ứng với từng biến. Ta tiến hành thống kê mô tả cho từng biến như sau:

##       DTT               ROE                 TTS                DAR        
##  Min.   :  15911   Min.   :-764.5700   Min.   :  238708   Min.   :0.1665  
##  1st Qu.: 117879   1st Qu.:   0.6575   1st Qu.:  789254   1st Qu.:0.3282  
##  Median : 243814   Median :   2.4450   Median : 1412322   Median :0.5810  
##  Mean   :1098784   Mean   :   1.7418   Mean   : 8300205   Mean   :0.5341  
##  3rd Qu.:1398030   3rd Qu.:   6.7625   3rd Qu.: 4042116   3rd Qu.:0.6703  
##  Max.   :6327264   Max.   : 427.5300   Max.   :61821854   Max.   :1.2622

Dựa vào bảng trình bày kết quả thống kê mô tả về các biến DTT, ROE, TTS và DAR, ta đưa ra các nhận xét sau:

Doanh thu thuần từ 10 công ty trong 5 năm có giá trị trung bình là 1,398,030 triệu đồng với trung vị có giá trị là 243,814 triệu đồng. Doanh thu thuần đạt giá trị lớn nhất ở mức 6,327,264 triệu đồng và giá trị nhỏ nhất là 15,911 triệu đồng.

Giá trị trung bình của ROE các công ty ngành bưu chính viễn thông là 1.7418%, ứng với giá trị trung vị bằng 2.4450% trong giai đoạn từ quý I/2018 - quý IV/2022. ROE có giá trị lớn nhất trong 5 năm là 427.53% và giá trị nhỏ nhất là -764.57%

Trong suốt 5 năm, giá trị trung bình của tổng tài sản là 8,300,205 triệu đồng và trung vị là 1,412,322 triệu đồng. Tổng tài sản lớn nhất tương ứng với 61,821,854 triệu đồng và 238,708 triệu đồng là giá trị tổng tài sản nhỏ nhất.

DAR từ 10 công ty trong 5 năm có giá trị trung bình là 0.5341% với trung vị có giá trị là 0.5810%. DAR đạt giá trị lớn nhất ở mức 1.2622% và giá trị nhỏ nhất là 0.1665%.

ma trận tương quan

##            DTT           ROE          TTS         DAR
## DTT  1.0000000 -0.0226417025 0.8988943787  0.14946168
## ROE -0.0226417  1.0000000000 0.0001010332 -0.24114775
## TTS  0.8988944  0.0001010332 1.0000000000  0.04600868
## DAR  0.1494617 -0.2411477473 0.0460086759  1.00000000
## Warning: package 'corrplot' was built under R version 4.3.3
## corrplot 0.92 loaded

chạy mô hình pooled ols

## Warning: package 'plm' was built under R version 4.3.3
## 
## Model Formula: DTT ~ ROE + TTS + DAR
## 
## Coefficients:
## (Intercept)         ROE         TTS         DAR 
##  6.4768e+03  8.9428e+01  8.2838e-02  7.5752e+05

FEM

## 
## Model Formula: DTT ~ ROE + TTS + DAR
## 
## Coefficients:
##         ROE         TTS         DAR 
## -8.5456e+02  6.1932e-02 -7.3892e+04

REM

## 
## Model Formula: DTT ~ ROE + TTS + DAR
## 
## Coefficients:
## (Intercept)         ROE         TTS         DAR 
##  5.0978e+05 -8.3493e+02  7.4738e-02 -5.5953e+04

so sánh Pooled & fem

## 
##  F test for individual effects
## 
## data:  mohinh
## F = 46.031, df1 = 9, df2 = 187, p-value < 2.2e-16
## alternative hypothesis: significant effects

so sánh fem và rem

## 
##  Hausman Test
## 
## data:  mohinh
## chisq = 2.4775, df = 3, p-value = 0.4794
## alternative hypothesis: one model is inconsistent

Mô hình được chọn là mô hình REM

Kiểm định các khuyết tật

Sự phụ thuộc chéo

## 
##  Pesaran CD test for cross-sectional dependence in panels
## 
## data:  DTT ~ ROE + TTS + DAR
## z = 7.8929, p-value = 2.952e-15
## alternative hypothesis: cross-sectional dependence

p_value = 2.952e-15 < 0.05. Mô hình có sự tương quan chéo

Tự tương quan

## 
##  Breusch-Godfrey/Wooldridge test for serial correlation in panel models
## 
## data:  mohinh
## chisq = 79.657, df = 20, p-value = 4.489e-09
## alternative hypothesis: serial correlation in idiosyncratic errors

p_value = 4.489e-09 < 0.05. Mô hình có hiện tượng tự tương quan

Phương sai sai số thay đổi

## Warning: package 'lmtest' was built under R version 4.3.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.3.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
##  Breusch-Pagan test
## 
## data:  rem
## BP = 66.118, df = 3, p-value = 2.892e-14

p_value = 2.892e-14 < 0.05. Phương sai sai số có thay đổi

Đa cộng tuyến

## Warning: package 'car' was built under R version 4.3.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.3.3
##      ROE      TTS      DAR 
## 1.156961 1.005590 1.162556

Các biến độc lập đều có vif < 10. Mô hình kh có hiện tượng đa cộng tuyến

Khắc phục khuyết tật bằng gls

## Oneway (individual) effect General FGLS model
## 
## Call:
## pggls(formula = mohinh, data = data_panel, model = "pooling")
## 
## Balanced Panel: n = 10, T = 20, N = 200
## 
## Residuals:
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -1567621  -455183  -159166     3104   344849  1797790 
## 
## Coefficients:
##               Estimate Std. Error  z-value Pr(>|z|)    
## (Intercept) 4.4727e+03 7.6406e+03   0.5854   0.5583    
## ROE         8.5233e+01 1.3333e+02   0.6393   0.5226    
## TTS         8.2756e-02 3.3700e-04 245.5708   <2e-16 ***
## DAR         7.5675e+05 6.6461e+03 113.8634   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Total Sum of Squares: 4.7618e+14
## Residual Sum of Squares: 8.5842e+13
## Multiple R-squared: 0.81973