## [1] "en_US.UTF-8"

1 MÔ TẢ DỮ LIỆU

Dữ liệu của bài là dạng dữ liệu theo chuỗi thời gian của Ngân hàng TMCP Quân Đội trong gian đoạn từ năm 2011- 2023 được chia theo quý. Các dữ liệu được lấy từ báo cáo tài chính, kết quả hoạt động kinh doanh và được thu thập từ các trang web như vietstock.vn, caFe.vn. Bên cạnh đó còn thu thập số liệu từ những bài báo và tổng cục thống kê. Qua quá trình loại bỏ và sàn lọc những năm hoặc quý bị thiếu với một vài biến. Kết quả thu được là 1 bảng dữ liệu gồm 5 biến với 52 quan sát.

d <- read_excel("C:/Users/ASUS/Downloads/DATA HQB TH2.xlsx")
datatable(d)
data <- read_excel("C:/Users/ASUS/Downloads/data HQB.xlsx")

1.1 Mô hình nghiên cứu và các giả thuyết nghiên cứu

Từ các bài nghiên cứu trước đây và lý thuyết về các yếu tố nội tại ngân hàng tác động đến tỷ suất sinh lợi. Qua đó, tổng kết nhóm các yếu tố chính tác động đến tỷ suất sinh lợi (ROA) bao gồm: Quy mô ngân hàng (SIZE), Tỷ lệ tài sản có tính thanh khoản trên tổng tài sản (LIQ), Tỷ lệ chi phí hoạt động (CIR), Chi phí thuế (TAX).

ROA là chỉ số thông dụng và có thể khái quát được tình hình lợi nhuận của ngân hàng TMCP Quân Đội, sử dụng biến phụ thuộc là ROA.

Dựa vào cơ sở này, xây dựng mô hình với mục đích nghiên cứu sự tác động của các yếu tố nội tại ngân hàng tỷ suất sinh lợi các Ngân hàng TMCP Quân Đội tại Việt Nam giai đoạn 2011-2023. Mô hình đề xuất như sau: \[ ROA_t = \beta_0 + \beta_1 SIZE_t + \beta_2 CIR_t + \beta_3 LIQ_t + \beta_4 TAX_t + \varepsilon_t \]

Trong đó:

  • β₀: Hằng số của mô hình

  • β₁, β₂, β₃, β₄: Hệ số hồi quy của các biến độc lập

  • εₜ: Sai số ngẫu nhiên

  • t: Thời gian theo quý từ năm 2011 - 2023 (t = 1,…,52)

Trong mô hình nghiên cứu này sẽ phân tích tác động của các yếu tố đối với tỷ suất sinh lợi (ROA).

Trong đó:

Biến phụ thuộc là Tỷ suất sinh lợi (ROA)

Biến độc lập là các yếu tố nội tại ngân hàng tác động tới tỷ suất sinh lợi bao gồm:

  • SIZE: Quy mô ngân hàng

  • CIR: Tỷ lệ chi phí hoạt động

  • LIQ: Tỷ lệ tài sản có tính thanh khoản trên tổng tài sản

  • TAX: Tỷ lệ chi phí thuế

1.2 Biến phụ thuộc

\[ ROA = \frac{Lợi\ nhuận\ sau\ thuế}{Tổng\ tài\ sản} \times 100 \]

ROA -tỷ suất sinh lời trên tổng tài sản, là chỉ số đánh giá khả năng sinh lời trên mỗi đồng tài sản của công ty. Chỉ số này cho biết quy mô lợi nhuận sau thuế được tạo ra từ mỗi đồng đầu tư vào tổng tài sản, qua đó phản ánh hiệu quả sinh lợi của các tài sản cũng như mức độ khai thác các tài sản đó.

Đặc biệt, ROA là một thước đo hiệu quả sử dụng tài sản khi phân tích Ngân hàng TMCP Quân Đội. Nó đem lại cho nhà đầu tư cái nhìn sâu sắc về lợi nhuận thu được từ lượng vốn đầu tư, hay nói cách khác, từ lượng tài sản. Đáng chú ý, ROA của các công ty cổ phần có sự khác biệt lớn và phụ thuộc nhiều vào ngành nghề kinh doanh. Tài sản của một công ty được hình thành từ vốn vay và vốn chủ sở hữu, và cả hai nguồn vốn này được sử dụng để tài trợ cho các hoạt động của công ty. Hiệu quả chuyển đổi vốn đầu tư thành lợi nhuận được thể hiện rõ qua chỉ số ROA. ROA càng cao thì càng tốt, vì điều này cho thấy công ty đang tạo ra nhiều lợi nhuận hơn từ mỗi đồng đầu tư, phản ánh hiệu quả sử dụng vốn tối ưu.

1.3 Biến độc lập

1.3.1 Quy mô ngân hàng (SIZE)

Trong lĩnh vực kinh doanh ngân hàng, tổng tài sản được sử dụng như một chỉ tiêu quan trọng để đánh giá quy mô của ngân hàng. Tài sản của ngân hàng bao gồm cả tài sản sinh lời và tài sản không sinh lời, trong đó tài sản sinh lời chiếm tỷ trọng lớn, còn tài sản không sinh lời chỉ chiếm một tỷ lệ nhỏ, thường khoảng 10-20%. Khi ngân hàng có tỷ lệ tài sản sinh lời cao, lợi nhuận thu về sẽ càng lớn. Vì vậy, việc đánh giá chất lượng tài sản trở nên vô cùng quan trọng. Việc đánh giá quy mô và chất lượng tài sản đóng vai trò then chốt trong sự tồn tại và phát triển của ngân hàng thương mại cổ phần. Điều này cũng là cơ sở để xác định năng lực tài chính, cũng như khả năng quản lý và điều hành của NHTM. Biến đại diện cho quy mô ngân hàng được tính như sau:

\[ SIZE = \ln(Tổng\ tài\ sản) \]

1.3.2 Tỷ lệ tài sản có tính thanh khoản trên tổng tài sản (LIQ)

Tiền mặt, tiền gửi ngân hàng Nhà nước Việt Nam, tiền gửi tại các tổ chức tín dụng khác và cho vay tổ chức tín dụng, chứng khoán kinh doanh để chi trả hoặc tài trợ khách hàng những tài sản này dễ dàng chuyển đổi thành tiền nó thể hiện tính thanh khoản của ngân hàng. Angbazo (1997) cho rằng, khi tỷ lệ tiền mặt hay các khoản tương đương tiền mặt tăng, tính thanh khoản của ngân hàng càng cao. Vì vậy, khi tỷ lệ tài sản có khả năng thanh khoản (LIQ) tăng có thể có một tác động cùng chiều đến tỷ lệ an toàn vốn của ngân hàng. Nếu một ngân hàng duy trì một tỷ lệ tài sản thanh khoản cao sẽ đối mặt với rủi ro tài chính thấp. Công thức tính:

\[ LIQ = \frac{Tài\ sản\ thanh\ khoản}{Tổng\ tài\ sản} \]

Trong đó:

\[ Tài\ sản\ thanh\ khoản = Tiền\ mặt + Tiền\ gửi\ tại\ NHNN + Tiền\ gửi\ tại\ các\ TCTD\ khác + Cho\ vay\ các\ TCTD\ khác \]

1.3.3 Tỷ lệ chi phí hoạt động (CIR)

CIR viết tắt của khái niệm Cost to Income Ratio – tỷ lệ chi phí hoạt động – là chỉ số tài chính quan trọng trong các tổ chức tài chính, kinh doanh, ngân hàng, thương mại điện tử để đo lường hiệu quả hoạt động và tình hình phát triển. Theo đó, chỉ số này sẽ phân tích tổng chi phí hoạt động đang chiếm bao nhiêu trong tổng doanh thu của công ty. CIR càng thấp thì khả năng quản lý hoạt động, doanh thu và chi phí của doanh nghiệp càng được đánh giá cao. Chỉ số CIR được đo lường thông qua cách thức sau:

\[ CIR = \frac{Tổng\ chi\ phí\ hoạt\ động}{Tổng\ thu\ nhập\ hoạt\ động} \]

Trong đó:

\[ Tổng\ thu\ nhập\ hoạt\ động = Thu\ nhập\ lãi\ thuần + Lãi\ thuần\ từ\ hoạt\ động\ dịch\ vụ, hoạt\ động\ kinh\ doanh\ ngoại\ hối, mua\ bán\ chứng\ khoán\ kinh\ doanh, chứng\ khoán\ đầu\ tư\ và\ các\ hoạt\ động\ khác + Thu\ nhập\ từ\ hoạt\ động\ góp\ vốn,\ mua\ bán\ cổ\ phần \]

1.3.4 Tỷ lệ chi phí thuế (TAX)

Tỷ lệ chi phí thuế (Tax Expense Ratio) là một chỉ số tài chính dùng để đo lường mức độ ảnh hưởng của thuế đến lợi nhuận của một công ty. Nó cho biết phần trăm của thu nhập trước thuế được chi trả cho thuế. Đối với nhà đầu tư và cổ đông, tỷ lệ chi phí thuế là một chỉ số quan trọng để đánh giá khả năng sinh lời thực tế của ngân hàng sau khi trừ đi các chi phí thuế. Điều này ảnh hưởng đến quyết định đầu tư và đánh giá rủi ro đầu tư vào ngân hàng. Tỷ lệ chi phí thuế (TAX) được tính theo công thức sau:

\[ TAX = \frac{Chi\ phí\ thuế}{Lợi\ nhuận\ trước\ thuế} \]

2 THỐNG KÊ MÔ TẢ

Mô hình nghiên cứu có biến phụ thuộc là tỷ suất sinh lợi (ROA) và 4 biến độc lập là các biến yếu tố tác động lên biến phụ thuộc. Bộ dữ liệu bảng được sử dụng trong mô hình nghiên cứu là của Ngân hàng TMCP Quân Đội tại Việt Nam và thời gian từ 2011- 2023 theo quý, tổng cộng 52 quan sát ta có bảng thống kê các biến như sau:

options(digits = 4) 
library(pastecs)
library(knitr)
kable(stat.desc(data),
      caption = "Bảng 2: Thống kê mô tả các biến trong mô hình")
Bảng 2: Thống kê mô tả các biến trong mô hình
Nam ROA SIZE LIQ TAX CIR
nbr.val 5.200e+01 52.0000 52.0000 52.0000 52.0000 52.0000
nbr.null 0.000e+00 0.0000 0.0000 0.0000 0.0000 0.0000
nbr.na 0.000e+00 0.0000 0.0000 0.0000 0.0000 0.0000
min 2.011e+03 0.0950 32.3761 0.0649 0.1685 0.2763
max 2.023e+03 0.7666 34.4822 0.3473 1.0579 0.5627
range 1.200e+01 0.6716 2.1061 0.2825 0.8894 0.2863
sum 1.049e+05 23.3584 1733.3715 8.4287 15.1655 19.7133
median 2.017e+03 0.4451 33.2799 0.1420 0.2552 0.3669
mean 2.017e+03 0.4492 33.3341 0.1621 0.2916 0.3791
SE.mean 5.239e-01 0.0213 0.0803 0.0100 0.0170 0.0083
CI.mean.0.95 1.052e+00 0.0428 0.1611 0.0201 0.0341 0.0167
var 1.427e+01 0.0236 0.3349 0.0052 0.0150 0.0036
std.dev 3.778e+00 0.1536 0.5787 0.0721 0.1224 0.0601
coef.var 1.900e-03 0.3419 0.0174 0.4448 0.4197 0.1585

Nhận xét

Dựa vào kết quả thống kê mô tả dữ liệu ở bảng 2 ta thấy ROA bình quân của Ngân hàng TMCP Quân Đội là 0.4492% biến thiên từ 0.0950% đến 0.7666%. Với giá trị trung bình cứ mỗi đồng tài sản bỏ ra thì ngân hàng thu về được 0.4492 đồng lợi nhuận sau thuế với độ lệch chuẩn là 0.1536% cho thấy mức độ biến động của ROA không quá cao, tức là ROA của ngân hàng MB Bank có sự ổn định tương đối. Điều này cho thấy lợi nhuận trên tài sản của ngân hàng không dao động quá lớn qua các quan sát khác nhau.

Biến quy mô ngân hàng SIZE thể hiện quy mô của ngân hàng có giá trị trung bình là 33.3341 ta thấy cho thấy ngân hàng MB Bank có kích thước lớn và ổn định. Với độ lệch chuẩn là 57.87% cho thấy mức độ biến động của quy mô ngân hàng không quá lớn. Điều này nghĩa là các giá trị quy mô của MB Bank trong mẫu khảo sát tương đối gần nhau và không có sự chênh lệch lớn.

LIQ là tỷ lệ thanh khoản, đo lường khả năng của ngân hàng trong việc đáp ứng các nghĩa vụ tài chính ngắn hạn. Tỷ lệ thanh khoản trung bình là 0.1620, cho thấy MB Bank duy trì mức độ thanh khoản hợp lý để đảm bảo khả năng thanh toán. Mức độ biến động của tỷ lệ thanh khoản là tương đối thấp với độ lệch chuẩn 7,12% là tỷ lệ thanh khoản của MB Bank không dao động quá nhiều quanh giá trị trung bình, cho thấy một sự ổn định nhất định trong việc quản lý thanh khoản.

Biến tỷ lệ chi phí thuế TAX với giá trị trung bình 29,16% qua đó cho thấy ngân hàng chịu mức thuế tương đối cao và dao động trong khoảng từ 16.85% đến 105.79%. Độ lệch chuẩn 0.1224 cho thấy mức độ biến động của tỷ lệ thuế là vừa phải.

CIR là tỷ lệ giữa chi phí hoạt động và tổng thu nhập. Tỷ lệ này trung bình là 37.91%, cho thấy ngân hàng MB Bank có khả năng kiểm soát chi phí hoạt động hiệu quả. Độ lệch chuẩn 6.01% cho thấy mức độ biến động của tỷ lệ chi phí hoạt động là khá thấp. Điều này có nghĩa là tỷ lệ chi phí hoạt động của MB Bank không dao động nhiều giữa các quan sát khác nhau, cho thấy sự ổn định trong việc kiểm soát chi phí.

3 MÔ HÌNH pooled OLS

library(plm)

OLS <- plm(ROA ~ SIZE + CIR + LIQ + TAX, data = data,  index = c("Nam"),  model = "pooling")

summary(OLS)
## Pooling Model
## 
## Call:
## plm(formula = ROA ~ SIZE + CIR + LIQ + TAX, data = data, model = "pooling", 
##     index = c("Nam"))
## 
## Balanced Panel: n = 13, T = 4, N = 52
## 
## Residuals:
##      Min.   1st Qu.    Median   3rd Qu.      Max. 
## -0.268756 -0.050887  0.000593  0.036148  0.314037 
## 
## Coefficients:
##             Estimate Std. Error t-value Pr(>|t|)    
## (Intercept)  -6.2064     1.2812   -4.84  1.4e-05 ***
## SIZE          0.2074     0.0367    5.65  9.1e-07 ***
## CIR          -0.8016     0.2424   -3.31   0.0018 ** 
## LIQ           0.9430     0.2969    3.18   0.0026 ** 
## TAX          -0.3651     0.1214   -3.01   0.0042 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Total Sum of Squares:    1.2
## Residual Sum of Squares: 0.456
## R-Squared:      0.621
## Adj. R-Squared: 0.589
## F-statistic: 19.2865 on 4 and 47 DF, p-value: 1.91e-09

Nhận xét

\(R^2_{\text{hiệu chỉnh}} = 0.589\) ⇒ mô hình giải thích được khoảng 58.9% biến thiên của tỷ suất sinh lợi (ROA). Điều này cho thấy các biến độc lập (SIZE, CIR, LIQ, TAX) có khả năng giải thích tương đối tốt cho sự biến động của ROA.

F-statistic = 19.2865 với bậc tự do (4; 47) và p-value = 1.91e−09 < 0.01 ⇒ mô hình có ý nghĩa thống kê ở mức tổng thể, tức là ít nhất một trong các biến độc lập có ảnh hưởng đến ROA.

Xét riêng từng hệ số:

  • SIZE: hệ số 0.2074, \(t = 5.65\), \(p = 9.1\times10^{-7}\) < 0.01 ⇒ có ý nghĩa thống kê ở mức 1%. Khi quy mô ngân hàng (SIZE) tăng 1 đơn vị, ROA tăng trung bình 0.2074 đơn vị, giữ các yếu tố khác không đổi. → SIZE có tác động dương và có ý nghĩa mạnh đến tỷ suất sinh lợi.

  • CIR: hệ số −0.8016, \(t = -3.31\), \(p = 0.0018\) < 0.01 ⇒ có ý nghĩa ở mức 1%. Khi tỷ lệ chi phí hoạt động (CIR) tăng 1 đơn vị, ROA giảm trung bình 0.8016 đơn vị. → CIR có tác động âm đến tỷ suất sinh lợi, thể hiện việc chi phí hoạt động cao làm giảm lợi nhuận.

  • LIQ: hệ số 0.9430, \(t = 3.18\), \(p = 0.0026\) < 0.01 ⇒ có ý nghĩa ở mức 1%. Khi tỷ lệ thanh khoản (LIQ) tăng 1 đơn vị, ROA tăng trung bình 0.9430 đơn vị. → LIQ có tác động cùng chiều với ROA, cho thấy ngân hàng có khả năng thanh khoản tốt sẽ có lợi nhuận cao hơn.

  • TAX: hệ số −0.3651, \(t = -3.01\), \(p = 0.0042\) < 0.01 ⇒ có ý nghĩa ở mức 1%. Khi tỷ lệ chi phí thuế (TAX) tăng 1 đơn vị, ROA giảm trung bình 0.3651 đơn vị. → TAX có tác động âm, cho thấy gánh nặng thuế làm giảm hiệu quả sinh lợi của ngân hàng.

Hệ số chặn (Intercept): −6.2064, \(t = -4.84\), \(p = 1.4\times10^{-5}\) < 0.01 ⇒ có ý nghĩa thống kê. Tuy nhiên, trong phân tích kinh tế, hệ số chặn chủ yếu mang tính kỹ thuật và không được diễn giải cụ thể.

4 KHOẢNG TIN CẬY CHO CÁC THAM SỐ

Giả thuyết kiểm định:

• H₀: βᵢ = 0

• H₁: βᵢ ≠ 0

confint(OLS, level = 0.95)
##               2.5 %  97.5 %
## (Intercept) -8.7174 -3.6953
## SIZE         0.1354  0.2794
## CIR         -1.2767 -0.3266
## LIQ          0.3612  1.5249
## TAX         -0.6030 -0.1272

Nhận xét

Dựa vào bảng khoảng tin cậy 95% cho các tham số hồi quy, ta có thể rút ra một số kết luận sau:

Khoảng tin cậy của biến SIZE nằm trong khoảng (0.1354; 0.2794) và không chứa giá trị 0, do đó hệ số \(\beta_1\) có ý nghĩa thống kê ở mức 5%. Điều này cho thấy quy mô ngân hàng (SIZE) có ảnh hưởng cùng chiều đến tỷ suất sinh lợi (ROA). Khi quy mô ngân hàng tăng, lợi nhuận trên tổng tài sản cũng tăng theo.

Khoảng tin cậy của biến CIR nằm trong khoảng (−1.2767; −0.3266) và không chứa 0, do đó hệ số \(\beta_2\) có ý nghĩa thống kê ở mức 5%. Biến tỷ lệ chi phí hoạt động (CIR) có ảnh hưởng ngược chiều đến ROA, tức là khi chi phí hoạt động tăng, hiệu quả sinh lợi của ngân hàng giảm.

Khoảng tin cậy của biến LIQ là (0.3612; 1.5249), cũng không chứa 0, vì vậy hệ số \(\beta_3\) có ý nghĩa thống kê ở mức 5%. Biến tỷ lệ tài sản thanh khoản (LIQ) có tác động dương đến ROA, tức là ngân hàng có khả năng thanh khoản tốt thường đạt được mức sinh lợi cao hơn.

Khoảng tin cậy của biến TAX nằm trong khoảng (−0.6030; −0.1272), không chứa giá trị 0, nên hệ số \(\beta_4\) có ý nghĩa thống kê ở mức 5%. Biến tỷ lệ chi phí thuế (TAX) có tác động âm đến ROA, nghĩa là khi gánh nặng thuế tăng, tỷ suất sinh lợi của ngân hàng giảm.

Hệ số chặn (Intercept) có khoảng tin cậy (−8.7174; −3.6953), tuy có ý nghĩa thống kê, nhưng trong phân tích kinh tế, nó chỉ mang ý nghĩa kỹ thuật và không được diễn giải cụ thể về mặt kinh tế.

5 MA TRẬN HỆ SỐ TƯƠNG QUAN

Hệ số tương quan là chỉ số thống kê đo lường mức độ mạnh yếu của mối quan hệ giữa 2 biến số. khảo sát hệ số tương quan giữa các biến trong mô hình nghiên cứu nhằm kiểm tra sơ lượt mức độ biến thiên giữa các biển trước khi chạy mô hình hồi quy. Hệ số tương quan được trình bày trong bảng 3

library(grid) 
library(corrplot)
data2 <- na.omit(data)
data2 <- data.frame(sapply(data2, as.numeric))  # ép tất cả về dạng số

corr_matrix <- cor(data2)
kable(round(corr_matrix, 4), caption = "Bảng 3: Ma trận tương quan giữa các biến") %>%
  kable_styling(full_width = FALSE, position = "center")
Bảng 3: Ma trận tương quan giữa các biến
Nam ROA SIZE LIQ TAX CIR
Nam 1.0000 0.6020 0.9892 -0.7910 -0.2608 -0.2468
ROA 0.6020 1.0000 0.6009 -0.2824 -0.3994 -0.5123
SIZE 0.9892 0.6009 1.0000 -0.7457 -0.2363 -0.2580
LIQ -0.7910 -0.2824 -0.7457 1.0000 0.3274 0.1503
TAX -0.2608 -0.3994 -0.2363 0.3274 1.0000 0.2190
CIR -0.2468 -0.5123 -0.2580 0.1503 0.2190 1.0000
corrplot(corr_matrix, method = "color", addCoef.col = "black", tl.col = "black")

Nhận xét

Dựa vào kết quả hệ số tương quan trong bảng 3, ta nhận thấy mức độ tương quan giữa các biến với nhau. Biến phụ thuộc ROA có mối tương quan thuận với quy mô ngân hàng (SIZE) và tỷ lệ chi phí hoạt động (CIR). Ngoài ra, ROA còn có mối tương quan nghịch với tỷ lệ thuế (TAX), tỷ lệ thanh khoản trên tổng tài sản (LIQ) và tỷ lệ chi phí hoạt động (CIR). Trong đó, mối tương quan dương mạnh nhất là giữa SIZE và ROA với hệ số 0.6009, cho thấy rằng khi quy mô ngân hàng tăng, lợi nhuận (ROA) cũng có xu hướng tăng. Điều này ngụ ý rằng các ngân hàng lớn thường có lợi nhuận cao hơn so với các ngân hàng nhỏ. Hệ số tương quan đó cũng là một cách để phát hiệt hiên tượng đa cộng tuyến giữa các biến nếu thấy hệ số tương quan cặp giữa các biến giải thích > 0,8 thì cho thấy hiện tương đa cộng tuyến trở nên nghiêm trọng. Tuy nhiên kết quả trên ta nhận thấy không có biến nào có hệ số tương quan lớn hơn 0.8 nên không có hiện tượng đa cộng tuyến nghiệm trọng và không gây ảnh hưởng đến kết quả.

6 KIỂM ĐỊNH CÁC GIẢ THIẾT MÔ HÌNH

Xét mô hình:

\[ ROA_t = \beta_0 + \beta_1 SIZE_t + \beta_2 CIR_t + \beta_3 LIQ_t + \beta_4 TAX_t + \varepsilon_t \quad (1) \]

6.1 kiểm định Ramsey

Trên cơ sở mô hình đã lựa chọn, tiến hành kiểm định các giả thuyết của mô hình. Sử dụng kiểm định Ramsey RESET để kiểm tra xem mô hình có được định dạng đúng hay không.

Giả thuyết kiểm định:

  • H₀: Mô hình (1) định dạng đúng

  • H₁: Mô hình (1) định dạng sai

# Giả sử mô hình đã được ước lượng trước đó:

model <- lm(ROA ~ SIZE + CIR + LIQ + TAX, data = data)

# Thực hiện kiểm định Ramsey RESET
resettest(model)
## 
##  RESET test
## 
## data:  model
## RESET = 0.75, df1 = 2, df2 = 45, p-value = 0.5

Nhận xét

Với p-value = 0.5 > 0.05, ta chưa đủ cơ sở để bác bỏ giả thuyết H₀ .Như vậy, mô hình (1) được định dạng đúng, tức là không có dấu hiệu cho thấy mô hình bị sai dạng (không bỏ sót biến hay sai dạng hàm).

6.2 Kiểm định đa cộng tuyến

Theo kết quả kiểm định đa cộng tuyến bằng hệ số phóng đại phương sai (VIF), hệ số VIF có giá trị lớn hơn 10, sẽ có vấn đề về đa cộng tuyến (Field, 2009), nếu VIF <2 thì ta sẽ kết luận là không có hiện tượng đa cộng tuyến giữa các biến độc lập.

OLS <- plm(ROA ~ SIZE + CIR + LIQ + TAX, data = data,  index = c("Nam"),  model = "pooling")
vif <- vif(OLS)
print(vif)
##  SIZE   CIR   LIQ   TAX 
## 2.376 1.116 2.411 1.162

Nhận xét

Từ kết quả trên 4 biến CIR, LIQ, TAX, SIZE trong mô hình hồi quy tuyến tính phân tích sự tác động của các yếu tố ảnh hưởng đến tỷ suất sinh lợi của ngân hàng TMCP Quân Đội có thể thấy tất cả giá trị hệ số VIF đều nhỏ hơn 10, do đó mô hình không xảy ra hiện tượng đa cộng tuyến cao.

6.3 Kiểm định phương sai sai số thay đổi (Breusch–Pagan)

Sử dụng kiểm định Breusch–Pagan để kiểm tra hiện tượng phương sai sai số thay đổi trong mô hình.

Tiến hành ước lượng mô hình trên, thu được phần dư \(\varepsilon_t \quad\), sau đó hồi quy phụ theo mô hình:

\[ e_i^2 = \alpha_1 + \alpha_2 SIZE_i + \alpha_3 CIR_i + \alpha_4 LIQ_i + \alpha_5 TAX_i + v_i \]

Giả thuyết kiểm định:

  • H₀: Mô hình không có hiện tượng phương sai sai số thay đổi
  • H₁: Mô hình có hiện tượng phương sai sai số thay đổi
library(lmtest)
bptest(ROA ~ SIZE + CIR + LIQ + TAX,  data = data, studentize = F)
## 
##  Breusch-Pagan test
## 
## data:  ROA ~ SIZE + CIR + LIQ + TAX
## BP = 11, df = 4, p-value = 0.02

Nhận xét

BP= 11, p-value= 0.02 < 0.05 (mức ý nghĩa được chọn), đủ cơ sở bác bỏ H₀. Vậy mô hình có xảy ra hiện tượng phương sai sai số thay đổi.

6.4 Kiểm định hiện tượng tự tương quan

Giả thuyết kiểm định:

• H₀: mô hình không có hiện tượng tự tương quan giữa các phần dư.

• H₁: mô hình tồn tại hiện tượng tự tương quan.

pbgtest(OLS)
## 
##  Breusch-Godfrey/Wooldridge test for serial correlation in panel models
## 
## data:  ROA ~ SIZE + CIR + LIQ + TAX
## chisq = 3.3, df = 4, p-value = 0.5
## alternative hypothesis: serial correlation in idiosyncratic errors

Nhận xét

Chisq = 3.3, p-value = 0.5 > 0,05 (mức ý nghĩa được chọn), chưa đủ cơ sở bác bỏ H₀. Vậy mô hình không có có hiện tượng tư tương quan.

7 KHẮC PHỤC CÁC KHUYẾT TẬT CỦA MÔ HÌNH

Kết quả kiểm định cho thấy mô hình hồi quy ban đầu vi phạm giả định về phương sai sai số thay đổi (heteroskedasticity). Do đó, để khắc phục khuyết tật này và đảm bảo tính hiệu quả của các ước lượng, nghiên cứu áp dụng phương pháp Bình phương tối thiểu tổng quát khả thi (Feasible Generalized Least Squares – FGLS). Phương pháp này cho phép điều chỉnh trọng số cho từng quan sát, giúp ước lượng thu được không chệch và hiệu quả hơn so với OLS trong trường hợp phương sai sai số thay đổi.

# Nạp thư viện
library(nlme)
# Mô hình GLS (giả sử phương sai phụ thuộc vào SIZE)
# Mô hình FGLS (hoặc GLS)
FGLS <- gls(ROA ~ SIZE + CIR + LIQ + TAX,
            data = data,
            weights = varExp(form = ~ SIZE))
summary(FGLS)
## Generalized least squares fit by REML
##   Model: ROA ~ SIZE + CIR + LIQ + TAX 
##   Data: data 
##      AIC    BIC logLik
##   -68.98 -56.03  41.49
## 
## Variance function:
##  Structure: Exponential of variance covariate
##  Formula: ~SIZE 
##  Parameter estimates:
##   expon 
## -0.1388 
## 
## Coefficients:
##              Value Std.Error t-value p-value
## (Intercept) -6.003    1.2760  -4.704  0.0000
## SIZE         0.202    0.0364   5.553  0.0000
## CIR         -0.823    0.2438  -3.375  0.0015
## LIQ          0.843    0.3119   2.702  0.0095
## TAX         -0.367    0.1214  -3.019  0.0041
## 
##  Correlation: 
##      (Intr) SIZE   CIR    LIQ   
## SIZE -0.998                     
## CIR  -0.323  0.266              
## LIQ  -0.733  0.729  0.104       
## TAX   0.063 -0.070 -0.205 -0.252
## 
## Standardized residuals:
##      Min       Q1      Med       Q3      Max 
## -2.46147 -0.49435 -0.03683  0.41102  2.90997 
## 
## Residual standard error: 9.973 
## Degrees of freedom: 52 total; 47 residual

Nhận xét

Sau khi khắc phục hiện tượng phương sai sai số thay đổi bằng phương pháp Bình phương tối thiểu tổng quát khả thi (FGLS), mô hình cho kết quả ước lượng như sau:

  • Hệ số chặn (Intercept) = −6.003, có p-value = 0.0000 < 0.01, cho thấy hệ số này có ý nghĩa thống kê cao.

  • Biến SIZE có hệ số 0.202, với p-value = 0.0000 < 0.01, mang dấu dương và có ý nghĩa thống kê, chứng tỏ quy mô ngân hàng có tác động cùng chiều và mạnh đến tỷ suất sinh lợi (ROA). Khi quy mô ngân hàng tăng lên, ROA tăng tương ứng, phù hợp với kỳ vọng lý thuyết.

  • Biến CIR có hệ số −0.823, với p-value = 0.0015 < 0.01, mang dấu âm và có ý nghĩa thống kê, cho thấy tỷ lệ chi phí hoạt động tăng sẽ làm giảm ROA. Điều này phản ánh việc quản lý chi phí hoạt động hiệu quả là yếu tố quan trọng nâng cao lợi nhuận.

  • Biến LIQ có hệ số 0.843, với p-value = 0.0095 < 0.05, mang dấu dương, thể hiện rằng tỷ lệ tài sản thanh khoản tăng giúp ROA tăng, tức ngân hàng có khả năng thanh toán tốt hơn sẽ đạt hiệu quả sinh lợi cao hơn.

  • Biến TAX có hệ số −0.367, với p-value = 0.0041 < 0.01, mang dấu âm và có ý nghĩa thống kê, cho thấy chi phí thuế cao làm giảm hiệu quả sinh lợi của ngân hàng.

Về tổng thể, các biến trong mô hình đều có ý nghĩa thống kê và dấu tác động phù hợp với giả thuyết ban đầu, khẳng định mô hình FGLS đã khắc phục được khuyết tật phương sai sai số thay đổi. Các hệ số ước lượng trở nên ổn định hơn và tin cậy hơn so với mô hình OLS ban đầu.

Vậy phương pháp FGLS đã cải thiện chất lượng mô hình hồi quy, giúp các ước lượng trở nên hiệu quả và phản ánh đúng mối quan hệ giữa các yếu tố nội tại (SIZE, CIR, LIQ, TAX) và tỷ suất sinh lợi (ROA) của Ngân hàng TMCP Quân Đội. Mô hình sau khi hiệu chỉnh cho thấy các kết quả phù hợp về mặt kinh tế học lẫn thống kê, chứng minh FGLS là lựa chọn thích hợp trong trường hợp mô hình OLS vi phạm giả định phương sai sai số thay đổi.

7.1 Kiểm định lại xem mô hình còn phương sai sai số thay đổi hay không (Breusch–Pagan)

Sử dụng kiểm định Breusch–Pagan để kiểm tra hiện tượng phương sai sai số thay đổi trong mô hình.

Giả thuyết kiểm định:

  • H₀: Mô hình không có hiện tượng phương sai sai số thay đổi
  • H₁: Mô hình có hiện tượng phương sai sai số thay đổi
library(lmtest)

# Lấy phần dư của mô hình FGLS
resid_fgls <- residuals(FGLS, type = "normalized")

# Chạy kiểm định Breusch–Pagan lại
bptest(resid_fgls ~ SIZE + CIR + LIQ + TAX, data = data)
## 
##  studentized Breusch-Pagan test
## 
## data:  resid_fgls ~ SIZE + CIR + LIQ + TAX
## BP = 5.2, df = 4, p-value = 0.3

Nhận xét

BP= 5.2, p-value= 0.3 > 0.05 (mức ý nghĩa được chọn), chưa đủ cơ sở bác bỏ H₀. Vậy mô hình không xảy ra hiện tượng phương sai sai số thay đổi.

8 DỰ BÁO CHO TOÀN MẪU DỮ LIỆU HIỆN CÓ

# DỰ BÁO CHO TOÀN MẪU DỮ LIỆU HIỆN CÓ

# 1️⃣ Tạo bộ dữ liệu mới để dự báo
newdata <- data.frame(
  SIZE = c(33.5, 34.2),
  CIR  = c(0.38, 0.40),
  LIQ  = c(0.17, 0.15),
  TAX  = c(0.29, 0.31)
)

# 2️⃣ Dự báo ROA cho các trường hợp này
pred <- predict(OLS, newdata = newdata, interval = "prediction", level = 0.95)

# 3️⃣ Trình bày bảng kết quả
library(knitr)
library(kableExtra)

pred_table <- cbind(newdata, round(pred, 4))
kable(pred_table,
      caption = "Bảng: Dự báo tỷ suất sinh lợi (ROA) cho các kịch bản giả định") %>%
  kable_styling(full_width = FALSE, position = "center")
Bảng: Dự báo tỷ suất sinh lợi (ROA) cho các kịch bản giả định
SIZE CIR LIQ TAX round(pred, 4)
33.5 0.38 0.17 0.29 0.4910
34.2 0.40 0.15 0.31 0.5939

Nhận xét:

Dựa vào kết quả trong bảng trên, ta có:

Với kịch bản thứ nhất, khi quy mô ngân hàng (SIZE = 33.5), tỷ lệ chi phí hoạt động (CIR = 0.38), tỷ lệ thanh khoản (LIQ = 0.17) và tỷ lệ chi phí thuế (TAX = 0.29), mô hình dự báo tỷ suất sinh lợi (ROA) trung bình đạt 0.4910, với khoảng dự báo 95% dao động từ 0.2904 đến 0.6916. Điều này cho thấy ROA có khả năng nằm trong khoảng 0.29% đến 0.69% khi các yếu tố nội tại được duy trì ở mức này.

Với kịch bản thứ hai, khi quy mô ngân hàng tăng lên (SIZE = 34.2) cùng với việc chi phí hoạt động (CIR) và chi phí thuế (TAX) tăng nhẹ, tỷ suất sinh lợi (ROA) dự báo trung bình 0.5939, với khoảng dự báo 95% từ 0.3846 đến 0.8033. Điều này cho thấy ROA dự kiến cao hơn so với kịch bản đầu tiên, thể hiện tác động tích cực của quy mô ngân hàng (SIZE) đối với khả năng sinh lợi, dù chi phí hoạt động và thuế có tăng nhẹ.

=> Như vậy, khi quy mô ngân hàng mở rộng, ROA có xu hướng tăng, trong khi các yếu tố chi phí hoạt động (CIR) và chi phí thuế (TAX) vẫn giữ vai trò giảm lợi nhuận nếu tăng quá mức. Khoảng dự báo khá hẹp (chênh lệch giữa lwr và upr nhỏ), chứng tỏ mô hình có độ tin cậy cao và dự báo ổn định trong phạm vi các giá trị quan sát được.

library(knitr)
library(kableExtra)

kable(head(data[, c("ROA", "ROA_pred")], 10),
      caption = "Bảng: So sánh giá trị ROA thực tế và dự báo (10 quan sát đầu tiên)") %>%
  kable_styling(full_width = FALSE)
Bảng: So sánh giá trị ROA thực tế và dự báo (10 quan sát đầu tiên)
ROA ROA_pred
1.1174 0.3002
0.3341 0.4182
0.8901 0.6742
0.5071 0.3301
1.1495 0.4663
0.6640 0.8023
0.0898 0.4592
0.9376 0.3818
0.0214 0.2015
0.0077 0.3869
library(ggplot2)

# Nếu chưa có ROA_pred thì tính thử:
data$ROA_pred <- predict(OLS_lm)

# Tạo dataframe định dạng "dài" cho ggplot
library(tidyr)
data_long <- data %>%
  mutate(QuanSat = 1:nrow(data)) %>%
  pivot_longer(cols = c(ROA, ROA_pred),
               names_to = "Loaigiatri",
               values_to = "Giatriloa")

# Vẽ biểu đồ so sánh
ggplot(data_long, aes(x = QuanSat, y = Giatriloa, color = Loaigiatri)) +
  geom_line(size = 1.2, aes(linetype = Loaigiatri)) +
  scale_color_manual(values = c("ROA" = "blue", "ROA_pred" = "red"),
                     labels = c("ROA" = "Thực tế", "ROA_pred" = "Dự báo")) +
  scale_linetype_manual(values = c("ROA" = "solid", "ROA_pred" = "dashed"),
                        labels = c("ROA" = "Thực tế", "ROA_pred" = "Dự báo")) +
  labs(
    title = "So sánh giá trị ROA thực tế và dự báo cho toàn bộ mẫu dữ liệu",
    x = "Quan sát (Quý)",
    y = "Tỷ suất sinh lợi (ROA)",
    color = "Chú thích",
    linetype = "Chú thích"
  ) +
  theme_minimal(base_family = "Times New Roman") +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold"),
    legend.position = "bottom"
  )

Nhận xét

Quan sát Hình trên cho thấy đường ROA thực tế (màu xanh) và đường ROA dự báo (màu đỏ, nét đứt) có xu hướng biến động tương đồng qua các quý. Mặc dù ROA thực tế dao động mạnh hơn do chịu tác động của các yếu tố ngẫu nhiên và biến động ngắn hạn, song đường dự báo vẫn bám sát tương đối tốt xu hướng chung của dữ liệu thực tế.

Cụ thể:

  • Các đỉnh và đáy của hai đường xuất hiện gần như cùng thời điểm, phản ánh mô hình có khả năng mô phỏng tốt xu hướng biến động của tỷ suất sinh lợi theo thời gian.

  • Biên độ dao động của đường dự báo nhỏ hơn đường thực tế, cho thấy mô hình có xu hướng làm mượt các biến động cực đoan, điều này là hợp lý trong bối cảnh dự báo trung bình của hồi quy tuyến tính.

  • Sai lệch giữa giá trị thực tế và dự báo không lớn, cho thấy mô hình có độ phù hợp tương đối cao và có thể sử dụng để ước lượng xu hướng ROA trong tương lai với độ tin cậy chấp nhận được.

Vậy biểu đồ cho thấy mô hình OLS ước lượng có khả năng giải thích và dự báo tốt sự biến động của tỷ suất sinh lợi (ROA) của Ngân hàng TMCP Quân Đội trong giai đoạn nghiên cứu. Đường dự báo bám sát đường thực tế chứng tỏ mô hình phù hợp, không có sai lệch hệ thống đáng kể và có thể được sử dụng trong các phân tích tiếp theo.