library(car)
library(timeSeries)
library(lmtest)
library(readxl)
HNX <- read_excel("C:/Users/PM09/Downloads/HNX.xlsx")
VNI <- read_excel("C:/Users/PM09/Downloads/VNI.xlsx")

1 Thông tin về dữ liệu VNI INDEX

1.1 Giới thiệu chung

VNI Index là một chỉ số tài chính và thị trường chứng khoán của Việt Nam. Tên gọi “VNI” viết tắt của “Vietnam National Index,” đề cập đến chỉ số thị trường chứng khoán quan trọng nhất và phổ biến nhất tại Việt Nam.

1.2 Nguồn gốc

Dữ liệu được lấy từ 12/07/2005 - 07/09/2023 trên trang: https://www.investing.com/indices/vn

1.3 Dữ liệu VNI Index

2 Thông tin về dữ liệu HNX Index

2.1 Giới thiệu chung

Dữ liệu HNX Index bao gồm giá cổ phiếu, biến động giá, khối lượng giao dịch, giá trị vốn hóa thị trường, và các chỉ số tài chính khác liên quan đến các công ty thành phần. Việc theo dõi chỉ số này giúp nhà đầu tư, nhà quản lý quỹ, và các chuyên gia tài chính hiểu rõ tình hình và xu hướng thị trường chứng khoán tại Hà Nội.

2.2 Nguồn gốc

Dữ liệu được lấy từ 12/07/2005 - 07/09/2023 trên trang: https://www.investing.com/indices/hnx

2.3 Dữ liệu HNX Index

show(HNX)
## # A tibble: 942 × 2
##    Date                Price
##    <dttm>              <dbl>
##  1 2023-10-08 00:00:00  236.
##  2 2023-10-01 00:00:00  230.
##  3 2023-09-24 00:00:00  236.
##  4 2023-09-17 00:00:00  243.
##  5 2023-09-10 00:00:00  253.
##  6 2023-09-03 00:00:00  256.
##  7 2023-08-27 00:00:00  250.
##  8 2023-08-20 00:00:00  243.
##  9 2023-08-13 00:00:00  236.
## 10 2023-08-06 00:00:00  245.
## # ℹ 932 more rows

3 Mô hình hồi quy

Ta sẽ chạy mô hình hồi quy của 2 dữ liệu VNI Index và HNX Index để thấy sự tương tác của 2 dữ liệu

3.1 Kết quả mô hình

vni.test <- ts(VNI[,2])
hnx.test <- ts(HNX[,2])

hq <- lm(vni.test~ hnx.test)
summary(hq)
## 
## Call:
## lm(formula = vni.test ~ hnx.test)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -377.44 -190.67   -1.17  175.37  497.22 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 378.21024   13.11709   28.83   <2e-16 ***
## hnx.test      2.35132    0.07411   31.73   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 215.6 on 940 degrees of freedom
## Multiple R-squared:  0.5171, Adjusted R-squared:  0.5166 
## F-statistic:  1007 on 1 and 940 DF,  p-value: < 2.2e-16

3.2 Giải thích kết quả

Hệ số cho biến hnx.test, cho biết mức độ tác động của biến này lên vni.test. Trong trường hợp này, hệ số là 2.35132, tức là mỗi đơn vị tăng của hnx.test, vni.test tăng khoảng 2.35132 đơn vị.

p-value: < 2.2e-16, giá trị p cho biết mức ý nghĩa của mỗi hệ số trong mô hình. Ở đây, cả hai hệ số đều rất ý nghĩa (p-value rất thấp), với giá trị p gần bằng 0 (< 0.001), nghĩa là hệ số này không ảnh hưởng đáng kể đến mô hình.

4 Kiểm tra sự tương quan của 2 dữ liệu

4.1 Kết quả kiểm định

durbinWatsonTest(hq)
##  lag Autocorrelation D-W Statistic p-value
##    1       0.9948528    0.00622759       0
##  Alternative hypothesis: rho != 0

4.2 Giải thích kết quả

Tự tương quan với độ trễ 1 là khoảng 0.9948528, cho thấy một mức độ tự tương quan mạnh với độ trễ 1. Dựa vào p-value rất nhỏ (0) và giả thuyết thay thế, có dấu hiệu mạnh cho thấy có tự tương quan đáng kể ở mức độ độ trễ 1.

5 kiểm tra Breusch-Godfrey về tương quan chuỗi

được sử dụng để kiểm tra sự tự tương quan (autocorrelation) trong một mô hình hồi quy tuyến tính.

5.1 Kết quả

bgtest(vni.test~ hnx.test, order = 3)
## 
##  Breusch-Godfrey test for serial correlation of order up to 3
## 
## data:  vni.test ~ hnx.test
## LM test = 935.21, df = 3, p-value < 2.2e-16

5.2 Giải thích kết quả

Thống kê kiểm tra LM là 935.21. Đây là một số đo lường mức độ tương quan trong dữ liệu. Giá trị này lớn hơn, cho thấy mức độ tương quan cao Giá trị p (p-value) rất nhỏ (< 2.2e-16), gần bằng 0. Điều này cho thấy rằng có sự tự tương quan đáng kể trong dữ liệu ở các mức độ lên đến 3 độ trễ. Kết quả kiểm tra Breusch-Godfrey với mức độ lên đến 3 cho thấy có sự tự tương quan đáng kể trong dữ liệu, đặc biệt ở các mức độ tương quan từ 1 đến 3 độ trễ. Điều này có thể ảnh hưởng đến tính chính xác và độ tin cậy của mô hình hồi quy tuyến tính và cần được xem xét và xử lý để cải thiện mô hình.