1 Giới thiệu dữ liệu

Dữ liệu về chỉ số chứng khoán vn30 và VN-index lấy từ ngày 1/1/2019 - ngày 11/10/2023

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.2.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(timeSeries)
## Warning: package 'timeSeries' was built under R version 4.2.3
## Loading required package: timeDate
## 
## Attaching package: 'timeSeries'
## The following object is masked from 'package:zoo':
## 
##     time<-
library(car)
## Warning: package 'car' was built under R version 4.2.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.3
library(readr)
## Warning: package 'readr' was built under R version 4.2.3
vni <- read_delim("C:/Users/dell/Downloads/Dữ liệu Lịch sử VN Index (1).csv", 
    delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 1193 Columns: 2
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (1): Date
## num (1): Price
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
vn30 <- read_delim("C:/Users/dell/Downloads/Dữ liệu Lịch sử VN 30.csv", 
    delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 1193 Columns: 2
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (1): Date
## num (1): Price
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Ta biến đổi dữ liệu thành dạng time series

vni.ts <- ts(vni[,2])
vn30.ts <- ts(vn30[,2])
summary(vni.ts)
##      Price       
##  Min.   : 659.2  
##  1st Qu.: 965.6  
##  Median :1056.0  
##  Mean   :1107.1  
##  3rd Qu.:1247.2  
##  Max.   :1528.6
summary(vn30.ts)
##      Price       
##  Min.   : 610.8  
##  1st Qu.: 885.5  
##  Median :1056.1  
##  Mean   :1099.7  
##  3rd Qu.:1279.8  
##  Max.   :1572.5
hg <- lm(vni.ts~vn30.ts)
show(hg)
## 
## Call:
## lm(formula = vni.ts ~ vn30.ts)
## 
## Coefficients:
## (Intercept)      vn30.ts  
##    245.1386       0.7838

2 Kiểm định Breusch-Godfrey

bgtest(vni.ts ~ vn30.ts,order=3)
## 
##  Breusch-Godfrey test for serial correlation of order up to 3
## 
## data:  vni.ts ~ vn30.ts
## LM test = 1175, df = 3, p-value < 2.2e-16

LM test (Giá trị thống kê kiểm tra LM): Đây là một giá trị thống kê kiểm tra được sử dụng để đo lường mức độ của tương quan tự nhiên (serial correlation) trong dãy thời gian “vni.ts”. Giá trị này là 1175, đại diện cho sức mạnh của tương quan tìm thấy trong dãy thời gian.

Độ tự do (df): Độ tự do là số bậc tự nhiên mà bạn đang kiểm tra tương quan. Trong trường hợp này, bạn đang kiểm tra tương quan bậc 3, nên độ tự do là 3.

Giá trị p (p-value): Giá trị p thể hiện xác suất của việc có tương quan tự nhiên bậc 3 trong dãy thời gian. Giá trị p rất nhỏ, xấp xỉ bằng không (p < 2.2e-16). Điều này cho thấy rằng có một mức tương quan tự nhiên đáng kể trong dãy thời gian “vni.ts” và việc này rất không thể xảy ra do sự ngẫu nhiên.

Kết luận: Dựa trên kết quả này, bạn có đủ bằng chứng thống kê để bác bỏ giả thuyết rằng không có tương quan tự nhiên bậc 3 trong dãy thời gian “vni.ts” dựa trên “vn30.ts”. Thay vào đó, có sự tương quan tự nhiên đáng kể và mối quan hệ này không phải do sự ngẫu nhiên.

3 Kiểm định Durbin Watson

durbinWatsonTest(hg)
##  lag Autocorrelation D-W Statistic p-value
##    1       0.9919272    0.01557429       0
##  Alternative hypothesis: rho != 0

Autocorrelation (Tương quan tự nhiên): Giá trị tương quan tự nhiên tại lag 1 là 0.9919272, gần 1. Điều này cho thấy một mức độ rất cao của tương quan tự nhiên giữa các giá trị liên tiếp. Tương quan tự nhiên cao tại lag 1 có thể chỉ ra rằng có sự tương quan giữa các quan sát gần nhau trong dãy thời gian.

D-W Statistic (Giá trị thống kê D-W): Giá trị D-W Statistic là 0.01557429, gần 0. Nếu giá trị D-W Statistic tiệm cận 0, nó cho thấy sự tương quan tự nhiên mạnh mẽ giữa các quan sát liền kề.

p-value: Giá trị p (p-value) là 0, nghĩa là giá trị D-W Statistic rất khác biệt so với giá trị 2 (một giá trị D-W Statistic thường không có tương quan tự nhiên). Cụ thể, p-value rất thấp, nên bạn có đủ bằng chứng thống kê để bác bỏ giả thuyết rằng không có tương quan tự nhiên (rho = 0) ở lag 1.

Tóm lại, kết quả này cho thấy rằng có một mức độ cao của tương quan tự nhiên và điều này không phải do sự ngẫu nhiên.