Giới thiệu

Nhóm chọn tốc độ tăng trưởng kinh tế của Việt Nam, đơn vị %, làm đối tượng cho bài viết của nhóm. Dữ liệu này, theo năm, lấy từ Worldbank data, thời gian 1990 - 2023. Nhóm xem xét giá trị của GDP growth Việt Nam, kiểm tra tính dừng của dữ liệu, thực hiện mô hình ARMA, rồi dùng mô hình để dự báo GDP growth Việt Nam cho các năm 2025, 2026, và 2027. Dưới đây là đoạn mã R nhóm dùng để lấy dữ liệu từ Worldbank data, và chuyển dữ liệu thành chuỗi thời gian.

library(WDI)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tseries)
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
# Tải dữ liệu GDP tăng trưởng thực của Việt Nam (%)
data <- WDI(country = "VNM", 
            indicator = "NY.GDP.MKTP.KD.ZG", 
            start = 1990, end = 2023)

# Đổi tên biến GDP thành Y
data <- data %>% rename(Y = NY.GDP.MKTP.KD.ZG)

# Tạo chuỗi thời gian
Y_ts <- ts(data$Y, start = 1990, frequency = 1)

# In ra chuỗi
print(Y_ts)
## Time Series:
## Start = 1990 
## End = 2023 
## Frequency = 1 
##  [1] 5.065024 8.537500 2.553729 2.865413 7.359263 7.465007 6.940190 6.690009
##  [9] 6.987154 6.422243 5.553511 5.504545 6.413169 6.423245 5.397898 5.661771
## [17] 7.129504 6.977955 7.547248 7.536411 6.899063 6.320821 6.192893 6.787316
## [25] 4.773587 5.764455 8.152084 9.340017 9.540480 8.838981 8.072731 8.646047
## [33] 5.960844 5.100918
## attr(,"label")
## [1] GDP growth (annual %)

Kiểm tra tính dừng

Kết qủa EViews

library(magick)
## Linking to ImageMagick 6.9.12.98
## Enabled features: cairo, freetype, fftw, ghostscript, heic, lcms, pango, raw, rsvg, webp
## Disabled features: fontconfig, x11
img <- image_read("C:/Users/GIA HAN/Downloads/z6879540853431_0e2e0ef77f3b7a518cd0b72c2cc32be6.jpg")

print(img)
## # A tibble: 1 × 7
##   format width height colorspace matte filesize density
##   <chr>  <int>  <int> <chr>      <lgl>    <int> <chr>  
## 1 JPEG     825   1086 sRGB       FALSE   270772 72x72

Kết quả kiểm định ADF: Giả thuyết gốc (H₀): GDP_GROWTH không dừng.

Giả thuyết đối (H₁): GDP_GROWTH dừng.

Thống kê kiểm định Giá trị ADF t-statistic -3.757929 p-value 0.0335 Mức ý nghĩa 5% -3.568379

Kết luận: Vì t-statistic = -3.76 < -3.57 (ngưỡng 5%) và p-value = 0.0335 < 0.05, nên bác bỏ H₀ tại mức ý nghĩa 5%.

Do đó, GDP_GROWTH là một chuỗi dừng bậc 0.

Kiểm tra bằng R

# Tạo chuỗi thời gian
gdp_ts <- ts(na.omit(data$Y), start = min(data$year), frequency = 1)
library(tseries)
max_order <- 5  # Bậc tối đa
current_series <- gdp_ts  # Bắt đầu từ chuỗi gốc
stationary_found <- FALSE

for (i in 0:max_order) {
  cat("=== Kiểm định tính dừng bậc", i, "===\n")
  
  # ADF test
  test_result <- adf.test(na.omit(current_series))
  print(test_result)
  
  # Kiểm tra p-value
  if (test_result$p.value < 0.05) {
    cat("Chuỗi đã dừng ở bậc(", i, ")  mức ý nghĩa 5%.\n\n")
    stationary_found <- TRUE
    break
  } else {
    cat("Chuỗi chưa dừng ở bậc(", i, ").\n\n")
    current_series <- diff(current_series)  # Lấy sai phân cho vòng tiếp theo
  }
}
## === Kiểm định tính dừng bậc 0 ===
## 
##  Augmented Dickey-Fuller Test
## 
## data:  na.omit(current_series)
## Dickey-Fuller = -3.703, Lag order = 3, p-value = 0.0399
## alternative hypothesis: stationary
## 
## Chuỗi đã dừng ở bậc( 0 )  mức ý nghĩa 5%.
# Nếu đến bậc 5 vẫn không dừng
if (!stationary_found) {
  cat("Chuỗi không dừng đến cả bậc 5 (D(5)). Có thể dữ liệu có vấn đề hoặc cần kiểm định khác.\n")
}

Mô hình

plot(Y_ts, main = "Tăng trưởng GDP thực tế Việt Nam (1990–2023)", ylab = "%", xlab = "Năm")

Kết Luận

Kết quả kiểm định Augmented Dickey-Fuller (ADF) cho thấy chuỗi dữ liệu GDP growth của Việt Nam trong giai đoạn 1990–2023 có tính dừng tại mức ý nghĩa 5%, với p-value = 0.0335 và t-statistic = -3.76 nhỏ hơn ngưỡng tới hạn -3.568 (5%). Điều này cho phép bác bỏ giả thuyết chuỗi có nghiệm đơn vị. Như vậy, chuỗi GDP growth là chuỗi dừng, có thể sử dụng trực tiếp cho các mô hình dự báo chuỗi thời gian như ARMA, ARIMA mà không cần phải lấy sai phân thêm.