1 Dữ liệu trên World Bank với indicator BM.GSR.GNFS.CD


1.1 Thu thập và xử lí dữ liệu

Tiến hành thu thập dữ liệu từ World Bank:

library(WDI)
library(tidyverse)

khl <- WDI(indicator = 'BM.GSR.GNFS.CD', country = c('VNM'))

Tiến hành xử lí dữ liệu:

khl <- na.omit(khl)

khl <- khl %>% select(year,BM.GSR.GNFS.CD)

names(khl) <- c('year','import')

Giải thích dữ liệu:

min(khl$year)
## [1] 1996
max(khl$year)
## [1] 2022
str(khl)
## 'data.frame':    27 obs. of  2 variables:
##  $ year  : int  2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 ...
##  $ import: num  3.71e+11 3.38e+11 2.70e+11 2.62e+11 2.46e+11 ...
##  - attr(*, "lastupdated")= chr "2024-02-21"
##  - attr(*, "label")= chr [1:63] "Imports of goods and services (BoP, current US$)" "Imports of goods and services (BoP, current US$)" "Imports of goods and services (BoP, current US$)" "Imports of goods and services (BoP, current US$)" ...
##  - attr(*, "na.action")= 'omit' Named int [1:36] 28 29 30 31 32 33 34 35 36 37 ...
##   ..- attr(*, "names")= chr [1:36] "28" "29" "30" "31" ...
  • Bộ dữ liệu nói về lượng nhập khẩu hàng hóa và dịch vụ của Việt Nam trong 1 năm được tính bằng USD hiện tại.

  • Dữ liệu được thu thập từ năm 1996 đến 2022.

  • Gồm 27 quan sát và 2 biết là yearimport

1.2 Phân tích dữ liệu bằng trực quan hóa

1.2.1 Biến động của giá trị nhập khẩu qua các năm

Ta sẽ tiến hành phân tích biến động của giá trị nhập khẩu qua việc tạo một biểu đồ

khl %>% ggplot(aes(x = year, y = import)) +
        geom_line(color = 'red') + geom_point(color = 'yellow')

  • Từ biểu đồ trên, ta có thể thấy biến động của giá trị nhập khẩu qua các năm hầu như là biến động tăng

  • Giá trị nhập khẩu có giảm nhẹ vào năm 2009 so với 2008, sau đó tăng trở lại vào 2010

1.2.2 Tốc độ thay đổi giá trị nhập khẩu qua các năm

Ta sẽ tiến hành tính toán tốc độ thay đổi của giá trị nhập khẩu qua các năm, sau đó sẽ vẽ biểu đồ cho tốc độ thay đổi đó

khl <- arrange(khl, year)

a <- length(khl$year)

b <- vector()

for(i in 1:(a-1)) {
  b[i] = (khl$import[i+1]/khl$import[i] - 1)
}  

khl1 <- data.frame(year1 = khl$year[2:a],b)  

khl1 %>% ggplot(aes(x = year1, y = b))+
          geom_line(color = 'blue') + 
          geom_point(color = 'red') +
          labs(title = 'Tốc độ thay đổi giá trị nhập khẩu hàng hóa và dịch vụ', 
             x = 'Năm', 
             y = 'Tốc độ thay đổi')

Từ biểu đồ trên, ta có thể đưa ra kết luận rằng:

  • Tốc độ thay đổi ở các năm không đều nhau

  • Ở mốc 2009, tốc độ thay đổi giảm rất nhiều so với 2008

  • Tốc độ thay đổi cao nhất ở năm 2008 với giá trị nhập khẩu tăng khoảng 0.4 lần so với năm 2007

2 Dữ liệu từ IMF với indicator PCPIM_IX

2.1 Thu thập và xử lí dữ liệu

Thu thập dữ liệu:

library(imf.data)
## Warning: package 'imf.data' was built under R version 4.3.3
tmp <- load_datasets('CPI')
lkh <- tmp$get_series(freq = 'A', ref_area = 'VN', indicator = 'PCPIM_IX')

Tiến hành xử lí dữ liệu:

lkh <- na.omit(lkh)
names(lkh) <- c('time','nam_goc','cpi_h')
lkh <- lkh %>% select(time,cpi_h)
lkh$cpi_h <- as.numeric(lkh$cpi_h)
lkh$time <- as.numeric(lkh$time)

Giải thích dữ liệu:

min(lkh$time)
## [1] 2002
max(lkh$time)
## [1] 2023
str(lkh)
## 'data.frame':    22 obs. of  2 variables:
##  $ time : num  2002 2003 2004 2005 2006 ...
##  $ cpi_h: num  13.8 15.7 17.8 18.7 19.6 ...
##  - attr(*, "na.action")= 'omit' Named int [1:52] 1 2 3 4 5 6 7 8 9 10 ...
##   ..- attr(*, "names")= chr [1:52] "1" "2" "3" "4" ...
  • Bộ dữ liệu thu thập các chỉ số giá tiêu dùng về sức khỏe,là thước đo mức độ thay đổi giá cả của các hàng hóa và dịch vụ liên quan đến sức khỏe theo thời gian.

  • Gồm 22 quan sát từ năm 2002 đến 2023

2.2 Phân tích dữ liệu bằng trực quan hóa

2.2.1 Biến động của chỉ số giá tiêu dùng sức khỏe qua các năm

Ta sẽ tiến hành phân tích biến động của chỉ số giá tiêu dùng sức khỏe qua việc tạo một biểu đồ

lkh %>% ggplot(aes(x = time, y = cpi_h)) +
        geom_line(color = 'red') +geom_point(color = 'yellow')

  • Từ biểu đồ trên, ta có thể thấy biến động chỉ số giá tiêu dùng sức khỏe hầu như tăng qua các năm.

  • Các biến động không đều nhau, có năm tăng nhiều, có năm tăng ít.

2.2.2 Tốc độ thay đổi chỉ số giá tiêu dùng sức khỏe qua các năm

Ta sẽ tiến hành tính toán tốc độ thay đổi của chỉ số giá tiêu dùng sức khỏe qua các năm, sau đó sẽ vẽ biểu đồ cho tốc độ thay đổi đó

c <- length(lkh$time)

d <- vector()

for(i in 1:(c-1)) {
  d[i] = (lkh$cpi_h[i+1]/lkh$cpi_h[i] - 1)
}  

khl2 <- data.frame(year2 = lkh$time[2:c],d)  

khl2 %>% ggplot(aes(x = year2, y = d))+
          geom_line(color = 'blue') + 
          geom_point(color = 'red') +
          labs(title = 'Tốc độ thay đổi chỉ số giá tiêu dùng cho sức khỏe', 
             x = 'Năm', 
             y = 'Tốc độ thay đổi')

Từ biểu đồ trên, ta có thể đưa ra kết luận rằng:

  • Tốc độ thay đổi ở các năm không đều nhau

  • chỉ số giá tiêu dùng cho sức khỏe chạm mốc tăng khoảng 0.45 lần ở năm 2013 so với năm 2012

  • Đến những năm từ 2020 trở đi, chỉ số giá tiêu dùng cho sức khỏe có xu hướng tăng chậm lại.