1 Nghiên cứu bộ dữ liệu từ Worldbank:

1.1 Tổng thể bộ dữ liệu

  • Trước hết, phải tải bộ dữ liệu, gọi nó lên
options(repos = c(CRAN = "http://cran.rstudio.com/"))
install.packages("WDI")
## package 'WDI' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\DELL\AppData\Local\Temp\Rtmp67sKf1\downloaded_packages
library(WDI)
library(dplyr)
library(ggplot2)
library(DT)
  • Tiếp đến, tiến hành chọn vùng dữ liệu, cụ thể sẽ là tỉ lệ trẻ sơ sinh tử vong ở Việt Nam
health_data <- WDI(country = "VN", indicator = "SH.DYN.NMRT", start = 2000, end = 2020)
datatable(health_data)
  • Dữ liệu Health_data được rút trích này nói về về tỷ lệ tử vong sơ sinh được tính toán bằng cách thu thập thông tin về số lượng trẻ em chết trong năm đầu tiên của cuộc sống và số lượng trẻ em sinh sống tại Việt Nam trong cùng một năm. Tỷ lệ tử vong sơ sinh được tính bằng cách chia số trẻ em chết trong năm đầu tiên của cuộc sống cho số trẻ em sinh sống và nhân với 1.000.
  • Bộ dữ liệu này có sự hợp tác với các tổ chức quốc tế như WHO hoặc UNICEF, đặc biệt là bộ y tế để cung cấp và cập nhật dữ liệu về tỷ lệ tử vong sơ sinh tại Việt Nam.

1.2 Nghiên cứu bộ dữ liệu

  • Tiến hành phân tích tỷ lệ tử vong của trẻ sơ sinh qua các năm
ft_data <- health_data %>%
  filter(year >= 2010 & year <= 2020) 
ggplot(ft_data, aes(x = factor(year), y = SH.DYN.NMRT)) +
  geom_bar(stat = "identity", fill = "skyblue") +
  geom_text(aes(label = SH.DYN.NMRT), vjust = 1, color = 'red') +
  labs(title = "Tỷ lệ tử vong sơ sinh tại Việt Nam theo từng năm",
       x = "Năm",
       y = "Tỷ lệ tử vong sơ sinh") +
  theme_minimal()

  • Nhìn chung ta có thể thấy qua các năm, tỷ lệ tử vong của trẻ sơ sinh tại việt Nam có sự giảm dần đều. Chính phủ, xã hội, con người ngày càng tiến bộ, có sự cải thiện, cụ thể:
  • Cải thiện được việc chăm sóc sức khỏe mẹ và trẻ sơ sinh: Việc cải thiện chất lượng dịch vụ chăm sóc sức khỏe cho phụ nữ mang thai và trẻ sơ sinh, cũng như việc tăng cường kiến thức và nhận thức về sức khỏe trong cộng đồng, có thể giúp phát hiện và điều trị các vấn đề sức khỏe sớm hơn, giảm nguy cơ tử vong sơ sinh.
  • Tiếp cận dịch vụ chăm sóc sức khỏe từ những cùng sâu xa, nông thôn hẻo lánh nhất: Cải thiện tiếp cận của cộng đồng đến dịch vụ chăm sóc sức khỏe mẹ và trẻ em, đặc biệt là ở các khu vực nông thôn hoặc có điều kiện kém, có thể giảm tỷ lệ tử vong sơ sinh bằng cách cung cấp dịch vụ chăm sóc chất lượng và kịp thời.
  • Chính sách và chiến lược y tế được đưa vào: Các chính sách và chiến lược y tế như việc tăng cường hệ thống y tế, cải thiện cơ sở hạ tầng y tế và nâng cao năng lực của nhân viên y tế góp phần vào việc giảm tỷ lệ tử vong sơ sinh.
  • Giáo dục và nhận thức được tăng cường: Các chương trình giáo dục và tăng cường nhận thức về sức khỏe mẹ và trẻ sơ sinh có thể giúp tăng cường kiến thức và nhận thức về các biện pháp phòng ngừa và điều trị, từ đó giảm nguy cơ tử vong sơ sinh.

2 Nghiên cứu bộ dữ liệu của IMF

2.1 Tổng quan bộ dữ liệu

  • Trước hết, phải tải về gói dữ liệu gốc và gọi nó lên để làm việc
install.packages("imf.data")
## Installing package into 'C:/Users/DELL/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'imf.data' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\DELL\AppData\Local\Temp\Rtmp67sKf1\downloaded_packages
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ lubridate 1.9.3     ✔ tibble    3.2.1
## ✔ purrr     1.0.2     ✔ tidyr     1.3.0
## ✔ readr     2.1.5
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(imf.data)
  • Bộ dữ liệu trong IMF (Quỹ Tiền tệ Quốc tế) có thể chứa nhiều loại thông tin về kinh tế và tài chính của các quốc gia trên thế giới. Các bộ dữ liệu này thường bao gồm các chỉ số kinh tế như GDP, lạm phát, tỷ lệ thất nghiệp, chỉ số sản xuất công nghiệp, dữ liệu thương mại như giá trị xuất khẩu và nhập khẩu hàng hóa, dữ liệu về tài chính như dư nợ công, dữ liệu về tỷ giá hối đoái, và nhiều thông tin khác.

  • Cụ thể, IMF cung cấp các bộ dữ liệu như Direction of Trade Statistics (DOTS), International Financial Statistics (IFS), Balance of Payments Statistics (BOPS), và Government Finance Statistics (GFS), giúp người dùng theo dõi và phân tích các xu hướng và biến động trong nền kinh tế toàn cầu và các quốc gia cụ thể.

2.2 Nghiên cứu bộ dữ liệu

  • Tiến hành lọc bộ dữ liệu, lấy ra thông tin cơ bản về giáo dục trong ‘CPI’
tmp <- load_datasets('CPI')
chi_so <- tmp$get_series(freq = 'A', ref_area = 'VN', indicator = 'PCPIED_IX', start = 2000, end = 2023)
chi_so <- na.omit(chi_so)
names(chi_so) <- c('Nam','NamGoc','Chisogiaca')
datatable(chi_so)
  • Bảng dữ liệu hiện ra cung cấp thông tin về mức độ biến động của giá cả trong các lĩnh vực giáo dục và y tế so với chỉ số giá tiêu dùng tổng quát.
 chi_so <- chi_so %>% 
  mutate(Chisogiaca = as.numeric(Chisogiaca)) %>%
  mutate(Chisogiaca = round(Chisogiaca, 2)) %>%
  arrange(Chisogiaca)
chi_so <- subset(chi_so, Nam >= 2013 & Nam <= 2023)
ggplot(chi_so, aes(x = Nam, y = Chisogiaca)) +
  geom_point() +
  labs(title = "Chỉ số PCPIED_IX tại Việt Nam (2013-2023)",
       x = "Năm",
       y = "Chỉ số giá cả") +
  theme_minimal()

  • chỉ số PCPIED_IX tăng qua các năm và được mô tả có liên quan đến giáo dục, điều này có thể ám chỉ rằng chi phí giáo dục đang tăng theo thời gian. Điều này có thể đồng nghĩa với việc đầu tư vào giáo dục đang tăng lên, có thể là do chính sách công cộng, sự tăng trưởng kinh tế hoặc nhu cầu của xã hội. Sự tăng của chỉ số này có thể ảnh hưởng đến sự tiếp cận và chất lượng giáo dục, cũng như phản ánh mức độ quan tâm và đầu tư vào nguồn lực giáo dục của một quốc gia.
---
title: "Nhiệm vụ 6"
author: "Diệp Mai Gia Đam"
date: "`r format(Sys.time(), '%H:%M:%S, %d - %m - %Y')`"
output:
  html_document: 
    code_download: true
    code_folding: hide
    toc_float: true
    toc: true
    highlight: tango
    theme: sandstone
    number_sections: true
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```

# **Nghiên cứu bộ dữ liệu từ Worldbank:**

## **Tổng thể bộ dữ liệu**
 - Trước hết, phải tải bộ dữ liệu, gọi nó lên

```{r message = FALSE, warning = FALSE}
options(repos = c(CRAN = "http://cran.rstudio.com/"))
install.packages("WDI")
library(WDI)
library(dplyr)
library(ggplot2)
library(DT)
```

 - Tiếp đến, tiến hành chọn vùng dữ liệu, cụ thể sẽ là tỉ lệ trẻ sơ sinh tử vong ở Việt Nam

```{r message = TRUE, warning = FALSE}
health_data <- WDI(country = "VN", indicator = "SH.DYN.NMRT", start = 2000, end = 2020)
datatable(health_data)
```

 - Dữ liệu *Health_data* được rút trích này nói về về tỷ lệ tử vong sơ sinh được tính toán bằng cách thu thập thông tin về số lượng trẻ em chết trong năm đầu tiên của cuộc sống và số lượng trẻ em sinh sống tại *Việt Nam* trong cùng một năm. Tỷ lệ tử vong sơ sinh được tính bằng cách chia số trẻ em chết trong năm đầu tiên của cuộc sống cho số trẻ em sinh sống và nhân với 1.000.
 - Bộ dữ liệu này có sự hợp tác với các tổ chức quốc tế như WHO hoặc UNICEF, đặc biệt là bộ y tế để cung cấp và cập nhật dữ liệu về tỷ lệ tử vong sơ sinh tại Việt Nam.
  
## **Nghiên cứu bộ dữ liệu**
 - Tiến hành phân tích tỷ lệ tử vong của trẻ sơ sinh qua các năm
 
```{r message = TRUE, warning = FALSE}
ft_data <- health_data %>%
  filter(year >= 2010 & year <= 2020) 
ggplot(ft_data, aes(x = factor(year), y = SH.DYN.NMRT)) +
  geom_bar(stat = "identity", fill = "skyblue") +
  geom_text(aes(label = SH.DYN.NMRT), vjust = 1, color = 'red') +
  labs(title = "Tỷ lệ tử vong sơ sinh tại Việt Nam theo từng năm",
       x = "Năm",
       y = "Tỷ lệ tử vong sơ sinh") +
  theme_minimal()
```

 - Nhìn chung ta có thể thấy qua các năm, tỷ lệ tử vong của trẻ sơ sinh tại việt Nam có sự giảm dần đều. Chính phủ, xã hội, con người ngày càng tiến bộ, có sự cải thiện, cụ thể:
  - Cải thiện được việc chăm sóc sức khỏe mẹ và trẻ sơ sinh: Việc cải thiện chất lượng dịch vụ chăm sóc sức khỏe cho phụ nữ mang thai và trẻ sơ sinh, cũng như việc tăng cường kiến thức và nhận thức về sức khỏe trong cộng đồng, có thể giúp phát hiện và điều trị các vấn đề sức khỏe sớm hơn, giảm nguy cơ tử vong sơ sinh.
 - Tiếp cận dịch vụ chăm sóc sức khỏe từ những cùng sâu xa, nông thôn hẻo lánh nhất: Cải thiện tiếp cận của cộng đồng đến dịch vụ chăm sóc sức khỏe mẹ và trẻ em, đặc biệt là ở các khu vực nông thôn hoặc có điều kiện kém, có thể giảm tỷ lệ tử vong sơ sinh bằng cách cung cấp dịch vụ chăm sóc chất lượng và kịp thời.
 - Chính sách và chiến lược y tế được đưa vào: Các chính sách và chiến lược y tế như việc tăng cường hệ thống y tế, cải thiện cơ sở hạ tầng y tế và nâng cao năng lực của nhân viên y tế  góp phần vào việc giảm tỷ lệ tử vong sơ sinh.
 - Giáo dục và nhận thức được tăng cường: Các chương trình giáo dục và tăng cường nhận thức về sức khỏe mẹ và trẻ sơ sinh có thể giúp tăng cường kiến thức và nhận thức về các biện pháp phòng ngừa và điều trị, từ đó giảm nguy cơ tử vong sơ sinh.
 
# **Nghiên cứu bộ dữ liệu của IMF**
## **Tổng quan bộ dữ liệu**

 - Trước hết, phải tải về gói dữ liệu gốc và gọi nó lên để làm việc
 
```{r message = TRUE, warning = FALSE}
install.packages("imf.data")
library(tidyverse)
library(imf.data)
```

 - Bộ dữ liệu trong IMF (Quỹ Tiền tệ Quốc tế) có thể chứa nhiều loại thông tin về kinh tế và tài chính của các quốc gia trên thế giới. Các bộ dữ liệu này thường bao gồm các chỉ số kinh tế như GDP, lạm phát, tỷ lệ thất nghiệp, chỉ số sản xuất công nghiệp, dữ liệu thương mại như giá trị xuất khẩu và nhập khẩu hàng hóa, dữ liệu về tài chính như dư nợ công, dữ liệu về tỷ giá hối đoái, và nhiều thông tin khác.

 - Cụ thể, IMF cung cấp các bộ dữ liệu như Direction of Trade Statistics (DOTS), International Financial Statistics (IFS), Balance of Payments Statistics (BOPS), và Government Finance Statistics (GFS), giúp người dùng theo dõi và phân tích các xu hướng và biến động trong nền kinh tế toàn cầu và các quốc gia cụ thể.
 
## **Nghiên cứu bộ dữ liệu**
 - Tiến hành lọc bộ dữ liệu, lấy ra *thông tin cơ bản về giáo dục trong 'CPI'*
 
```{r message = TRUE, warning = FALSE}
tmp <- load_datasets('CPI')
chi_so <- tmp$get_series(freq = 'A', ref_area = 'VN', indicator = 'PCPIED_IX', start = 2000, end = 2023)
chi_so <- na.omit(chi_so)
names(chi_so) <- c('Nam','NamGoc','Chisogiaca')
datatable(chi_so)
```

 - Bảng dữ liệu hiện ra cung cấp *thông tin về mức độ biến động của giá cả* trong các lĩnh vực giáo dục và y tế so với chỉ số giá tiêu dùng tổng quát. 
 
```{r message = TRUE, warning = FALSE}
 chi_so <- chi_so %>% 
  mutate(Chisogiaca = as.numeric(Chisogiaca)) %>%
  mutate(Chisogiaca = round(Chisogiaca, 2)) %>%
  arrange(Chisogiaca)
chi_so <- subset(chi_so, Nam >= 2013 & Nam <= 2023)
ggplot(chi_so, aes(x = Nam, y = Chisogiaca)) +
  geom_point() +
  labs(title = "Chỉ số PCPIED_IX tại Việt Nam (2013-2023)",
       x = "Năm",
       y = "Chỉ số giá cả") +
  theme_minimal()
```

 - chỉ số PCPIED_IX tăng qua các năm và được mô tả có liên quan đến giáo dục, điều này có thể ám chỉ rằng chi phí giáo dục đang tăng theo thời gian. Điều này có thể đồng nghĩa với việc đầu tư vào giáo dục đang tăng lên, có thể là do chính sách công cộng, sự tăng trưởng kinh tế hoặc nhu cầu của xã hội. Sự tăng của chỉ số này có thể ảnh hưởng đến sự tiếp cận và chất lượng giáo dục, cũng như phản ánh mức độ quan tâm và đầu tư vào nguồn lực giáo dục của một quốc gia.


 
 