1. Nguồn dữ liệu Đậu mùa khỉ sử dụng để phân tích:

Dữ liệu các trường hợp Đậu mùa khỉ được lấy từ tài nguyên Github. Dữ liệu ở đây được cập nhật hàng ngày và có bản báo cáo tóm tắt cập nhật tình hình Monkeypox.

License and attribution:

This repository and data exports (except files in the ecdc folder) are published under the CC BY 4.0 license.

Please cite as: “Global.health Monkeypox (accessed on YYYY-MM-DD)”

&

Kraemer, Tegally, Pigott, Dasgupta, Sheldon, Wilkinson, Schultheiss, et al. Tracking the 2022 Monkeypox Outbreak with Epidemiological Data in Real-Time. The Lancet Infectious Diseases. https://doi.org/10.1016/S1473-3099(22)00359-0.

2. Kết quả phân tích

2.1. Thông tin tóm tắt tình hình dịch

Theo CHẨN ĐOÁN

## # A tibble: 4 × 2
## # Groups:   Status [4]
##   Status         n
##   <chr>      <int>
## 1 confirmed  27588
## 2 suspected   2419
## 3 discarded    350
## 4 omit_error   280

Theo Quốc gia

## # A tibble: 110 × 2
## # Groups:   Country [110]
##    Country                              n
##    <chr>                            <int>
##  1 United States                     7324
##  2 Spain                             5128
##  3 Germany                           2887
##  4 England                           2551
##  5 Democratic Republic Of The Congo  2266
##  6 France                            2255
##  7 Brazil                            1760
##  8 Canada                             985
##  9 Netherlands                        957
## 10 Portugal                           710
## 11 Italy                              554
## 12 Belgium                            482
## 13 Nigeria                            357
## 14 Peru                               342
## 15 Switzerland                        316
## 16 Israel                             162
## 17 Austria                            160
## 18 Sweden                             111
## 19 Denmark                            108
## 20 Ireland                             97
## # … with 90 more rows
## # ℹ Use `print(n = ...)` to see more rows

Theo Giới tính

## # A tibble: 5 × 2
## # Groups:   Gender [5]
##   Gender     n
##   <chr>  <int>
## 1 <NA>   28744
## 2 male    1854
## 3 Male      20
## 4 female    18
## 5 Female     1

Giới tính đã gộp

## # A tibble: 3 × 2
## # Groups:   Gender_new [3]
##   Gender_new     n
##   <chr>      <int>
## 1 <NA>       28744
## 2 male        1874
## 3 female        19

Theo thời gian

2.2. Top 12 Quốc gia có số trường hợp mắc cao nhất:

Sử dụng hàm pipe, filter, group_by, count, “ungroup”, slice, pull

## <ggproto object: Class FacetWrap, Facet, gg>
##     compute_layout: function
##     draw_back: function
##     draw_front: function
##     draw_labels: function
##     draw_panels: function
##     finish_data: function
##     init_scales: function
##     map_data: function
##     params: list
##     setup_data: function
##     setup_params: function
##     shrink: TRUE
##     train_scales: function
##     vars: function
##     super:  <ggproto object: Class FacetWrap, Facet, gg>

2.3. Vẽ bản đồ thế giới về phân bố bệnh Đậu mùa khỉ (Monkeypox map)

2.3.1. Kiểm tra thông tin sơ bộ, fix và join dữ liệu ca bệnh với dữ liệu bản đồ TG

Cần cài đặt package “maps”, “unique”, “setdiff”,

Tạo ra bảng 2 biến: Quốc gia và tổng số ca mắc tích luỹ

Load dữ liệu không gian “hành chính” của bản đồ thế giới

Kiểm tra sự khác biệt về mã hoá code tên Quốc gia / states bằng lệnh unique

Kiểm tra sự khác biệt về tên Quốc gia trong 2 bộ dữ liệu để matching lại khớp nhau trước khi join

## [1] "United States"                    "England"                         
## [3] "Democratic Republic Of The Congo" "Scotland"                        
## [5] "Wales"                            "Northern Ireland"                
## [7] "Gibraltar"                        "Bosnia And Herzegovina"

Kết quả cho thấy có 8 sự khác biệt trong các tên Quốc gia: Ví dụ ở bộ ĐMK thì ghi là “United States” - trong khi bộ dữ liệu hành chính TG thì ghi là “USA”

Việc tiếp theo cần làm là “matching” lại cho khớp, cần sử dụng package “stringr”str_detect

## [1] "England"          "Scotland"         "Wales"            "Northern Ireland"
## [5] "Gibraltar"

Đầu tiên thực hiện matching 3 QG thuộc UK: Scotland; Wales, và Northern Ireland:

## [1] "England"   "Gibraltar"

Kết quả cho thấy còn 2 sự khác biệt: “England” và “Gibraltar”

## [1] "Gibraltar"

Kết quả cho thấy chỉ còn 1 sự khác biệt: “Gibratar” –> Cần đổi ở bộ dataframe “total_cases_nation”

## character(0)

2.3.2. Vẽ bản đồ thế giới “Monkeypox”

Vẽ bản đồ phiên bản đẹp hơn

Đọc thêm tại đây về cách vẽ bản đồ đẹp hơn với ggplot2

Sử dụng package “viridis” và mã màu “#f5f5f2”

2.3.2.1. Cách 1:

2.3.2.2. Cách 2:

2.4. Châu Á