Dữ liệu các trường hợp Đậu mùa khỉ được lấy từ tài nguyên Github. Dữ liệu ở đây được cập nhật hàng ngày và có bản báo cáo tóm tắt cập nhật tình hình Monkeypox.
License and attribution:
This repository and data exports (except files in the ecdc folder) are published under the CC BY 4.0 license.
Please cite as: “Global.health Monkeypox (accessed on YYYY-MM-DD)”
&
Kraemer, Tegally, Pigott, Dasgupta, Sheldon, Wilkinson, Schultheiss, et al. Tracking the 2022 Monkeypox Outbreak with Epidemiological Data in Real-Time. The Lancet Infectious Diseases. https://doi.org/10.1016/S1473-3099(22)00359-0.
Theo CHẨN ĐOÁN
## # A tibble: 4 × 2
## # Groups: Status [4]
## Status n
## <chr> <int>
## 1 confirmed 27588
## 2 suspected 2419
## 3 discarded 350
## 4 omit_error 280
Theo Quốc gia
## # A tibble: 110 × 2
## # Groups: Country [110]
## Country n
## <chr> <int>
## 1 United States 7324
## 2 Spain 5128
## 3 Germany 2887
## 4 England 2551
## 5 Democratic Republic Of The Congo 2266
## 6 France 2255
## 7 Brazil 1760
## 8 Canada 985
## 9 Netherlands 957
## 10 Portugal 710
## 11 Italy 554
## 12 Belgium 482
## 13 Nigeria 357
## 14 Peru 342
## 15 Switzerland 316
## 16 Israel 162
## 17 Austria 160
## 18 Sweden 111
## 19 Denmark 108
## 20 Ireland 97
## # … with 90 more rows
## # ℹ Use `print(n = ...)` to see more rows
Theo Giới tính
## # A tibble: 5 × 2
## # Groups: Gender [5]
## Gender n
## <chr> <int>
## 1 <NA> 28744
## 2 male 1854
## 3 Male 20
## 4 female 18
## 5 Female 1
Giới tính đã gộp
## # A tibble: 3 × 2
## # Groups: Gender_new [3]
## Gender_new n
## <chr> <int>
## 1 <NA> 28744
## 2 male 1874
## 3 female 19
Theo thời gian
Sử dụng hàm pipe, filter, group_by, count, “ungroup”, slice, pull
## <ggproto object: Class FacetWrap, Facet, gg>
## compute_layout: function
## draw_back: function
## draw_front: function
## draw_labels: function
## draw_panels: function
## finish_data: function
## init_scales: function
## map_data: function
## params: list
## setup_data: function
## setup_params: function
## shrink: TRUE
## train_scales: function
## vars: function
## super: <ggproto object: Class FacetWrap, Facet, gg>
Cần cài đặt package “maps”, “unique”, “setdiff”,
Tạo ra bảng 2 biến: Quốc gia và tổng số ca mắc tích luỹ
Load dữ liệu không gian “hành chính” của bản đồ thế giới
Kiểm tra sự khác biệt về mã hoá code tên Quốc gia / states bằng lệnh unique
Kiểm tra sự khác biệt về tên Quốc gia trong 2 bộ dữ liệu để matching lại khớp nhau trước khi join
## [1] "United States" "England"
## [3] "Democratic Republic Of The Congo" "Scotland"
## [5] "Wales" "Northern Ireland"
## [7] "Gibraltar" "Bosnia And Herzegovina"
Kết quả cho thấy có 8 sự khác biệt trong các tên Quốc gia: Ví dụ ở bộ ĐMK thì ghi là “United States” - trong khi bộ dữ liệu hành chính TG thì ghi là “USA”
Việc tiếp theo cần làm là “matching” lại cho khớp, cần sử dụng package “stringr” và str_detect
## [1] "England" "Scotland" "Wales" "Northern Ireland"
## [5] "Gibraltar"
Đầu tiên thực hiện matching 3 QG thuộc UK: Scotland; Wales, và Northern Ireland:
## [1] "England" "Gibraltar"
Kết quả cho thấy còn 2 sự khác biệt: “England” và “Gibraltar”
## [1] "Gibraltar"
Kết quả cho thấy chỉ còn 1 sự khác biệt: “Gibratar” –> Cần đổi ở bộ dataframe “total_cases_nation”
## character(0)
Vẽ bản đồ phiên bản đẹp hơn
Đọc thêm tại đây về cách vẽ bản đồ đẹp hơn với ggplot2
Sử dụng package “viridis” và mã màu “#f5f5f2”