Bộ dữ liệu ’ ADO 2022_Inflation’, bao gồm nhiều biến khác nhau về sự lạm phát của các nước từ năm 2017 - 2023
Đọc dữ liệu từ file ‘ADO 2022_Inflation’
Cài đặt và tải lên gói xlsx
library(xlsx)
# Dùng câu lệnh 'read.xlsx' đọc dữ liệu từ file xlsx đưa vào R dưới dạng khung dữ liệu có tên 'dataset'
# Sử dụng 'sheetIndex = 1' để đọc trang đầu tiên. 'header = T' nếu đúng thì dòng đầu tiên được làm tên các biến
# Sử dụng 'sheetIndex = 1' để đọc trang đầu tiên. 'header = T' nếu đúng thì dòng đầu tiên được làm tên các biến
d <- read.xlsx(file.choose(), sheetIndex = 1, header = T)
d
## NA. X2017 X2018 X2019 X2020 X2021 X2022 X2023
## 1 Armenia 1.0 2.5 1.40 1.2 7.2 9 7.5
## 2 Azerbaijan 12.9 2.3 2.60 2.8 6.7 7 5.3
## 3 Georgia 6.0 2.6 4.90 5.2 9.6 7 4
## 4 Kazakhstan 7.5 6.0 5.28 6.8 8 7.8 6.4
## 5 Kyrgyz Republic 3.2 1.5 1.10 6.3 11.9 15 12
## 6 Tajikistan 6.7 5.4 8.00 9.4 8 15 10
## 7 Turkmenistan 8.0 13.2 13.00 10.0 12.5 13 10
## 8 Uzbekistan 13.7 17.5 14.60 12.9 10.7 9 8
## 9 Hong Kong, China 1.5 2.3 2.90 0.3 1.6 2.3 2
## 10 Mongolia 4.3 6.8 7.30 3.7 7.1 12.4 9.3
## 11 People's Republic of China 1.6 2.1 2.90 2.5 0.9 2.3 2
## 12 Republic of Korea 1.9 1.5 0.40 0.5 2.5 3.2 2
## 13 Taipei,China 0.6 1.3 0.60 -0.2 2 1.9 1.6
## 14 Afghanistan 5.0 0.6 2.30 5.6 5.2 … …
## 15 Bangladesh 5.4 5.8 5.50 5.7 5.6 6 5.9
## 16 Bhutan 5.0 2.6 2.80 5.6 7.4 7 5.5
## 17 India 3.6 3.4 4.80 6.2 5.4 5.8 5
## 18 Maldives 2.8 -0.1 0.20 -1.4 0.5 3 2.5
## 19 Nepal 4.5 4.2 4.60 6.2 3.6 6.5 6.2
## 20 Pakistan 4.8 4.7 6.80 10.7 8.9 11 8.5
## 21 Sri Lanka 6.6 4.3 4.30 4.6 6 13.3 6.7
## 22 Brunei Darussalam -1.3 1.0 -0.40 1.9 1.7 1.6 1
## 23 Cambodia 2.9 2.5 1.90 2.9 2.9 4.7 2.2
## 24 Indonesia 3.8 3.2 3.80 2.0 1.6 3.6 3
## 25 Lao People’s Dem. Rep. 0.8 2.0 3.30 5.1 3.7 5.8 5
## 26 Malaysia 3.8 1.0 0.70 -1.1 2.5 3 2.5
## 27 Myanmar 4.0 5.9 8.60 5.7 3.6 8 8.5
## 28 Philippines 2.9 5.2 2.40 2.4 3.9 4.2 3.5
## 29 Singapore 0.6 0.4 0.60 -0.2 2.3 3 2.3
## 30 Thailand 0.7 1.1 0.70 -0.8 1.2 3.3 2.2
## 31 Timor-Leste 0.6 2.4 1.00 0.5 3.8 2.6 2.7
## 32 Viet Nam 3.5 3.5 2.80 3.2 1.8 3.8 4
## 33 Cook Islands -0.4 0.1 0.00 0.7 2.2 4.3 4
## 34 Federated States of Micronesia 0.7 1.7 -2.60 -2.9 2 4.6 2
## 35 Fiji 3.3 4.1 1.80 -2.6 0.2 4.5 4
## 36 Kiribati 0.3 0.6 -1.80 2.3 1 5 3.7
## 37 Marshall Islands 0.0 0.8 0.10 -0.8 1 4.1 4
## 38 Nauru 5.1 0.5 4.30 0.9 1.2 2.3 2.2
## 39 Niue 5.0 10.1 1.90 2.7 ... ... ...
## 40 Palau 0.9 2.0 0.60 0.7 0.5 4.3 4.2
## 41 Papua New Guinea 5.4 4.7 3.60 4.9 4.5 6.4 5.1
## 42 Samoa 1.3 3.7 2.20 1.5 -3 8.9 3.2
## 43 Solomon Islands 0.5 3.5 1.60 3.0 -0.2 5 4
## 44 Tonga 9.4 -3.8 4.00 0.2 1.4 7.6 4.2
## 45 Tuvalu 4.1 2.2 3.50 1.6 6.7 3.8 3.3
## 46 Vanuatu 3.1 2.3 2.80 5.3 2.1 4.8 3.2
Kiểm tra xem dữ liệu có phải là data frame hay không bằng hàm ‘is.data.frame’
is.data.frame(d)
## [1] TRUE
RStudio trả về giá trị TRUE, vì vậy đối tượng dữ liệu là data frame
Sử dụng hàm ‘name’ để biết tên của các biến trong dữ liệu
names(d)
## [1] "NA." "X2017" "X2018" "X2019" "X2020" "X2021" "X2022" "X2023"
Tên của các biến lần lượt là NA,x2017,x2018,x2019,x2020,x2021,x2022 và x2023
Thực hiện đổi tên cho các biến để thuận tiện thao tác trên dữ liệu
names(d) <- c('Năm','x2017','x2018','x2019','x2020','x2021','x2022','x2023')
d
## Năm x2017 x2018 x2019 x2020 x2021 x2022 x2023
## 1 Armenia 1.0 2.5 1.40 1.2 7.2 9 7.5
## 2 Azerbaijan 12.9 2.3 2.60 2.8 6.7 7 5.3
## 3 Georgia 6.0 2.6 4.90 5.2 9.6 7 4
## 4 Kazakhstan 7.5 6.0 5.28 6.8 8 7.8 6.4
## 5 Kyrgyz Republic 3.2 1.5 1.10 6.3 11.9 15 12
## 6 Tajikistan 6.7 5.4 8.00 9.4 8 15 10
## 7 Turkmenistan 8.0 13.2 13.00 10.0 12.5 13 10
## 8 Uzbekistan 13.7 17.5 14.60 12.9 10.7 9 8
## 9 Hong Kong, China 1.5 2.3 2.90 0.3 1.6 2.3 2
## 10 Mongolia 4.3 6.8 7.30 3.7 7.1 12.4 9.3
## 11 People's Republic of China 1.6 2.1 2.90 2.5 0.9 2.3 2
## 12 Republic of Korea 1.9 1.5 0.40 0.5 2.5 3.2 2
## 13 Taipei,China 0.6 1.3 0.60 -0.2 2 1.9 1.6
## 14 Afghanistan 5.0 0.6 2.30 5.6 5.2 … …
## 15 Bangladesh 5.4 5.8 5.50 5.7 5.6 6 5.9
## 16 Bhutan 5.0 2.6 2.80 5.6 7.4 7 5.5
## 17 India 3.6 3.4 4.80 6.2 5.4 5.8 5
## 18 Maldives 2.8 -0.1 0.20 -1.4 0.5 3 2.5
## 19 Nepal 4.5 4.2 4.60 6.2 3.6 6.5 6.2
## 20 Pakistan 4.8 4.7 6.80 10.7 8.9 11 8.5
## 21 Sri Lanka 6.6 4.3 4.30 4.6 6 13.3 6.7
## 22 Brunei Darussalam -1.3 1.0 -0.40 1.9 1.7 1.6 1
## 23 Cambodia 2.9 2.5 1.90 2.9 2.9 4.7 2.2
## 24 Indonesia 3.8 3.2 3.80 2.0 1.6 3.6 3
## 25 Lao People’s Dem. Rep. 0.8 2.0 3.30 5.1 3.7 5.8 5
## 26 Malaysia 3.8 1.0 0.70 -1.1 2.5 3 2.5
## 27 Myanmar 4.0 5.9 8.60 5.7 3.6 8 8.5
## 28 Philippines 2.9 5.2 2.40 2.4 3.9 4.2 3.5
## 29 Singapore 0.6 0.4 0.60 -0.2 2.3 3 2.3
## 30 Thailand 0.7 1.1 0.70 -0.8 1.2 3.3 2.2
## 31 Timor-Leste 0.6 2.4 1.00 0.5 3.8 2.6 2.7
## 32 Viet Nam 3.5 3.5 2.80 3.2 1.8 3.8 4
## 33 Cook Islands -0.4 0.1 0.00 0.7 2.2 4.3 4
## 34 Federated States of Micronesia 0.7 1.7 -2.60 -2.9 2 4.6 2
## 35 Fiji 3.3 4.1 1.80 -2.6 0.2 4.5 4
## 36 Kiribati 0.3 0.6 -1.80 2.3 1 5 3.7
## 37 Marshall Islands 0.0 0.8 0.10 -0.8 1 4.1 4
## 38 Nauru 5.1 0.5 4.30 0.9 1.2 2.3 2.2
## 39 Niue 5.0 10.1 1.90 2.7 ... ... ...
## 40 Palau 0.9 2.0 0.60 0.7 0.5 4.3 4.2
## 41 Papua New Guinea 5.4 4.7 3.60 4.9 4.5 6.4 5.1
## 42 Samoa 1.3 3.7 2.20 1.5 -3 8.9 3.2
## 43 Solomon Islands 0.5 3.5 1.60 3.0 -0.2 5 4
## 44 Tonga 9.4 -3.8 4.00 0.2 1.4 7.6 4.2
## 45 Tuvalu 4.1 2.2 3.50 1.6 6.7 3.8 3.3
## 46 Vanuatu 3.1 2.3 2.80 5.3 2.1 4.8 3.2
Tên của các biến được thay đổi lần lượt là Năm,x2017,x2018,x2019,x2020,x2021,x2022 và x2023
Kiểm tra kích thước của data frame gồm bao nhiêu hàng và cột bằng cách sử dụng hàm ‘dim’
dim(d)
## [1] 46 8
Vậy data frame này bao gồm 46 hàng và 8 cột
Rút trích dữ liệu về lạm phát của các nước năm 2023.
Thực hiện rút trích các cột ‘Nước’ và cột ‘2023’, giữ nguyên các quan sát
# Gán dữ liệu được trích vào d1
d1 <- d[ ,c(1,7,8)]
d1
## Năm x2022 x2023
## 1 Armenia 9 7.5
## 2 Azerbaijan 7 5.3
## 3 Georgia 7 4
## 4 Kazakhstan 7.8 6.4
## 5 Kyrgyz Republic 15 12
## 6 Tajikistan 15 10
## 7 Turkmenistan 13 10
## 8 Uzbekistan 9 8
## 9 Hong Kong, China 2.3 2
## 10 Mongolia 12.4 9.3
## 11 People's Republic of China 2.3 2
## 12 Republic of Korea 3.2 2
## 13 Taipei,China 1.9 1.6
## 14 Afghanistan … …
## 15 Bangladesh 6 5.9
## 16 Bhutan 7 5.5
## 17 India 5.8 5
## 18 Maldives 3 2.5
## 19 Nepal 6.5 6.2
## 20 Pakistan 11 8.5
## 21 Sri Lanka 13.3 6.7
## 22 Brunei Darussalam 1.6 1
## 23 Cambodia 4.7 2.2
## 24 Indonesia 3.6 3
## 25 Lao People’s Dem. Rep. 5.8 5
## 26 Malaysia 3 2.5
## 27 Myanmar 8 8.5
## 28 Philippines 4.2 3.5
## 29 Singapore 3 2.3
## 30 Thailand 3.3 2.2
## 31 Timor-Leste 2.6 2.7
## 32 Viet Nam 3.8 4
## 33 Cook Islands 4.3 4
## 34 Federated States of Micronesia 4.6 2
## 35 Fiji 4.5 4
## 36 Kiribati 5 3.7
## 37 Marshall Islands 4.1 4
## 38 Nauru 2.3 2.2
## 39 Niue ... ...
## 40 Palau 4.3 4.2
## 41 Papua New Guinea 6.4 5.1
## 42 Samoa 8.9 3.2
## 43 Solomon Islands 5 4
## 44 Tonga 7.6 4.2
## 45 Tuvalu 3.8 3.3
## 46 Vanuatu 4.8 3.2
Dữ liệu d1 được trích ra với 46 quan sát và 3 biến với các biến Năm,x2022 và x2023
Sử dụng hàm ‘mutate’ để tạo ra biến mới PL (Phân loại) theo điều kiện của x2020. Kết quả sẽ trả về là “T” nghĩa “Tự nhiên” hoặc “P” :“Phi mã” nếu điều kiện nhỏ hơn hoặc bằng 10 hoặc lớn hơn 10
Dùng hàm ‘ifelse’ để lựa chọn phần tử có điều kiện của x2020
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
d <- d %>% mutate(PL = ifelse(x2020 < 10,'T','P'))
d
## Năm x2017 x2018 x2019 x2020 x2021 x2022 x2023 PL
## 1 Armenia 1.0 2.5 1.40 1.2 7.2 9 7.5 T
## 2 Azerbaijan 12.9 2.3 2.60 2.8 6.7 7 5.3 T
## 3 Georgia 6.0 2.6 4.90 5.2 9.6 7 4 T
## 4 Kazakhstan 7.5 6.0 5.28 6.8 8 7.8 6.4 T
## 5 Kyrgyz Republic 3.2 1.5 1.10 6.3 11.9 15 12 T
## 6 Tajikistan 6.7 5.4 8.00 9.4 8 15 10 T
## 7 Turkmenistan 8.0 13.2 13.00 10.0 12.5 13 10 P
## 8 Uzbekistan 13.7 17.5 14.60 12.9 10.7 9 8 P
## 9 Hong Kong, China 1.5 2.3 2.90 0.3 1.6 2.3 2 T
## 10 Mongolia 4.3 6.8 7.30 3.7 7.1 12.4 9.3 T
## 11 People's Republic of China 1.6 2.1 2.90 2.5 0.9 2.3 2 T
## 12 Republic of Korea 1.9 1.5 0.40 0.5 2.5 3.2 2 T
## 13 Taipei,China 0.6 1.3 0.60 -0.2 2 1.9 1.6 T
## 14 Afghanistan 5.0 0.6 2.30 5.6 5.2 … … T
## 15 Bangladesh 5.4 5.8 5.50 5.7 5.6 6 5.9 T
## 16 Bhutan 5.0 2.6 2.80 5.6 7.4 7 5.5 T
## 17 India 3.6 3.4 4.80 6.2 5.4 5.8 5 T
## 18 Maldives 2.8 -0.1 0.20 -1.4 0.5 3 2.5 T
## 19 Nepal 4.5 4.2 4.60 6.2 3.6 6.5 6.2 T
## 20 Pakistan 4.8 4.7 6.80 10.7 8.9 11 8.5 P
## 21 Sri Lanka 6.6 4.3 4.30 4.6 6 13.3 6.7 T
## 22 Brunei Darussalam -1.3 1.0 -0.40 1.9 1.7 1.6 1 T
## 23 Cambodia 2.9 2.5 1.90 2.9 2.9 4.7 2.2 T
## 24 Indonesia 3.8 3.2 3.80 2.0 1.6 3.6 3 T
## 25 Lao People’s Dem. Rep. 0.8 2.0 3.30 5.1 3.7 5.8 5 T
## 26 Malaysia 3.8 1.0 0.70 -1.1 2.5 3 2.5 T
## 27 Myanmar 4.0 5.9 8.60 5.7 3.6 8 8.5 T
## 28 Philippines 2.9 5.2 2.40 2.4 3.9 4.2 3.5 T
## 29 Singapore 0.6 0.4 0.60 -0.2 2.3 3 2.3 T
## 30 Thailand 0.7 1.1 0.70 -0.8 1.2 3.3 2.2 T
## 31 Timor-Leste 0.6 2.4 1.00 0.5 3.8 2.6 2.7 T
## 32 Viet Nam 3.5 3.5 2.80 3.2 1.8 3.8 4 T
## 33 Cook Islands -0.4 0.1 0.00 0.7 2.2 4.3 4 T
## 34 Federated States of Micronesia 0.7 1.7 -2.60 -2.9 2 4.6 2 T
## 35 Fiji 3.3 4.1 1.80 -2.6 0.2 4.5 4 T
## 36 Kiribati 0.3 0.6 -1.80 2.3 1 5 3.7 T
## 37 Marshall Islands 0.0 0.8 0.10 -0.8 1 4.1 4 T
## 38 Nauru 5.1 0.5 4.30 0.9 1.2 2.3 2.2 T
## 39 Niue 5.0 10.1 1.90 2.7 ... ... ... T
## 40 Palau 0.9 2.0 0.60 0.7 0.5 4.3 4.2 T
## 41 Papua New Guinea 5.4 4.7 3.60 4.9 4.5 6.4 5.1 T
## 42 Samoa 1.3 3.7 2.20 1.5 -3 8.9 3.2 T
## 43 Solomon Islands 0.5 3.5 1.60 3.0 -0.2 5 4 T
## 44 Tonga 9.4 -3.8 4.00 0.2 1.4 7.6 4.2 T
## 45 Tuvalu 4.1 2.2 3.50 1.6 6.7 3.8 3.3 T
## 46 Vanuatu 3.1 2.3 2.80 5.3 2.1 4.8 3.2 T