Nhiệm vụ 3.1 tiến hành thực hiện các thao tác đã học trên bộ dữ liệu trong file “population-and-demography.csv”. Đây là một dataset thông kê hơn 100 quốc gia trên thế giới về dân số có tuổi từ dưới 1 đến hơn 100 tuổi (bộ dữ liệu lấy mốc từ năm 1950-20221)
# Để load gói dataset từ file csv vào Rmd ta dùng lệnh: tcd <- read.csv(file.choose(), header = T)
tcd <- read.csv("C:/Users/ADMIN/Downloads/population-and-demography.csv", header = T)
datatable(tcd)
# Dùng lệnh dim() để kiểm tra bộ datasets đã chọn có bao nhiêu quan sát va
dim(tcd)
## [1] 18288 24
# Ta sủ dụng lệnh names() để thay đổi tên biến của dataset để dễ dàng thao tác
names(tcd) <- c('Name','Y','P','CU1','CU5','CU15','U25','15T64','O15','O18','P1','1T4','5T9','10T14','15T19','20T29','30T39','40T49','50T59','60T69','70T79','80T89','90T99','O100')
datatable(tcd)
Chọn ít nhất 5 quốc gia, 5 độ tuổi và tổng dân số để phân tích
# Sử dụng lệnh %>%filter để gọi ra tên 5 quốc gia trong tổng dataset lần lượt ('China','Brazil','Andorra','Singapore','Indonesia'), lệnh select() để chọn và trích xuất 5 độ tuổi (10-14 tuổi, 15-19 tuổi, 20-29 tuổi, 30-39 tuổi, 40-49 tuổi ) và tổng dân số của lần lượt 5 quốc gia đã chọn
tcd1 <- tcd%>%filter(Name == 'China'| Name == 'Brazil'|Name =='Andorra'|Name =='Singapore'|Name =='Indonesia')%>% select(Name,P,'10T14','15T19','20T29','30T39','40T49')
datatable(tcd1)
# Mã hóa dữ liệu từ dataset sao cho dữ liệu thu được chỉ hiện thị quan sát 'Name' và quốc gia hiển thị là 'China' ( từ qian sát 145-216 ), các quốc gia còn lại hiển thị là 'Not China '
t <- tcd1$Name.Coded <- ifelse(tcd1$Name == 'China','China','Not China')
t
## [1] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [7] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [13] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [19] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [25] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [31] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [37] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [43] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [49] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [55] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [61] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [67] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [73] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [79] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [85] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [91] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [97] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [103] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [109] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [115] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [121] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [127] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [133] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [139] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [145] "China" "China" "China" "China" "China" "China"
## [151] "China" "China" "China" "China" "China" "China"
## [157] "China" "China" "China" "China" "China" "China"
## [163] "China" "China" "China" "China" "China" "China"
## [169] "China" "China" "China" "China" "China" "China"
## [175] "China" "China" "China" "China" "China" "China"
## [181] "China" "China" "China" "China" "China" "China"
## [187] "China" "China" "China" "China" "China" "China"
## [193] "China" "China" "China" "China" "China" "China"
## [199] "China" "China" "China" "China" "China" "China"
## [205] "China" "China" "China" "China" "China" "China"
## [211] "China" "China" "China" "China" "China" "China"
## [217] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [223] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [229] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [235] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [241] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [247] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [253] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [259] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [265] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [271] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [277] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [283] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [289] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [295] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [301] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [307] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [313] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [319] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [325] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [331] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [337] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [343] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [349] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
## [355] "Not China" "Not China" "Not China" "Not China" "Not China" "Not China"
# Kết quả thu được sau khi mã hóa là dữ liệu hiển thị quan sát 'Name' và tên quốc gia tương ứng là Andorra-KV1, China-KV2, các quốc gia còn lại hiển thị tên bình thường
t1 <- tcd1$Name.Coded1 <- recode(tcd1$Name,Andorra = 'KV1', China = 'KV2')
t1
## [1] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [7] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [13] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [19] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [25] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [31] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [37] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [43] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [49] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [55] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [61] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [67] "KV1" "KV1" "KV1" "KV1" "KV1" "KV1"
## [73] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [79] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [85] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [91] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [97] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [103] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [109] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [115] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [121] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [127] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [133] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [139] "Brazil" "Brazil" "Brazil" "Brazil" "Brazil" "Brazil"
## [145] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [151] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [157] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [163] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [169] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [175] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [181] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [187] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [193] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [199] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [205] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [211] "KV2" "KV2" "KV2" "KV2" "KV2" "KV2"
## [217] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [223] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [229] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [235] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [241] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [247] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [253] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [259] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [265] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [271] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [277] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [283] "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia" "Indonesia"
## [289] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [295] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [301] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [307] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [313] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [319] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [325] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [331] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [337] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [343] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [349] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
## [355] "Singapore" "Singapore" "Singapore" "Singapore" "Singapore" "Singapore"
# Đổi tên các biến để dễ thao tác
names(tcd1) <- c('Name','P','TF','TN','TWN','THN','FN')
datatable(tcd1)
# Ta cần đổi lại tên biến để dễ thao tác sau đó dùng lệnh để cho ra kết quả thu được là: dân số từ 10-14 tuổi có hơn 100000 dân số sẽ hiển thị là 'Đông' còn ít hơn 100000 dân số sẽ hiển thị là 'Không đông'
names(tcd1) <- c('Name','P','TF','TN','TWN','THN','FN')
t2 <- tcd1$TF.Coded <- ifelse(tcd1$TF >= 100000, 'Đông', 'Không đông')
t2
## [1] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [6] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [11] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [16] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [21] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [26] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [31] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [36] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [41] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [46] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [51] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [56] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [61] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [66] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [71] "Không đông" "Không đông" "Đông" "Đông" "Đông"
## [76] "Đông" "Đông" "Đông" "Đông" "Đông"
## [81] "Đông" "Đông" "Đông" "Đông" "Đông"
## [86] "Đông" "Đông" "Đông" "Đông" "Đông"
## [91] "Đông" "Đông" "Đông" "Đông" "Đông"
## [96] "Đông" "Đông" "Đông" "Đông" "Đông"
## [101] "Đông" "Đông" "Đông" "Đông" "Đông"
## [106] "Đông" "Đông" "Đông" "Đông" "Đông"
## [111] "Đông" "Đông" "Đông" "Đông" "Đông"
## [116] "Đông" "Đông" "Đông" "Đông" "Đông"
## [121] "Đông" "Đông" "Đông" "Đông" "Đông"
## [126] "Đông" "Đông" "Đông" "Đông" "Đông"
## [131] "Đông" "Đông" "Đông" "Đông" "Đông"
## [136] "Đông" "Đông" "Đông" "Đông" "Đông"
## [141] "Đông" "Đông" "Đông" "Đông" "Đông"
## [146] "Đông" "Đông" "Đông" "Đông" "Đông"
## [151] "Đông" "Đông" "Đông" "Đông" "Đông"
## [156] "Đông" "Đông" "Đông" "Đông" "Đông"
## [161] "Đông" "Đông" "Đông" "Đông" "Đông"
## [166] "Đông" "Đông" "Đông" "Đông" "Đông"
## [171] "Đông" "Đông" "Đông" "Đông" "Đông"
## [176] "Đông" "Đông" "Đông" "Đông" "Đông"
## [181] "Đông" "Đông" "Đông" "Đông" "Đông"
## [186] "Đông" "Đông" "Đông" "Đông" "Đông"
## [191] "Đông" "Đông" "Đông" "Đông" "Đông"
## [196] "Đông" "Đông" "Đông" "Đông" "Đông"
## [201] "Đông" "Đông" "Đông" "Đông" "Đông"
## [206] "Đông" "Đông" "Đông" "Đông" "Đông"
## [211] "Đông" "Đông" "Đông" "Đông" "Đông"
## [216] "Đông" "Đông" "Đông" "Đông" "Đông"
## [221] "Đông" "Đông" "Đông" "Đông" "Đông"
## [226] "Đông" "Đông" "Đông" "Đông" "Đông"
## [231] "Đông" "Đông" "Đông" "Đông" "Đông"
## [236] "Đông" "Đông" "Đông" "Đông" "Đông"
## [241] "Đông" "Đông" "Đông" "Đông" "Đông"
## [246] "Đông" "Đông" "Đông" "Đông" "Đông"
## [251] "Đông" "Đông" "Đông" "Đông" "Đông"
## [256] "Đông" "Đông" "Đông" "Đông" "Đông"
## [261] "Đông" "Đông" "Đông" "Đông" "Đông"
## [266] "Đông" "Đông" "Đông" "Đông" "Đông"
## [271] "Đông" "Đông" "Đông" "Đông" "Đông"
## [276] "Đông" "Đông" "Đông" "Đông" "Đông"
## [281] "Đông" "Đông" "Đông" "Đông" "Đông"
## [286] "Đông" "Đông" "Đông" "Đông" "Đông"
## [291] "Đông" "Đông" "Đông" "Đông" "Đông"
## [296] "Đông" "Đông" "Đông" "Đông" "Đông"
## [301] "Đông" "Đông" "Đông" "Đông" "Đông"
## [306] "Đông" "Đông" "Đông" "Đông" "Đông"
## [311] "Đông" "Đông" "Đông" "Đông" "Đông"
## [316] "Đông" "Đông" "Đông" "Đông" "Đông"
## [321] "Đông" "Đông" "Đông" "Đông" "Đông"
## [326] "Đông" "Đông" "Đông" "Đông" "Đông"
## [331] "Đông" "Đông" "Đông" "Đông" "Đông"
## [336] "Đông" "Đông" "Đông" "Đông" "Đông"
## [341] "Đông" "Đông" "Đông" "Đông" "Đông"
## [346] "Đông" "Đông" "Đông" "Đông" "Đông"
## [351] "Đông" "Đông" "Đông" "Đông" "Đông"
## [356] "Đông" "Đông" "Đông" "Đông" "Đông"
# Kết quả thu được sau khi dùng lệnh là: những người có độ tuổi từ 10-14 tuổi nếu có từ hơn 100000 đến dưới 150000 dân số thì sẽ hiển thị 'Nhận' còn ngoài khoảng trên thì hiển thị 'Loại'
t3 <- tcd1$TF.Coded1 <- ifelse(tcd1$TF >= 100000 & tcd1$TF <= 150000, 'Nhận', 'Loại')
t3
## [1] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [11] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [21] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [31] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [41] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [51] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [61] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [71] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [81] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [91] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [101] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [111] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [121] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [131] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [141] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [151] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [161] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [171] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [181] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [191] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [201] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [211] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [221] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [231] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [241] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [251] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [261] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [271] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [281] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Nhận" "Nhận"
## [291] "Nhận" "Nhận" "Nhận" "Nhận" "Nhận" "Nhận" "Nhận" "Loại" "Loại" "Loại"
## [301] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [311] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [321] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [331] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [341] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
## [351] "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại" "Loại"
# Kết quả thu được sau khi dùng lệnh là: những người có độ tuổi từ 10-14 tuổi nếu có dân số nhỏ hơn 100000 thì hiển thị 'Không đông', từ 100000-200000 dân số thì hiển thị 'Đông', từ hơn 200000 dân số thì hiển thị "Quá đông'
t4 <- tcd1$TF.Coded <- case_when(tcd1$TF < 100000 ~ 'Không đông', tcd1$TF >= 100000 & tcd1$TF <= 200000 ~ 'Đông', tcd1$TF > 200000 ~ 'Quá đông')
t4
## [1] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [6] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [11] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [16] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [21] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [26] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [31] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [36] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [41] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [46] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [51] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [56] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [61] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [66] "Không đông" "Không đông" "Không đông" "Không đông" "Không đông"
## [71] "Không đông" "Không đông" "Quá đông" "Quá đông" "Quá đông"
## [76] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [81] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [86] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [91] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [96] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [101] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [106] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [111] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [116] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [121] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [126] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [131] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [136] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [141] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [146] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [151] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [156] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [161] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [166] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [171] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [176] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [181] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [186] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [191] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [196] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [201] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [206] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [211] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [216] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [221] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [226] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [231] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [236] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [241] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [246] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [251] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [256] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [261] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [266] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [271] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [276] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [281] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [286] "Quá đông" "Quá đông" "Quá đông" "Đông" "Đông"
## [291] "Đông" "Đông" "Đông" "Đông" "Đông"
## [296] "Đông" "Đông" "Đông" "Đông" "Đông"
## [301] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [306] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [311] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [316] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [321] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [326] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [331] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [336] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [341] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [346] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [351] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
## [356] "Quá đông" "Quá đông" "Quá đông" "Quá đông" "Quá đông"
# Dùng lệnh tcd1$P.Coded2 <- cut(tcd1$P,3,labels = c('Loại 1','Loại 2','Loại 3')) để chia nhóm ra thành 3 loại tương ứng như sau: 'Loại 1'-'Không đông', 'Loại 2'-'Đông', 'Loại 3'-'Quá đông'
t5 <- tcd1$P.Coded2 <- cut(tcd1$P,3,labels = c('Loại 1','Loại 2','Loại 3'))
t5
## [1] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [11] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [21] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [31] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [41] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [51] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [61] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [71] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [81] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [91] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [101] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [111] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [121] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [131] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [141] Loại 1 Loại 1 Loại 1 Loại 1 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2
## [151] Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2
## [161] Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2 Loại 2
## [171] Loại 2 Loại 2 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3
## [181] Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3
## [191] Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3
## [201] Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3
## [211] Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3 Loại 1 Loại 1 Loại 1 Loại 1
## [221] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [231] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [241] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [251] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [261] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [271] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [281] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [291] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [301] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [311] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [321] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [331] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [341] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## [351] Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1 Loại 1
## Levels: Loại 1 Loại 2 Loại 3
# Câu lệnh phân tích trong bộ dữ liệu có 5 quốc gia xuất hiện 72 lần
table(tcd1$Name)
##
## Andorra Brazil China Indonesia Singapore
## 72 72 72 72 72
# Câu lệnh thể hiện có bao nhiêu quốc gia thuộc 'Đông','Không đông','Quá đông'
table(tcd1$TF.Coded)
##
## Đông Không đông Quá đông
## 12 72 276
# Câu lệnh thể hiện có bao nhiêu quốc gia thuộc loại 1,2,3
table(tcd1$P.Coded2)
##
## Loại 1 Loại 2 Loại 3
## 288 28 44
1.Tính các đặc trưng đo lường theo độ tuổi từ 20-29 tuổi của 5 quốc gia
1.1 Sử dụng lệnh summary() để tính toán
# Lệnh summary () cho biết các thông số min, 1st Qu., median, mean, 3rd Qu., max và kết quả thu được là: ở độ tuổi từ 20-29 thì dân số thấp nhất là 724, cao nhất là 255108640, trung vị là 16466224, tứ phân vị thứ nhất là 293256, tứ phân vị thứ 3 là 41557046
b <- summary(tcd1$TWN)
b
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 724 293256 16466224 45292176 41557046 255108640
1.2 Sử dụng lệnh sum() để tính toán
# Lệnh sum () dùng để tính tổng dân số của tập dữ liệu đã chọn ra và kết quả thu được sau khi dùng lệnh là 16305183326
o <- sum(tcd1$TWN)
o
## [1] 16305183326
1.3 Sử dụng lệnh mean() để tính toán
# Lệnh mean () dùng để tính giá trị trung bình của tập dữ liệu đã chọn và kết quả thu được sau khi dùng lệnh là 45292176
b0 <- mean(tcd1$TWN,na.rm = T)
b0
## [1] 45292176
1.4 Sử dụng lệnh length() để tính toán
# Lệnh length() dùng để tính số quan sát có trong tập dữ liệu đã chọn ra và kết quả thu được là 360 phần tử
b1 <- length(tcd1$TWN)
b1
## [1] 360
1.5 Sử dụng lệnh var() để tính toán
# Lệnh var() dùng để tính phương sai của các giá trị trong tập dữ liệu đã chọn và kết quả thu được là 4.89235e+15
b2 <- var(tcd1$TWN)
b2
## [1] 4.89235e+15
1.6 Sử dụng lệnh sd() để tính toán
# Lệnh sd() dùng để tính độ lệch chuẩn của các giá trị trong tập dữ liệu đã chọn và kết quả thu được là 69945336
b3 <- sd(tcd1$TWN)
b3
## [1] 69945336
1.7 Sử dụng lệnh median() để tính toán
# Lệnh median dùng để tính giá trị trung vị của tập dữ liệu đã chọn và kết quả thu được là 16466225
b4 <- median(tcd1$TWN)
b4
## [1] 16466225
1.8 Sử dụng lệnh quantile() để tính toán
# Lệnh quantile() dùng để tính toán phân vị của tập dữ liệu đã chọn. Phân vị là giá trị chia theo phần trăm cụ thể và kết quả thu được là 25%-293255.8, 50%-16466224.5, 75%-41557046.0
b5 <- quantile(tcd1$TWN, probs = c(.25,.5,.75))
b5
## 25% 50% 75%
## 293255.8 16466224.5 41557046.0
Nhiệm vụ 3.1 tiến hành thực hiện các thao tác đã học trên bộ dữ liệu trong file “top 100 world university 2024.csv”. Datasets QS Xếp hạng là danh mục xếp hạng đại học có uy tín nhất thế giới. Bảng xếp hạng QS công bố bảng xếp hạng các trường đại học thế giới QS mỗi năm và bộ dữ liệu này chứa 100 trường đại học hàng đầu thế giới năm 2024 theo phiên bản QS Xếp hạng 2024.
# Để load gói dataset từ file csv vào Rmd ta dùng lệnh: tcd <- read.csv(file.choose(), header = T)
sc <- read.csv("C:/Users/ADMIN/Downloads/sc.csv", header = T)
datatable(sc)
dim(sc)
## [1] 105 13
# Ta sủ dụng lệnh names() để thay đổi tên biến của dataset để dễ dàng thao tác
names(sc) <- c('X','r','u','os','ar','er','fsr','cpf','ifr','isr','irn','eo','s')
datatable(sc)
Chọn ít nhất 5 trường đại học để phân tích
# Sử dụng lệnh %>%filter để gọi ra tên 10 trường đại học trong tổng dataset lần lượt ('University of Southampton','Yonsei University','Osaka University','University of Technology Sydney','ETH Zurich','Uppsala University','University of St Andrews','Brown University','Lund University','Fudan University'), lệnh select() dùng để chọn và trích xuất các biến lần lượt ('r','u','os','ar','er','fsr','cpf','ifr','isr','irn','eo','s')
library(tidyverse)
sc01 <- sc%>%filter(u =='University of Southampton'| u =='Yonsei University'| u =='Osaka University'| u =='University of Technology Sydney'| u =='ETH Zurich'| u == 'Uppsala University'| u == 'University of St Andrews'| u == 'Brown University'| u == 'Lund University'| u == 'Fudan University' )%>%
select(r,u,os,ar,er,fsr,cpf,ifr,isr,irn,eo,s)
datatable(sc01)
# Mã hóa dữ liệu từ dataset sao cho dữ liệu thu được chỉ hiện thị quan sát 'u' và trường đại học hiển thị là 'Osaka University', các trường đại học còn lại hiển thị là 'Not Osaka University'
a0 <- sc01$u.Coded <- ifelse (sc01$u == 'Osaka University','Osaka University','Not Osaka University')
a0
## [1] "Not Osaka University" "Not Osaka University" "Not Osaka University"
## [4] "Not Osaka University" "Osaka University" "Not Osaka University"
## [7] "Not Osaka University" "Not Osaka University" "Not Osaka University"
## [10] "Not Osaka University"
# Kết quả thu được sau khi mã hóa là dữ liệu hiển thị quan sát 'u' và tên các trường đại học tương ứng là ETH Zurich-KV1, Osaka University-KV2, các trường đại học còn lại hiển thị tên bình thường
a1 <- sc01$u.Coded1 <- recode(sc01$u,'ETH Zurich' = 'KV1', 'Osaka University' = 'KV2')
a1
## [1] "KV1" "Fudan University"
## [3] "Brown University" "Yonsei University"
## [5] "KV2" "University of Southampton"
## [7] "Lund University" "University of Technology Sydney"
## [9] "University of St Andrews" "Uppsala University"
# Dùng lệnh để cho ra kết quả thu được là: danh tiếng các nhà tuyển dụng trên 60 thì sẽ hiển thị 'chọn' còn dưới 60 thì hiển thị 'không chọn'
a2 <- sc01$er <- ifelse(sc01$er >= 60, 'chọn', 'Không chọn')
a2
## [1] "chọn" "chọn" "Không chọn" "chọn" "chọn"
## [6] "Không chọn" "Không chọn" "Không chọn" "chọn" "Không chọn"
# Kết quả thu được sau khi dùng lệnh là: danh tiếng học thuật của trường đại học từ 50-100 sẽ hiển thị 'nhận' còn ngoài khoảng chọn thì hiển thị 'loại'
a3 <- sc01$ar <- ifelse(sc01$ar >= 50 & sc01$ar <= 100, 'Nhận', 'Loại')
a3
## [1] "Nhận" "Nhận" "Nhận" "Nhận" "Nhận" "Nhận" "Nhận" "Loại" "Loại" "Nhận"
# Kết quả thu được sau khi dùng lệnh là: tổng số sinh viên đại học và sau đại học là người nước ngoài và dành ít nhất ba tháng tại trường đại học của bạn so với tổng số sinh viên đại học và sinh viên sau đại học nói chung, nếu có giá trị <40 'loại', từ 40-70 'xem xét', từ >70 'nhận'
a4 <- sc01$isr.Coded <- case_when(sc01$isr < 40 ~ 'Loại', sc01$isr >= 40 & sc01$isr <= 70 ~ 'Xem xét', sc01$isr > 70 ~ 'Nhận')
a4
## [1] "Nhận" "Loại" "Xem xét" "Xem xét" "Loại" "Nhận" "Nhận"
## [8] "Nhận" "Nhận" "Nhận"
# Dùng lệnh sc01$isr.Coded2 <- cut(sc01$isr,3,labels = c('Loại 1','Loại 2','Loại 3')) để chia nhóm ra thành 3 loại tương ứng như sau: 'Loại 1'-'Loại', 'Loại 2'-'Xem xét', 'Loại 3'-'Nhận'
a5 <- sc01$isr.Coded2 <- cut(sc01$isr,3,labels = c('Loại 1','Loại 2','Loại 3'))
a5
## [1] Loại 3 Loại 1 Loại 2 Loại 2 Loại 1 Loại 3 Loại 3 Loại 3 Loại 3 Loại 3
## Levels: Loại 1 Loại 2 Loại 3
table(sc01$fsr)
##
## 9 47.7 50.2 52.8 55.3 64.9 72.1 77.8 84.5 87.4
## 1 1 1 1 1 1 1 1 1 1
# Lệnh summary () cho biết các thông số min, 1st Qu., median, mean, 3rd Qu., max và kết quả thu được tương ứng sau đây
z <- summary(sc01$ifr)
z
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 19.60 85.45 96.35 80.95 98.60 100.00
1.2 Sử dụng lệnh sum() để tính toán
# Lệnh sum () dùng để tính tổng dân số của tập dữ liệu đã chọn ra và kết quả thu được sau khi dùng lệnh là 809.5
z1 <- sum(sc01$ifr)
z1
## [1] 809.5
1.3 Sử dụng lệnh mean() để tính toán
# Lệnh mean () dùng để tính giá trị trung bình của tập dữ liệu đã chọn và kết quả thu được sau khi dùng lệnh là 80.95
z2 <- mean(sc01$ifr)
z2
## [1] 80.95
1.4 Sử dụng lệnh length() để tính toán
# Lệnh length() cho biết quan sát của datasets đã chọn ra là 10 quan sát
z3 <- length(sc01$ifr)
z3
## [1] 10
1.5 Sử dụng lệnh sd() để tính toán
# Lệnh sd() dùng để tính độ lệch chuẩn của các giá trị trong tập dữ liệu đã chọn và kết quả thu được là 30.44672
z5 <- sd(sc01$ifr)
z5
## [1] 30.44672
1.6 Sử dụng lệnh median() để tính toán
# Lệnh median dùng để tính giá trị trung vị của tập dữ liệu đã chọn và kết quả thu được là 96.35
z6 <- median(sc01$ifr)
z6
## [1] 96.35
1.7 Sử dụng lệnh quantile() để tính toán
# Lệnh quantile() dùng để tính toán phân vị của tập dữ liệu đã chọn. Phân vị là giá trị chia theo phần trăm cụ thể và kết quả thu được là 25%-85.45, 50%-96.35, 75%-98.60
z7 <- quantile(sc01$ifr, probs = c(.25,.5,.75))
z7
## 25% 50% 75%
## 85.45 96.35 98.60
# Lệnh dùng để nhóm dữ liệu các trường đại học có trung bình giảng viên tham gia nghiên cứu khoa học
moc <- sc01 %>% group_by(u) %>% summarise(mean_of_ifr = mean(ifr))
moc
## # A tibble: 10 × 2
## u mean_of_ifr
## <chr> <dbl>
## 1 Brown University 84.5
## 2 ETH Zurich 100
## 3 Fudan University 88.3
## 4 Lund University 98.8
## 5 Osaka University 28.6
## 6 University of Southampton 96.1
## 7 University of St Andrews 98.7
## 8 University of Technology Sydney 96.6
## 9 Uppsala University 98.3
## 10 Yonsei University 19.6
2.2 Dùng lệnh sc01 %>% group_by(u) %>% summarise(n = n(),mean_of_ifr = mean(ifr))
# Lệnh dùng để tính đếm số quan sát để nhóm các trường đại học có tổng số sinh viên đại học và sau đại học là người nước ngoài và dành ít nhất ba tháng tại trường đại học của bạn so với tổng số sinh viên đại học và sinh viên sau đại học nói chung.
moc0 <- sc01 %>% group_by(u) %>% summarise(n = n(),mean_of_isr = mean(isr))
moc0
## # A tibble: 10 × 3
## u n mean_of_isr
## <chr> <int> <dbl>
## 1 Brown University 1 52
## 2 ETH Zurich 1 98.5
## 3 Fudan University 1 33
## 4 Lund University 1 77.4
## 5 Osaka University 1 13.2
## 6 University of Southampton 1 97.4
## 7 University of St Andrews 1 100
## 8 University of Technology Sydney 1 93.6
## 9 Uppsala University 1 82.4
## 10 Yonsei University 1 49.7