#install.packages(“gapminder”) #library(dplyr) #library(ggplot2) #library(gapminder) # Lấy dữ liệu data(gapminder) # Thống kê 10 dòng đầu dữ liệu, 10 dòng cuối dữ liệu head(gapminder, n = 10)
tail(gapminder, n = 10) # Xem chiều dữ liệu dim(gapminder) # Xem cấu trúc biến str(gapminder) # Thống kê tổng quan summary(gapminder) # Thống kê số lượng các quốc gia từng châu lục bằng table table(gapminder$continent)
#lọc dữ liệu hàm filter() và toán tử pipe forward (%>%) gapminder %>% filter( continent == “Asia”, country == “China”, year %in% c(1997, 2002, 2007)) # sử dụng hàm kết hợpfilter() và summarize() gapminder %>% filter( year == 2007, continent == “Asia”, country == “China” ) %>% summarise(mean(lifeExp)) #kết hợp group_by và summarize gapminder %>% filter(year == 2007) %>% group_by(continent) %>% summarise(average_lifeExp = mean(lifeExp)) # hàm arrange() gapminder %>% filter(year == 2007) %>% group_by(continent) %>% summarise(total_pop = sum(pop)) %>% arrange(desc(total_pop)) # hàm mutate() gapminder %>% filter(year == 2007) %>% mutate(totalGDP = gdpPercap * pop) %>% head(n = 10) # Lọc dữ liệu cho năm 2007 gapminder2007 <- gapminder %>% filter(year == 2007) gapminder2007 %>% head(n=10)