Chào các Bạn Trong bài này Tôi sử dụng Boxplot để phân tích nhiệt độ của Việt Nam tại một số trạm quan trắc trong cả nước, Số liệu lấy trên trang Web của tổng cục Thống Kê “https://www.gso.gov.vn/default.aspx?tabid=713”.

Dữ liệu đã được tôi format để phục vụ mục đích phân tích lấy theo Link sau “https://www.kaggle.com/ngvietlg/vietnam-weather-temperature-2002-2017

Filename: 14. VIET NAM TEMPERATURE 2002 TO 2017.xlsx

Tôi tải về và lưu trên desktop trong thư mục “NHIETDO”.

‘C:/Users/viet.nguyen/Desktop/NhietDo’

Đọc dữ liệu vào R.

Bạn hãy cài gói công cụ đọc file Excel bằng dòng lệnh dưới đây

install.packages(“readxl”)

Bây giờ đọc dữ liệu vào R

setwd("C:/Users/viet.nguyen/Desktop/NhietDo")
library(readxl)
nd <- read_excel("14. VIET NAM TEMPERATURE 2002 TO 2017.xlsx")

Xem 6 dòng đầu tiên của dữ liệu

head(nd)
## # A tibble: 6 x 5
##   DIAPHUONG   NHIETDO THANG   NAM VUNG 
##   <chr>         <dbl> <dbl> <dbl> <chr>
## 1 Lai Chau       14.8     1  2017 BAC  
## 2 Son La         17.1     1  2017 BAC  
## 3 Tuyen Quang    19       1  2017 BAC  
## 4 Ha Noi         19.7     1  2017 BAC  
## 5 Bai Chay       19.2     1  2017 BAC  
## 6 Nam Dinh       19.2     1  2017 BAC

File dữ liệu có các Cột DIAPHUONG (địa phương): là những nỡi đặt trạm quan trắc NHIETDO (Nhiệt độ): là trung bình nhiệt độ tại các trạm đo trong tháng THANG( Tháng): là các tháng trong năm NAM (năm): là năm có từ 2002 đến 2017 VUNG (vùng): là các Vùng Bắc-Trung-Nam-Tây Nguyên (tôi phân ra để tiện việc phân tích)

Ta bắt đầu đặt ra các câu hỏi để phân tích

  1. NHIỆT ĐỘ TRUNG BÌNH CỦA VIỆT NAM LÀ BAO NHIÊU
  2. NHIỆT ĐỘ TRUNG BÌNH CỦA VIỆT NAM THEO CÁC NĂM CÓ BIÊN ĐỔI RA SAO
  3. NHIỆT ĐỘ TRUNG BÌNH THEO CÁC VÙNG LÀ BAO NHIÊU, SO SÁNH VỚI NHAU
  4. NHIỆT ĐỘ TRUNG BÌNH CÁC VÙNG THEO NĂM CÓ BIẾN ĐỔI NHƯ THẾ NÀO
  5. NHIỆT ĐỘ TRUNG BÌNH CỦA CÁC ĐỊA PHƯƠNG RA SAO, SO SÁNH
  6. NHIỆT ĐỘ TRUNG BÌNH CỦA CÁC ĐỊA PHƯƠNG THEO NĂM BIẾN ĐỔI RA SAO
  7. NHIỆT ĐỘ TRUNG BÌNH CỦA CÁC ĐỊA PHƯƠNG THEO THÁNG BIẾN ĐỔI RA SAO
  8. VVV

Ta sử dụng kết gợp 2 gói công cụ SSV và GGPLOT2.

install.packages(“SSV”).

install.packages(“ggplot2”).

  1. NHIỆT ĐỘ TRUNG BÌNH CỦA VIỆT NAM LÀ BAO NHIÊU
require(SSV)
## Loading required package: SSV
boxplots(nd$NHIETDO, dot = F)

  1. NHIỆT ĐỘ TRUNG BÌNH CỦA VIỆT NAM THEO CÁC NĂM CÓ BIÊN ĐỔI RA SAO
boxplots(nd$NHIETDO, as.factor(nd$NAM), dot = F)

  1. NHIỆT ĐỘ TRUNG BÌNH THEO CÁC VÙNG LÀ BAO NHIÊU, SO SÁNH VỚI NHAU
boxplots(nd$NHIETDO, nd$VUNG, dot = F)

  1. NHIỆT ĐỘ TRUNG BÌNH CÁC VÙNG THEO NĂM CÓ BIẾN ĐỔI NHƯ THẾ NÀO
require(ggplot2)
## Loading required package: ggplot2
g <- ggplot(data=nd,aes(x=as.factor(NAM),y=NHIETDO,fill= as.factor(NAM))) + theme_bw() 
g + geom_boxplot() + facet_wrap(~VUNG)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).

  1. NHIỆT ĐỘ TRUNG BÌNH CỦA CÁC ĐỊA PHƯƠNG RA SAO, SO SÁNH
g <- ggplot(data=nd,aes(x=DIAPHUONG,y=NHIETDO,fill= DIAPHUONG)) + theme_bw() 
g + geom_boxplot() 
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).

  1. NHIỆT ĐỘ TRUNG BÌNH CỦA CÁC ĐỊA PHƯƠNG THEO NĂM BIẾN ĐỔI RA SAO
g <- ggplot(data=nd,aes(x=as.factor(NAM),y=NHIETDO,fill= as.factor(NAM))) + theme_bw() 
g + geom_boxplot() + facet_wrap(~DIAPHUONG)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).

  1. NHIỆT ĐỘ TRUNG BÌNH CỦA CÁC ĐỊA PHƯƠNG THEO THÁNG BIẾN ĐỔI RA SAO
g <- ggplot(data=nd,aes(x=as.factor(THANG),y=NHIETDO,fill= as.factor(THANG))) + theme_bw() 
g + geom_boxplot() + facet_wrap(~DIAPHUONG)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).

CÁC BẠN CÙNG ĐỌC KẾT QUẢ VÀO COMMENT NHÉ.

THÂN ÁI - VIỆT NGUYỄN