Chào các Bạn Trong bài này Tôi sử dụng Boxplot để phân tích nhiệt độ của Việt Nam tại một số trạm quan trắc trong cả nước, Số liệu lấy trên trang Web của tổng cục Thống Kê “https://www.gso.gov.vn/default.aspx?tabid=713”.
Dữ liệu đã được tôi format để phục vụ mục đích phân tích lấy theo Link sau “https://www.kaggle.com/ngvietlg/vietnam-weather-temperature-2002-2017”
Filename: 14. VIET NAM TEMPERATURE 2002 TO 2017.xlsx
Tôi tải về và lưu trên desktop trong thư mục “NHIETDO”.
‘C:/Users/viet.nguyen/Desktop/NhietDo’
Đọc dữ liệu vào R.
Bạn hãy cài gói công cụ đọc file Excel bằng dòng lệnh dưới đây
install.packages(“readxl”)
Bây giờ đọc dữ liệu vào R
setwd("C:/Users/viet.nguyen/Desktop/NhietDo")
library(readxl)
nd <- read_excel("14. VIET NAM TEMPERATURE 2002 TO 2017.xlsx")
Xem 6 dòng đầu tiên của dữ liệu
head(nd)
## # A tibble: 6 x 5
## DIAPHUONG NHIETDO THANG NAM VUNG
## <chr> <dbl> <dbl> <dbl> <chr>
## 1 Lai Chau 14.8 1 2017 BAC
## 2 Son La 17.1 1 2017 BAC
## 3 Tuyen Quang 19 1 2017 BAC
## 4 Ha Noi 19.7 1 2017 BAC
## 5 Bai Chay 19.2 1 2017 BAC
## 6 Nam Dinh 19.2 1 2017 BAC
File dữ liệu có các Cột DIAPHUONG (địa phương): là những nỡi đặt trạm quan trắc NHIETDO (Nhiệt độ): là trung bình nhiệt độ tại các trạm đo trong tháng THANG( Tháng): là các tháng trong năm NAM (năm): là năm có từ 2002 đến 2017 VUNG (vùng): là các Vùng Bắc-Trung-Nam-Tây Nguyên (tôi phân ra để tiện việc phân tích)
Ta bắt đầu đặt ra các câu hỏi để phân tích
Ta sử dụng kết gợp 2 gói công cụ SSV và GGPLOT2.
install.packages(“SSV”).
install.packages(“ggplot2”).
require(SSV)
## Loading required package: SSV
boxplots(nd$NHIETDO, dot = F)
boxplots(nd$NHIETDO, as.factor(nd$NAM), dot = F)
boxplots(nd$NHIETDO, nd$VUNG, dot = F)
require(ggplot2)
## Loading required package: ggplot2
g <- ggplot(data=nd,aes(x=as.factor(NAM),y=NHIETDO,fill= as.factor(NAM))) + theme_bw()
g + geom_boxplot() + facet_wrap(~VUNG)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).
g <- ggplot(data=nd,aes(x=DIAPHUONG,y=NHIETDO,fill= DIAPHUONG)) + theme_bw()
g + geom_boxplot()
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).
g <- ggplot(data=nd,aes(x=as.factor(NAM),y=NHIETDO,fill= as.factor(NAM))) + theme_bw()
g + geom_boxplot() + facet_wrap(~DIAPHUONG)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).
g <- ggplot(data=nd,aes(x=as.factor(THANG),y=NHIETDO,fill= as.factor(THANG))) + theme_bw()
g + geom_boxplot() + facet_wrap(~DIAPHUONG)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).
CÁC BẠN CÙNG ĐỌC KẾT QUẢ VÀO COMMENT NHÉ.
THÂN ÁI - VIỆT NGUYỄN