library(ggplot2)
dulieu <- read.csv("http://solieu.vip/csv/data2018.csv")
attach(dulieu)
head(dulieu)
## ï..STT YEAR PROVINE CODE LAB LnLAB PCI X_MARKET X_DATDAI
## 1 1 2010 Long An 1 854.4 6.750399 55.34 7.19 6.984733
## 2 2 2010 Tiá»\201n Giang 2 1011.5 6.919190 53.58 6.92 7.480912
## 3 3 2010 Bến Tre 3 792.6 6.675319 57.14 7.59 7.297698
## 4 4 2010 Trà Vinh 4 584.1 6.370072 59.54 7.37 8.654261
## 5 5 2010 Vĩnh Long 5 612.9 6.418202 55.94 7.04 6.617867
## 6 6 2010 Ä\220ồng Tháp 6 988.6 6.896290 62.08 7.09 7.365447
## X_MINHBACH X_TIMES X_CPHI09 X_NANGDONG X_HTCTY X_LDONG X_PHAPLY SL FDI
## 1 6.50 7.07 6.98 5.55 4.90 5.58 4.59 38 628.8
## 2 6.19 5.38 7.04 6.27 4.53 5.37 4.40 15 160.8
## 3 5.84 7.18 8.22 6.68 3.88 4.90 5.55 9 38.7
## 4 6.07 7.04 8.53 7.75 3.58 5.36 5.19 7 54.2
## 5 6.65 7.08 7.53 6.00 4.19 5.40 5.43 4 4.8
## 6 6.26 8.08 7.57 7.38 6.03 5.13 7.17 0 0.0
## LnFDI Cno SHIP LnSHIP Port Lab15_Edu LabEdu
## 1 6.443813 116.4 15301.5 9.635706 0 79,772 79.77
## 2 5.080161 115.1 9785.3 9.188637 1 87,514 87.51
## 3 3.655840 108.1 3216.6 8.076080 0 69,100 69.10
## 4 3.992681 143.1 3429.3 8.140111 0 45,886 45.89
## 5 1.568616 109.9 4926.2 8.502323 1 45,638 45.64
## 6 0.000000 107.4 3019.9 8.012979 1 57,000 57.00
datamoi <-aggregate(PCI,by=list(PROVINE), FUN=mean)
names(datamoi) <-c("Nhom","X")
datamoi$X2 <-datamoi$X -mean(datamoi$X)
datamoi$ploai <-ifelse(datamoi$X2 <0,"Tren","Duoi")
datamoi <-datamoi[order(datamoi$X2),]
datamoi$tentinh <-factor(datamoi$Nhom, levels=datamoi$Nhom)
datamoi$nhan <-round(datamoi$X2,2)
attach(datamoi)
head(datamoi)
## Nhom X X2 ploai tentinh nhan
## 5 CÃ Mau 52.36111 -4.6485470 Tren CÃ Mau -4.65
## 11 Tiá»\201n Giang 54.57222 -2.4374359 Tren Tiá»\201n Giang -2.44
## 3 Bạc Liêu 56.08556 -0.9241026 Tren Bạc Liêu -0.92
## 7 Háºu Giang 56.51444 -0.4952137 Tren Háºu Giang -0.50
## 2 An Giang 56.52889 -0.4807692 Tren An Giang -0.48
## 6 Cần Thơ 56.62667 -0.3829915 Tren Cần Thơ -0.38
ggplot(datamoi, aes(x=tentinh, y=nhan, label= nhan)) +
geom_point(stat='identity', aes(col=ploai), size=10) +
scale_color_manual(name="Chú thích",
labels = c("Trên trung bình", "Dưới trung bình"),
values = c("Duoi"="#00ba38", "Tren"="#f8766d")) +
geom_text(color="white", size=3) +
labs(title="Diverging Dot Plot",
subtitle="Normalized mileage from 'mtcars': Dotplot") +
ylim(-6, 6) +
coord_flip()
##Ghi chú Đồ thị này với ý nghĩa cũng giống như đồ thị 50.50 CPI của 13 tỉnh miền tây