BÀI TẬP BIỂU ĐỒ THỐNG KÊ MÔ TẢ ĐƠN GIẢN
Load file ob
ob = read.csv("C:/Users/DELL/Desktop/Obesitydata.csv")
head(ob)
## id gender height weight bmi age bmc bmd fat lean pcfat
## 1 1 F 150 49 21.8 53 1312 0.88 17802 28600 37.3
## 2 2 M 165 52 19.1 65 1309 0.84 8381 40229 16.8
## 3 3 F 157 57 23.1 64 1230 0.84 19221 36057 34.0
## 4 4 F 156 53 21.8 56 1171 0.80 17472 33094 33.8
## 5 5 M 160 51 19.9 54 1681 0.98 7336 40621 14.8
## 6 6 F 153 47 20.1 52 1358 0.91 14904 30068 32.2
Chia màn hình thành nhiều cửa sổ
par(mfrow=c(2,2))
Biểu đồ 1: Biểu đồ đơn giản
hist.default(ob$pcfat)
Biểu đồ 2: Biểu đồ đơn giản có màu
hist(ob$pcfat, col = "blue", border = "white")
Biểu đồ 3: Biểu đồ đơn giản có màu, nhãn, tên
hist(ob$pcfat, col = "blue", border = "white", xlab = "Percent body fat", ylab = "Frequency", main = "Distribution of percent body fat")
Thêm Density plot
hist(ob$pcfat, col = "blue", border = "white", prob = T, xlab = "Percent body fat", ylab = "Frequency", main = "Distribution of percent body far", breaks = 50)
lines(density(ob$pcfat), col = "red", lwd = 1)
2.BOXPLOT
par(mfrow=c(2,2))
#Biểu đồ đơn giản
boxplot(ob$pcfat)
#Biểu đồ có màu
boxplot(ob$pcfat, col = "blue", border = "black")
#Biểu đồ phân nhóm theo giới
boxplot(ob$fat~ob$gender, col = c ("pink", "blue"), border = "black", xlab = "gender", ylab = "Percent body fat", main = "Percent body fat by gender", names = c("Female", "Male"))
#Phân nhóm đối tượng
ob$OB[ob$bmi < 18.5] = "Underweight"
ob$OB[ob$bmi >=18.5 & ob$bmi <24.9] = "Normal"
ob$OB[ob$bmi >=24.9 & ob$bmi <29.9] = "Overweight"
ob$OB[ob$bmi>30] = "Obese"
ob$OB = factor (ob$OB, levels = c("Underweight", "Normal", "Overweight", "Obese"))
t = table (ob$OB)
barplot(t)
#Thêm màu
barplot(t, col = c("red", "green", "blue", "orange"))
# Phân nhóm nam và nữ
t = table (ob$OB, ob$gender)
#Vẽ biểu đồ t
barplot(t, col = c("red", "green", "blue", "orange"))
#Vẽ biểu đồ t biểu diễn theo phần trăm
t2 = prop.table(t, 2)
barplot(t2, col = c("red", "green", "blue", "orange"))
4.BIỂU ĐỒ TƯƠNG QUAN
#Biểu đồ đơn giản
plot(ob$pcfat ~ ob$bmi)
#Biểu đồ tương quan đơn giản
plot(ob$pcfat~ob$bmi, pch=20, col = "pink")
#Thêm nhãn, tựa và vẽ đường biểu diễn
plot(ob$pcfat~ob$bmi, pch=20, col = "pink", xlab = "Body mass index", ylab = "Percent body fat", main = " Relationship between BMI and PCFAT")
abline(lm(ob$pcfat~ob$bmi), col = "red", lwd = 2)
#Định nghĩa biến liên tục cần khảo sát mối tương quan
vars = ob[, c("age", "weight", "bmi", "bmc", "pcfat")]
#Dùng package psych và hàm pairs.panels() để vẽ biểu đồ
library (psych)
pairs.panels(vars)