BÀI TẬP BIỂU ĐỒ THỐNG KÊ MÔ TẢ ĐƠN GIẢN

Load file ob

ob = read.csv("C:/Users/DELL/Desktop/Obesitydata.csv")
head(ob)
##   id gender height weight  bmi age  bmc  bmd   fat  lean pcfat
## 1  1      F    150     49 21.8  53 1312 0.88 17802 28600  37.3
## 2  2      M    165     52 19.1  65 1309 0.84  8381 40229  16.8
## 3  3      F    157     57 23.1  64 1230 0.84 19221 36057  34.0
## 4  4      F    156     53 21.8  56 1171 0.80 17472 33094  33.8
## 5  5      M    160     51 19.9  54 1681 0.98  7336 40621  14.8
## 6  6      F    153     47 20.1  52 1358 0.91 14904 30068  32.2
  1. HISTOGRAM

Chia màn hình thành nhiều cửa sổ

par(mfrow=c(2,2))

Biểu đồ 1: Biểu đồ đơn giản

hist.default(ob$pcfat)

Biểu đồ 2: Biểu đồ đơn giản có màu

hist(ob$pcfat, col = "blue", border = "white")

Biểu đồ 3: Biểu đồ đơn giản có màu, nhãn, tên

hist(ob$pcfat, col = "blue", border = "white", xlab = "Percent body fat", ylab = "Frequency", main = "Distribution of percent body fat")

Thêm Density plot

hist(ob$pcfat, col = "blue", border = "white", prob = T, xlab = "Percent body fat", ylab = "Frequency", main = "Distribution of percent body far", breaks = 50)
lines(density(ob$pcfat), col = "red", lwd = 1)

2.BOXPLOT

CHia màn hình thành nhiều cửa sổ

par(mfrow=c(2,2))

#Biểu đồ đơn giản

boxplot(ob$pcfat)

#Biểu đồ có màu

boxplot(ob$pcfat, col = "blue", border = "black")

#Biểu đồ phân nhóm theo giới

boxplot(ob$fat~ob$gender, col = c ("pink", "blue"), border = "black", xlab = "gender", ylab = "Percent body fat", main = "Percent body fat by gender", names = c("Female", "Male"))

  1. BIỂU ĐỒ THANH: tần số béo phì

#Phân nhóm đối tượng

ob$OB[ob$bmi < 18.5] = "Underweight"
ob$OB[ob$bmi >=18.5 & ob$bmi <24.9] = "Normal"
ob$OB[ob$bmi >=24.9 & ob$bmi <29.9] = "Overweight"
ob$OB[ob$bmi>30] = "Obese"

Xếp thứ tự

ob$OB = factor (ob$OB, levels = c("Underweight", "Normal", "Overweight", "Obese"))

Đếm số ca và biểu đồ đơn giản

t = table (ob$OB)
barplot(t)

#Thêm màu

barplot(t, col = c("red", "green", "blue", "orange"))

# Phân nhóm nam và nữ

t = table (ob$OB, ob$gender)

#Vẽ biểu đồ t

barplot(t,  col = c("red", "green", "blue", "orange"))

#Vẽ biểu đồ t biểu diễn theo phần trăm

t2 = prop.table(t, 2)
barplot(t2,  col = c("red", "green", "blue", "orange"))

4.BIỂU ĐỒ TƯƠNG QUAN

#Biểu đồ đơn giản

plot(ob$pcfat ~ ob$bmi)

#Biểu đồ tương quan đơn giản

plot(ob$pcfat~ob$bmi, pch=20, col = "pink")

#Thêm nhãn, tựa và vẽ đường biểu diễn

plot(ob$pcfat~ob$bmi, pch=20, col = "pink", xlab = "Body mass index", ylab = "Percent body fat", main = " Relationship between BMI and PCFAT")
abline(lm(ob$pcfat~ob$bmi), col = "red", lwd = 2)

  1. BIỂU ĐỒ TƯƠNG QUAN ĐA BIẾN

#Định nghĩa biến liên tục cần khảo sát mối tương quan

vars = ob[, c("age", "weight", "bmi", "bmc", "pcfat")]

#Dùng package psych và hàm pairs.panels() để vẽ biểu đồ

library (psych)
pairs.panels(vars)