#BÀI TẬP NGÀY 1- GIỚI THIỆU R
Việc 1: Tải R, RStudio về máy tính và cài đặt hai dữ liệu này.
Việc 2: Cài đặt các gói lệnh
Việc 3: Đọc dữ liệu “Obesity data.csv” vào R và gọi dữ liệu là
“ob”
ob = read.csv("C:\\Users\\ASUS\\OneDrive\\Máy tính\\R pro\\dữ liệu\\Obesity data.csv")
Việc 4: Thông tin về dữ liệu ob này
4.1. Có bao nhiêu biến số và quan sát
dim(ob) ### 4.2. Liệt kê 6 quan sát đầu tiên của dữ liệu.
head(ob) ### 4.3. Liệt kê 6 quan sát cuối cùng của dữ liệu tail(ob)
4.4. Tóm tắt dữ liệu bằng hàm summary
summary(ob)
Việc 5: Biên tập dữ liệu
5.1. Mã hóa biến gender (F/M)thành biến sex với giá trị 0/1 (0=M,
1=F)
ob\(sex[ob\)gender == “M”] = 0
ob\(sex[ob\)gender == “F”] = 1
5.2. Mã hóa biến bmi thành biến obese với 4 nhóm như sau:
ob\(obese[ob\)bmi<18.5] = “Thiếu
cân” ob\(obese[ob\)bmi>= 25 &
ob\(bmi <25] = "Bình thường"
ob\)obese[ob\(bmi>= 18.5 &
ob\)bmi <25] = “Bình thường” ob\(obese[ob\)bmi>= 25 & ob\(bmi <30] = "Thừa cân"
ob\)obese[ob$bmi>30] = “Béo phì”
5.3. Tạo biến số mới lean.kg và fat.kg tính toán lượng cơ (lean) và
mỡ (fat) bằng đơn vị kg
lean.kg=ob\(lean/1000
fat.kg=ob\)fat/1000
5.4. Tạo 1 tập dữ liệu men.overweight gồm nam giới quá cân (25.0
kg/m2 BMI< 30.0 kg/m2) và béo phì (BMI 30.0 kg/m2). Có bao nhiêu
biến số và quan sát trong tập dữ liệu này?
men.overweight<-subset(ob,sex==“M” & bmi>=25)
dim(men.overweight)
head(men.overweight)
5.5. Tạo 1 tập dữ liệu Demo chỉ bao gồm 6 biến số là id, age,
gender, height, weight và pcfat.
demo=subset(ob, select=c(id,age, gender, weight, height, pcfat))
Việc 6: Bạn hãy ghi lại tất cả những hàm/lệnh trên trong RMarkdown
và chia sẻ trên mạng rpubs.com/tài khoản của bạn.