##ngày 4: Ngày 4: Hồi qui tuyến tính ### Việc 1: Đọc dữ liệu “Bone
data.csv” vào R và gọi dữ liệu là “df” df= read.csv(“Desktop/R/DỮ LIỆU
THỰC HÀNH (TS Thạch gửi)/Bone data.csv”) ###Việc 2: Đánh giá mối liên
quan giữa cân nặng (weight) và mật độ xương tại cổ xương đùi (fnbmd)
####2.1. > ggplot(df, aes(x = weight, y = fnbmd)) + +
geom_point(color = “blue”) + + geom_smooth(method = “lm”, se = TRUE,
color = “red”) + + labs(title = “Mối liên quan giữa cân nặng và mật độ
xương cổ xương đùi”, + x = “Cân nặng (kg)”, + y = “Mật độ xương cổ xương
đùi (fnbmd)”) geom_smooth() using formula = ‘y ~ x’
####2.2. Thực hiện phân tính tương quan đánh giá mối liên quan giữa cân nặng và mật độ xương tại cổ xương đùi Xoá dữ liệu missing >df_clean <- df[complete.cases(df\(weight, df\)fnbmd), ] Xem xét dữ liệu phân bố chuẩn hay không chuẩn: nếu p<0,05 bác bỏ giả thuyết H0 rằng chúng có phân phối chuẩn. Trường hợp này chọn hệ số tương quan Spearman cor.test(df_clean\(weight, df_clean\)fnbmd, method = “spearman”) ###Việc 3: Đọc dữ liệu “Obesity data.csv” vào R và gọi dữ liệu là “ob” >ob=read.csv(“Desktop/R/DỮ LIỆU THỰC HÀNH (TS Thạch gửi)/Bone data.csv”) ###Việc 4: So sánh tỉ trọng mỡ (pcfat) giữa nam và nữ (gender) ####4.2. Sử dụng kiểm định t để so sánh tỉ trọng mỡ giữa nam và nữ >t.test(pcfat ~ gender, data = ob1, var.equal = FALSE) 4.3 Xây dựng mô hình hổi qui tuyến tính để so sánh tỉ trọng mỡ giữa nam và nữ > model <- lm(pcfat ~ gender, data = ob1) > summary(model) ###Vẽ biểu đồ đánh giá mối liên quan giữa cân nặng và tỉ trọng mỡ >ggplot(ob1, aes(x = weight, y = pcfat)) + geom_point(color = “blue”, alpha = 0.6) + # điểm dữ liệu geom_smooth(method = “lm”, se = TRUE, color = “red”) + # đường hồi quy tuyến tính labs(title = “Mối liên quan giữa cân nặng và tỷ trọng mỡ”, x = “Cân nặng (kg)”, y = “Tỷ trọng mỡ (%)”) + theme_minimal() ###6. Xây dựng mô hình đa biến đánh giá mối liên quan độc lập giữa cân nặng và tỉ trọng mỡ sau khi hiệu chỉnh cho các yếu tố gây nhiễu. > model_multi <- lm(pcfat ~ weight + gender + age + height, data = ob1) > summary(model_multi) ###7.1 Xây dựng mô hình tối ưu dự báo tỉ trọng mỡ bằng phương pháp BMA (Bayesian Modelling Average). > library(BMA) > X <- ob1[, c(“age”, “weight”, “height”, “bmi”, “bmd”, “lean”, “bmc”)] > y <- ob1$pcfat > complete_data <- complete.cases(X, y) > X <- X[complete_data, ] > y <- y[complete_data] > library(BMA) > bma_model <- bicreg(x = X, y = y) > summary(bma_model)