Nhóm nghiên cứu muốn đánh giá xem liệu sử dụng thuốc A có hiệu quả làm giảm đường huyết không. Nghiên cứu thực hiện trên 19 chuột, trong đó 10 chuột không dùng thuốc và 9 chuột được dùng thuốc. Nồng độ đường huyết của chuột được đo ở thời điểm trước và 3 thời điểm sau dùng thuốc.
Giới thiệu tập tin số liệu glucose.csv: - id: mã số của chuột - time: thời điểm đo nồng độ đường huyết (trước khi dùng thuốc (T0), 2 (T2), 3 (T3) và 4 giờ (T4) sau dùng thuốc). - treatment: can thiệp (1= có dùng thuốc, 0= không dùng thuốc)
glucose= read.csv("C:/Users/admin/OneDrive/Statistical courses/Ton Duc Thang_Jan2020/TDTU Datasets for 2020 Workshop/glucose.csv")
head (glucose)
## id treatment time glucose
## 1 1 1 0 5.9
## 2 1 1 2 3.9
## 3 1 1 3 3.9
## 4 1 1 4 3.6
## 5 2 1 0 5.3
## 6 2 1 2 4.7
library (ggplot2)
ggplot(data= glucose) +
geom_point(aes(x= time, y= glucose, fill= factor(treatment), col= factor(treatment)), size=3)+
geom_line(aes(x= time, y= glucose, group= id))
ggplot(data= glucose) +
geom_point(aes(x= time,y= glucose), color="blue", size=3)+
geom_line(aes(x= time, y= glucose, group= id))+
facet_grid(~ treatment) +
stat_smooth(aes(x= time, y= glucose))
library (tidyverse)
g1= filter (.data= glucose, time== 0)
ggplot (data= g1, aes(y= glucose, x= factor(treatment), fill= factor(treatment))) + geom_boxplot()
ggplot (data= g1, aes(y= glucose, x= factor(treatment), fill= factor(treatment))) + geom_boxplot() + geom_jitter(alpha= 0.2)
library(coin)
oneway_test(g1$glucose ~ factor(g1$treatment))
##
## Asymptotic Two-Sample Fisher-Pitman Permutation Test
##
## data: g1$glucose by factor(g1$treatment) (0, 1)
## Z = 0.36664, p-value = 0.7139
## alternative hypothesis: true mu is not equal to 0
median_test(g1$glucose ~ factor(g1$treatment), conf.int = TRUE)
##
## Asymptotic Two-Sample Brown-Mood Median Test
##
## data: g1$glucose by factor(g1$treatment) (0, 1)
## Z = 0.7151, p-value = 0.4745
## alternative hypothesis: true mu is not equal to 0
## 95 percent confidence interval:
## -0.7999967 1.7999946
## sample estimates:
## difference in location
## 0.2000805
Lọc dữ liệu với time== 0 và time== 2 Sau đó biến đổi dữ liệu từ dòng sang cột bằng package reshape2 và hàm dcast
g2= filter (.data= glucose, time== 0|time== 2)
library (reshape2)
g3= dcast(g2, id + treatment ~ time)
head (g3)
## id treatment 0 2
## 1 1 1 5.9 3.9
## 2 2 1 5.3 4.7
## 3 3 1 4.6 3.7
## 4 4 1 6.0 5.4
## 5 5 1 6.0 5.4
## 6 6 1 6.4 4.7
Đổi tên biến số 0 thành glucose0 và 2 thành glucose2
names (g3)[names(g3)=='0']= 'glucose0'
names (g3)[names(g3)=='2']= 'glucose2'
head (g3)
## id treatment glucose0 glucose2
## 1 1 1 5.9 3.9
## 2 2 1 5.3 4.7
## 3 3 1 4.6 3.7
## 4 4 1 6.0 5.4
## 5 5 1 6.0 5.4
## 6 6 1 6.4 4.7
Kiểm định sự khác biệt về mức đường huyết ở thời điểm 2 giờ ở nhóm điều trị và không điều trị
oneway_test(g3$glucose2 ~ factor(g3$treatment))
##
## Asymptotic Two-Sample Fisher-Pitman Permutation Test
##
## data: g3$glucose2 by factor(g3$treatment) (0, 1)
## Z = 0.93739, p-value = 0.3486
## alternative hypothesis: true mu is not equal to 0
Nhận xét kết quả?
Đặt biến thay đổi đường huyết là diff= glucose2 - glucose0
g3$diff= g3$glucose2 - g3$glucose0
head (g3)
## id treatment glucose0 glucose2 diff
## 1 1 1 5.9 3.9 -2.0
## 2 2 1 5.3 4.7 -0.6
## 3 3 1 4.6 3.7 -0.9
## 4 4 1 6.0 5.4 -0.6
## 5 5 1 6.0 5.4 -0.6
## 6 6 1 6.4 4.7 -1.7
oneway_test(g3$diff ~ factor(g3$treatment))
##
## Asymptotic Two-Sample Fisher-Pitman Permutation Test
##
## data: g3$diff by factor(g3$treatment) (0, 1)
## Z = 0.51813, p-value = 0.6044
## alternative hypothesis: true mu is not equal to 0
Nhận xét kết quả?
yij: nồng độ đường huyết của chuột i ở thời điểm jA0: nồng độ trung bình của đường huyết trước uống thuốc của chuột trong nhóm chứngA1: khác biệt về nồng độ đường huyết trước uống thuốc giữa 2 nhómB0: tốc độ thay đổi trung bình của đường huyết của chuột trong nhóm chứngB1: khác biệt về tốc độ thay đổi nồng độ đường huyết giữa 2 nhómu: dao động nồng độ đường huyết trước uống thuốc giữa các chuộtv: dao động tốc độ thay đổi đường huyết giữa các chuộtei: giá trị nhiễu (≠ nồng độ đường huyết giữa giá trị đo được và giá trị dự báo từ mô hình) của chuột i.treatment (điểu trị); time (thời điểm đo đường huyết j)library(lme4)
m4=lmer(glucose~ treatment+ time+ time:treatment + (1+ time|id), data= glucose)
summary(m4)
## Linear mixed model fit by REML ['lmerMod']
## Formula: glucose ~ treatment + time + time:treatment + (1 + time | id)
## Data: glucose
##
## REML criterion at convergence: 166.8
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.60331 -0.41198 0.00053 0.48474 2.99267
##
## Random effects:
## Groups Name Variance Std.Dev. Corr
## id (Intercept) 0.7680707 0.87640
## time 0.0001578 0.01256 1.00
## Residual 0.2534072 0.50340
## Number of obs: 76, groups: id, 19
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 5.96539 0.29442 20.262
## treatment 0.18082 0.39045 0.463
## time -0.41860 0.05327 -7.859
## treatment:time -0.11451 0.07910 -1.448
##
## Correlation of Fixed Effects:
## (Intr) trtmnt time
## treatment -0.637
## time -0.403 0.357
## treatmnt:tm 0.269 -0.437 -0.675
## convergence code: 0
## boundary (singular) fit: see ?isSingular
Nhằm xác định xem có sự khác biệt về tốc độ phát triển giữa nam và nữ, nhóm nghiên cứu theo dõi phát triển của 17 trẻ em (16 nam và 11 nữ) từ 8 đến 14 tuổi. Mỗi 2 năm nghiên cứu viên đo khoảng cách giữa tuyến yên (pituitary) và khe chân bướm hàm (pterygomaxillary) trên film x-quang (distance). Tập tin Orthodont (có sẵn trong gói nlme) bao gồm 108 dòng và 4 cột. Bốn biến số gồm: - distance: khoảng cách (mm) giữa tuyến yên và khe chân bướm hàm đo được trên film x-quang. - age: tuổi (năm) - Subject: mã số của người tham gia (M01-M16: nam; F01-F13: nữ). - Sex: giới tính (Male: nam; Female: nữ) ### 2.1 Nhận xét sơ lược về khác biệt giữa nam và nữ về: (i) khoảng cách distance ở thời điểm bắt đầu tham gia nghiên cứu, (ii) thay đổi distance theo thời gian, (iii) các dạng thay đổi bất thường.
data("Orthodont", package="nlme")
head(Orthodont)
## Grouped Data: distance ~ age | Subject
## distance age Subject Sex
## 1 26.0 8 M01 Male
## 2 25.0 10 M01 Male
## 3 29.0 12 M01 Male
## 4 31.0 14 M01 Male
## 5 21.5 8 M02 Male
## 6 22.5 10 M02 Male
library(ggplot2)
theme_set(theme_bw())
ggplot(data=Orthodont)+ geom_point(aes(x= age,y= distance), color= "blue", size= 3)+ geom_line(aes(x= age, y= distance, group= Subject)) + facet_grid(~ Sex)
lm= lm(distance~ age:Sex+ Sex, data= Orthodont)
summary(lm)
##
## Call:
## lm(formula = distance ~ age:Sex + Sex, data = Orthodont)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.6156 -1.3219 -0.1682 1.3299 5.2469
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 16.3406 1.4162 11.538 < 2e-16 ***
## SexFemale 1.0321 2.2188 0.465 0.64279
## age:SexMale 0.7844 0.1262 6.217 1.07e-08 ***
## age:SexFemale 0.4795 0.1522 3.152 0.00212 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.257 on 104 degrees of freedom
## Multiple R-squared: 0.4227, Adjusted R-squared: 0.4061
## F-statistic: 25.39 on 3 and 104 DF, p-value: 2.108e-12
Orthodont$pred.lm= predict(lm)
ggplot(data=Orthodont) + geom_point(aes(x=age,y=distance), color="blue", size=3)+ geom_line(aes(x=age,y=pred.lm)) + facet_grid(~Sex)
i bằng những thông tin sau:yij: distance của đối tượng i ở tuổi jA0: trung bình distance của thiếu niên nam lúc 8 tuổiA1: khác biệt về distance giữa nam và nữ lúc 8 tuổiB0: tốc độ phát triển trung bình của distance ở thiếu niên namB1: khác biệt về tốc độ phát triển của distance giữa nam và nữu: dao động về distance giữa các đối tượng tham gia nghiên cứu lúc 8 tuổiv: dao độ tốc độ phát tiển distance giữa các đối tượng tham gia nghiên cứuei: giá trị nhiễu (≠ giá trị đo được và giá trị dự báo từ mô hình) của người i.Sex (giới tính, 1= Nữ, 0= Nam); age (tuổi j ~ thời điểm đo lường distance)m1= lmer(distance~ Sex+ age+ age:Sex+ (1+ age|Subject), data= Orthodont)
summary(m1)
## Linear mixed model fit by REML ['lmerMod']
## Formula: distance ~ Sex + age + age:Sex + (1 + age | Subject)
## Data: Orthodont
##
## REML criterion at convergence: 432.6
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -3.1694 -0.3862 0.0069 0.4454 3.8491
##
## Random effects:
## Groups Name Variance Std.Dev. Corr
## Subject (Intercept) 5.77441 2.4030
## age 0.03245 0.1801 -0.67
## Residual 1.71661 1.3102
## Number of obs: 108, groups: Subject, 27
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 16.34063 1.01824 16.048
## SexFemale 1.03210 1.59528 0.647
## age 0.78437 0.08598 9.123
## SexFemale:age -0.30483 0.13471 -2.263
##
## Correlation of Fixed Effects:
## (Intr) SexFml age
## SexFemale -0.638
## age -0.880 0.562
## SexFemale:g 0.562 -0.880 -0.638