# Nhập liệu File thứ nhất
file1=file.choose()
data1=read.csv(file1,header=TRUE)
head(data1)
## STT GTINH TDO DTUOI TNHAP A1 A2 A3 A4 A5 B1 B2 B3 B4 C1 C2 C3 C4 D1 D2 D3 E1
## 1 1 2 4 1 3 5 5 3 5 4 3 2 3 4 5 5 4 4 4 5 4 2
## 2 2 2 2 2 3 3 3 3 5 4 4 5 4 5 2 3 3 2 3 4 3 3
## 3 3 2 4 1 2 3 3 3 3 3 4 4 4 5 4 4 3 4 3 4 4 4
## 4 4 1 4 2 2 5 3 3 4 4 5 5 5 5 1 2 4 3 5 4 1 3
## 5 5 2 3 1 1 5 3 3 5 4 3 3 3 3 3 4 3 3 4 4 3 4
## 6 6 1 4 2 2 5 3 3 5 4 3 4 3 3 3 4 5 3 2 3 3 4
## E2 E3 E4 F1 F2 F3 F4 F5 Atb Btb Ctb Dtb Etb Ftb
## 1 3 3 4 4 5 3 4 5 4.4 3.00 4.50 4.33 3.00 4.2
## 2 4 3 4 3 3 3 4 5 3.6 4.50 2.50 3.33 3.50 3.6
## 3 3 3 4 4 4 4 4 5 3.0 4.25 3.75 3.67 3.50 4.2
## 4 4 3 4 5 5 4 4 5 3.8 5.00 2.50 3.33 3.50 4.6
## 5 3 3 4 2 5 4 4 5 4.0 3.00 3.25 3.67 3.50 4.0
## 6 4 3 4 3 3 5 4 5 4.0 3.25 3.75 2.67 3.75 4.0
dim(data1)
## [1] 198 36
# Nhập liệu File thứ hai
file2=file.choose()
data2=read.csv(file2,header=TRUE)
head(data2)
## STT HT1 HT2 HT3 HT4 HL1 HL2 HL3 TT1 TT2 TT3 TT4 TS1 TS2 TS3 TS4 DT1 DT2 DT3
## 1 1 6 6 6 6 6 6 6 7 7 6 6 4 4 4 4 4 4 4
## 2 2 7 7 7 7 7 7 7 7 7 7 7 5 5 5 5 3 3 3
## 3 3 7 7 7 7 7 7 7 7 7 7 7 5 5 5 5 3 3 3
## 4 4 7 7 7 7 7 7 7 7 7 7 7 3 3 3 5 5 3 3
## 5 5 7 6 6 6 5 5 5 7 6 7 7 4 4 5 5 3 3 3
## 6 6 6 6 6 6 5 5 5 6 5 5 6 3 3 4 3 4 5 5
## GTINH DTUOI HNHAN
## 1 2 3 2
## 2 2 3 2
## 3 2 2 2
## 4 1 1 2
## 5 1 4 2
## 6 1 3 2
dim(data2)
## [1] 200 22
# Ghép 2 file dữ liệu theo biến STT
datafinal=merge(data1,data2,by="STT")
head(datafinal)
## STT GTINH.x TDO DTUOI.x TNHAP A1 A2 A3 A4 A5 B1 B2 B3 B4 C1 C2 C3 C4 D1 D2 D3
## 1 1 2 4 1 3 5 5 3 5 4 3 2 3 4 5 5 4 4 4 5 4
## 2 2 2 2 2 3 3 3 3 5 4 4 5 4 5 2 3 3 2 3 4 3
## 3 3 2 4 1 2 3 3 3 3 3 4 4 4 5 4 4 3 4 3 4 4
## 4 4 1 4 2 2 5 3 3 4 4 5 5 5 5 1 2 4 3 5 4 1
## 5 5 2 3 1 1 5 3 3 5 4 3 3 3 3 3 4 3 3 4 4 3
## 6 6 1 4 2 2 5 3 3 5 4 3 4 3 3 3 4 5 3 2 3 3
## E1 E2 E3 E4 F1 F2 F3 F4 F5 Atb Btb Ctb Dtb Etb Ftb HT1 HT2 HT3 HT4 HL1
## 1 2 3 3 4 4 5 3 4 5 4.4 3.00 4.50 4.33 3.00 4.2 6 6 6 6 6
## 2 3 4 3 4 3 3 3 4 5 3.6 4.50 2.50 3.33 3.50 3.6 7 7 7 7 7
## 3 4 3 3 4 4 4 4 4 5 3.0 4.25 3.75 3.67 3.50 4.2 7 7 7 7 7
## 4 3 4 3 4 5 5 4 4 5 3.8 5.00 2.50 3.33 3.50 4.6 7 7 7 7 7
## 5 4 3 3 4 2 5 4 4 5 4.0 3.00 3.25 3.67 3.50 4.0 7 6 6 6 5
## 6 4 4 3 4 3 3 5 4 5 4.0 3.25 3.75 2.67 3.75 4.0 6 6 6 6 5
## HL2 HL3 TT1 TT2 TT3 TT4 TS1 TS2 TS3 TS4 DT1 DT2 DT3 GTINH.y DTUOI.y HNHAN
## 1 6 6 7 7 6 6 4 4 4 4 4 4 4 2 3 2
## 2 7 7 7 7 7 7 5 5 5 5 3 3 3 2 3 2
## 3 7 7 7 7 7 7 5 5 5 5 3 3 3 2 2 2
## 4 7 7 7 7 7 7 3 3 3 5 5 3 3 1 1 2
## 5 5 5 7 6 7 7 4 4 5 5 3 3 3 1 4 2
## 6 5 5 6 5 5 6 3 3 4 3 4 5 5 1 3 2
dim(datafinal)
## [1] 198 57
# Kiểm tra dữ liệu A1, HT11 có đạt Phân phối chuẩn
shapiro.test(datafinal$A1)
##
## Shapiro-Wilk normality test
##
## data: datafinal$A1
## W = 0.73786, p-value < 2.2e-16
shapiro.test(datafinal$HT1)
##
## Shapiro-Wilk normality test
##
## data: datafinal$HT1
## W = 0.85649, p-value = 1.064e-12
# Kiểm định Wilcoxon (Dữ liệu không PPC)
wilcox.test(datafinal$A1, datafinal$HT1, paired=TRUE)
##
## Wilcoxon signed rank test with continuity correction
##
## data: datafinal$A1 and datafinal$HT1
## V = 247, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
summary(datafinal$A1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.000 3.000 4.000 4.146 5.000 5.000
summary(datafinal$HT1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.000 5.000 6.000 5.763 7.000 7.000
# Kiểm định Paired Sample T-Test (Dữ liệu có PPC)
t.test(datafinal$A1, datafinal$HT1, paired=TRUE)
##
## Paired t-test
##
## data: datafinal$A1 and datafinal$HT1
## t = -17.82, df = 197, p-value < 2.2e-16
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
## -1.795014 -1.437309
## sample estimates:
## mean difference
## -1.616162
summary(datafinal$A1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.000 3.000 4.000 4.146 5.000 5.000
summary(datafinal$HT1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.000 5.000 6.000 5.763 7.000 7.000