# Nhập liệu File thứ nhất
file1=file.choose()
data1=read.csv(file1,header=TRUE)
head(data1)
##   STT GTINH TDO DTUOI TNHAP A1 A2 A3 A4 A5 B1 B2 B3 B4 C1 C2 C3 C4 D1 D2 D3 E1
## 1   1     2   4     1     3  5  5  3  5  4  3  2  3  4  5  5  4  4  4  5  4  2
## 2   2     2   2     2     3  3  3  3  5  4  4  5  4  5  2  3  3  2  3  4  3  3
## 3   3     2   4     1     2  3  3  3  3  3  4  4  4  5  4  4  3  4  3  4  4  4
## 4   4     1   4     2     2  5  3  3  4  4  5  5  5  5  1  2  4  3  5  4  1  3
## 5   5     2   3     1     1  5  3  3  5  4  3  3  3  3  3  4  3  3  4  4  3  4
## 6   6     1   4     2     2  5  3  3  5  4  3  4  3  3  3  4  5  3  2  3  3  4
##   E2 E3 E4 F1 F2 F3 F4 F5 Atb  Btb  Ctb  Dtb  Etb Ftb
## 1  3  3  4  4  5  3  4  5 4.4 3.00 4.50 4.33 3.00 4.2
## 2  4  3  4  3  3  3  4  5 3.6 4.50 2.50 3.33 3.50 3.6
## 3  3  3  4  4  4  4  4  5 3.0 4.25 3.75 3.67 3.50 4.2
## 4  4  3  4  5  5  4  4  5 3.8 5.00 2.50 3.33 3.50 4.6
## 5  3  3  4  2  5  4  4  5 4.0 3.00 3.25 3.67 3.50 4.0
## 6  4  3  4  3  3  5  4  5 4.0 3.25 3.75 2.67 3.75 4.0
dim(data1)
## [1] 198  36
# Nhập liệu File thứ hai
file2=file.choose()
data2=read.csv(file2,header=TRUE)
head(data2)
##   STT HT1 HT2 HT3 HT4 HL1 HL2 HL3 TT1 TT2 TT3 TT4 TS1 TS2 TS3 TS4 DT1 DT2 DT3
## 1   1   6   6   6   6   6   6   6   7   7   6   6   4   4   4   4   4   4   4
## 2   2   7   7   7   7   7   7   7   7   7   7   7   5   5   5   5   3   3   3
## 3   3   7   7   7   7   7   7   7   7   7   7   7   5   5   5   5   3   3   3
## 4   4   7   7   7   7   7   7   7   7   7   7   7   3   3   3   5   5   3   3
## 5   5   7   6   6   6   5   5   5   7   6   7   7   4   4   5   5   3   3   3
## 6   6   6   6   6   6   5   5   5   6   5   5   6   3   3   4   3   4   5   5
##   GTINH DTUOI HNHAN
## 1     2     3     2
## 2     2     3     2
## 3     2     2     2
## 4     1     1     2
## 5     1     4     2
## 6     1     3     2
dim(data2)
## [1] 200  22
# Ghép 2 file dữ liệu theo biến STT
datafinal=merge(data1,data2,by="STT")
head(datafinal)
##   STT GTINH.x TDO DTUOI.x TNHAP A1 A2 A3 A4 A5 B1 B2 B3 B4 C1 C2 C3 C4 D1 D2 D3
## 1   1       2   4       1     3  5  5  3  5  4  3  2  3  4  5  5  4  4  4  5  4
## 2   2       2   2       2     3  3  3  3  5  4  4  5  4  5  2  3  3  2  3  4  3
## 3   3       2   4       1     2  3  3  3  3  3  4  4  4  5  4  4  3  4  3  4  4
## 4   4       1   4       2     2  5  3  3  4  4  5  5  5  5  1  2  4  3  5  4  1
## 5   5       2   3       1     1  5  3  3  5  4  3  3  3  3  3  4  3  3  4  4  3
## 6   6       1   4       2     2  5  3  3  5  4  3  4  3  3  3  4  5  3  2  3  3
##   E1 E2 E3 E4 F1 F2 F3 F4 F5 Atb  Btb  Ctb  Dtb  Etb Ftb HT1 HT2 HT3 HT4 HL1
## 1  2  3  3  4  4  5  3  4  5 4.4 3.00 4.50 4.33 3.00 4.2   6   6   6   6   6
## 2  3  4  3  4  3  3  3  4  5 3.6 4.50 2.50 3.33 3.50 3.6   7   7   7   7   7
## 3  4  3  3  4  4  4  4  4  5 3.0 4.25 3.75 3.67 3.50 4.2   7   7   7   7   7
## 4  3  4  3  4  5  5  4  4  5 3.8 5.00 2.50 3.33 3.50 4.6   7   7   7   7   7
## 5  4  3  3  4  2  5  4  4  5 4.0 3.00 3.25 3.67 3.50 4.0   7   6   6   6   5
## 6  4  4  3  4  3  3  5  4  5 4.0 3.25 3.75 2.67 3.75 4.0   6   6   6   6   5
##   HL2 HL3 TT1 TT2 TT3 TT4 TS1 TS2 TS3 TS4 DT1 DT2 DT3 GTINH.y DTUOI.y HNHAN
## 1   6   6   7   7   6   6   4   4   4   4   4   4   4       2       3     2
## 2   7   7   7   7   7   7   5   5   5   5   3   3   3       2       3     2
## 3   7   7   7   7   7   7   5   5   5   5   3   3   3       2       2     2
## 4   7   7   7   7   7   7   3   3   3   5   5   3   3       1       1     2
## 5   5   5   7   6   7   7   4   4   5   5   3   3   3       1       4     2
## 6   5   5   6   5   5   6   3   3   4   3   4   5   5       1       3     2
dim(datafinal)
## [1] 198  57
# Kiểm tra dữ liệu A1, HT11 có đạt Phân phối chuẩn
shapiro.test(datafinal$A1)
## 
##  Shapiro-Wilk normality test
## 
## data:  datafinal$A1
## W = 0.73786, p-value < 2.2e-16
shapiro.test(datafinal$HT1)
## 
##  Shapiro-Wilk normality test
## 
## data:  datafinal$HT1
## W = 0.85649, p-value = 1.064e-12
# Kiểm định Wilcoxon (Dữ liệu không PPC)
wilcox.test(datafinal$A1, datafinal$HT1, paired=TRUE)
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  datafinal$A1 and datafinal$HT1
## V = 247, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
summary(datafinal$A1)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   3.000   4.000   4.146   5.000   5.000
summary(datafinal$HT1)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   5.000   6.000   5.763   7.000   7.000
# Kiểm định Paired Sample T-Test (Dữ liệu có PPC)
t.test(datafinal$A1, datafinal$HT1, paired=TRUE)
## 
##  Paired t-test
## 
## data:  datafinal$A1 and datafinal$HT1
## t = -17.82, df = 197, p-value < 2.2e-16
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -1.795014 -1.437309
## sample estimates:
## mean difference 
##       -1.616162
summary(datafinal$A1)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   3.000   4.000   4.146   5.000   5.000
summary(datafinal$HT1)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   3.000   5.000   6.000   5.763   7.000   7.000