①教科書P.137の「問題2」を答えよう。
ウィルコクソンの検定の適用条件は,①対応のある1標本2変数の順序・間隔・比率尺度のデータで,②その2組のデータをシャピロ・ウイルクの検定で,少なくとも1組がp<0.05正規性を有しない。この2つの条件が満たしたら,ウィルコクソンの検定が適用される。
②A群とB群の体重を下図のように測定した。A群とB群の体重の差があるかどうか,検定しなさい(ヒント:まず,2群のデータの正規性を検定し,差の検定法を正しく選んでから検定を行う。また,検定法によって,下図のデータをExcelに入力するとき,例1 or 例2を参考して,データの形に要注意)。
A群とB群は,対応のない2標本の比率尺度のデータである。
①帰無仮説:A群とB群に体重の差がない。
②2群とも正規性がある場合(パラメトリック法),さらに等分散の検定を行い,等分散なら,2標本t検定,そうではない場合,ウェルチ検定を行う。2群のデータが少なくとも1群のデータは正規性を有しない場合(ノンパラメトリック法),マン・ホエットニーの検定(Wilcoxon rank sum testともいう)を行う。
下記のプログラムは,2群データの性質を自動的に判断し,2標本の差の検定法を正しく選んで実行する。
#2標本その検定
#9回目の例1のデータ(マン・ホエットニーの検定)
A <- c(60,70,72,66,64,72,76,66,68,65)
B <- c(68,72,65,66,65,64,64,65,68,65)
# 正規性の確認
res_A <- shapiro.test(A)
res_B <- shapiro.test(B)
print(res_A)
##
## Shapiro-Wilk normality test
##
## data: A
## W = 0.97886, p-value = 0.9588
print(res_B)
##
## Shapiro-Wilk normality test
##
## data: B
## W = 0.8005, p-value = 0.0147
if (res_A$p.value < 0.05 | res_B$p.value <0.05){
result <- wilcox.test(A, B, exact = FALSE) # Mann-Whitney U検定の実行
}else{
result <- t.test(A, B, var.equal = var.test(A, B)$p.value > 0.05) # t検定orウェルチ検定
}
print(result)
##
## Wilcoxon rank sum test with continuity correction
##
## data: A and B
## W = 64, p-value = 0.3009
## alternative hypothesis: true location shift is not equal to 0
#データの箱ひげ図表示
boxplot(list(data_A=A, data_B=B), col=c("yellow", "green"))
検定した結果,シャピロ検定でA群はp-value = 0.9588>0.05, B群はp-value = 0.0147<0.05となり,正規分布にしたがわないため, マン・ホエットニーの検定が適用され, そのp-value = 0.3009>0.05。帰無仮説を棄却できず, 即ち,体重の差がないかあるかと言えないと判断した。また,箱ひげ図から見ても,差があるかないかと判断できない。