表1のシャピロ・ウイルクの検定結果から,握力(p = 0.0011 < 0.05) と年齢(p = 0.0000 < 0.05) は正規分布ではなく,身長(p = 0.1009 > 0.05)が正規分布であるから, いずれも少なくとも1方が非正規分布のため,すべてスピアマンの順位相関係数である。
表3により,握力と身長(p = 0.0000 < 0.05)は,有意な相関(結果)があると認められる。
握力と身長は有意な相関があり,表2により,その相関係数は0.7665で,強い正の相関を有する。
Aさん~Gさんの数学と理科のテスト成績が次のようになる。数学と理科の成績の間に相関性があるか,RstudioまたはEZR(例2のようにデータをインポート)を用いて相関検定を行い,相関係数と散布図も求めなさい。
数学と理科の成績をベクトルとして,それぞれxとyに代入して, シャピロ・ウィルク検定を用い,それぞれの正規性を検定する。 2方とも,正規分布であれば,ピアソン相関係数を求め,少なくとも 1方が非正規分布なら,スピアマン順位相関係数を求める。最後に 検定結果を解釈する。
#相関係数(ピアソンかスピアマンか自動判断)
# データ:
x <- c(71, 45, 88, 51, 48, 56, 40)
y <- c(50, 35, 92, 44, 65, 66, 33)
#データの正規性をシャピロ・ウィルク検定で確認
shapiro_x <- shapiro.test(x)
shapiro_y <- shapiro.test(y)
cat("xのシャピロ検定 p値: ", shapiro_x$p.value, "\n")
## xのシャピロ検定 p値: 0.2579559
cat("yのシャピロ検定 p値: ", shapiro_y$p.value, "\n")
## yのシャピロ検定 p値: 0.4766395
# 正規性の判定 (p値 > 0.05なら正規分布とみなす)
if (shapiro_x$p.value > 0.05 & shapiro_y$p.value > 0.05) {
cat("両変数は正規分布とみなされるため、ピアソン相関係数を利用する。\n")
# ピアソン相関係数の計算
result <- cor.test(x, y, method = "pearson")
} else {
cat("少なくとも一方が正規分布でないため、スピアマン順位相関係数を利用する。\n")
# スピアマン順位相関係数の計算
result <- cor.test(x, y, method = "spearman")
}
## 両変数は正規分布とみなされるため、ピアソン相関係数を利用する。
# 相関結果の出力
cat("相関係数: ", result$estimate, "\n")
## 相関係数: 0.7828269
cat("p値: ", result$p.value, "\n")
## p値: 0.03740906
# 有意性の判断
if (result$p.value < 0.05) {
cat("有意な相関が認められます。\n")
} else {
cat("有意な相関は認められません。\n")
}
## 有意な相関が認められます。
#散布図
plot(x, y, pch = 19, col = "red")
帰無仮説:数学と理科の成績間に相関性がない。
シャピロ検定結果,数学(p = 0.2579559 > 0.05)と 理科(p = 0.4766395 > 0.05)とも,正規分布に従う。
ピアソン相関係数が適用である。
ピアソン相関検定の結果,p = 0.03740906 < 0.05, 帰無仮説を 棄却できるから,統計的有意な相関が認め, 相関係数 r = 0.7828269であるため,かなり強い相関性があると判断できる。 また,散布図からも,正の強い相関が見られる。