母分散の差の検定

A校の生徒16名、B校の生徒12名に読解力テストを実施して、A校の平均73点、標準偏差27点、B校の平均56点、標準偏差14点を得ました。両校の成績のばらつきは異なると言えるでしょうか?Rを用いて求めてください。

パッケージの用意

install.packages("dplyr",repos = "http://cran.us.r-project.org") # 一度もインストールしていない場合
## 
## The downloaded binary packages are in
##  /var/folders/r9/h9w1r6pn0qd3c5pc5bwjr7gc0000gp/T//RtmpQYMtxg/downloaded_packages

データの用意

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
set.seed(110)
data1 <- rnorm(16, 73, 27) %>% round() 
#平均73, 標準偏差27の標準正規分布に従う値16個の乱数を発生させ、 round()で整数値にして、変数「data1」に格納する。
set.seed(120)
data2<- rnorm(12, 56, 14) %>% round() 
#平均56, 標準偏差14の標準正規分布に従う値12個の乱数を発生させ、 round()で整数値にして、変数「data1」に格納する。

分析

var.test(data1,data2)
## 
##  F test to compare two variances
## 
## data:  data1 and data2
## F = 3.7148, num df = 15, denom df = 11, p-value = 0.03351
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##   1.115584 11.173548
## sample estimates:
## ratio of variances 
##           3.714823

結果の解釈

帰無仮説 (H0) は2群間の母分散は等しい 対立仮説(H1)は2群間の母分散は等しくない

p-value = 0.03351なので、有意水準0.05を下回っている。このため、帰無仮説を棄却し、両校の成績にばらつきがないとは言えない。

結果の F,num df,denom df はそれぞれF統計量,分子の自由度,分母の自由度を示す。

95%信頼区間はデータBに対するデータAの比の信頼区間であり,左の値が最小値,右の値が最大値を示す。この場合、その区間に1が入らないため、データの分散の比が1に等しくないという対立仮説は採択される。

また,ratio of variances はデータAとBの単なる分散の比を示す。

カイ2乗検定

表で示された学歴と結婚に対する適応性の間になんらかの関連があるか?

データの用意

dm=matrix(c(18,29,70,115,17,28, 30, 41, 11, 10, 11, 20),nrow=3,byrow=T)
#nrowは行数を3にするという意味。
#byrow=Tだとc()内の数字を横向きにデータを格納する。
dm #dmにデータが思い通りに入ったか確認。
##      [,1] [,2] [,3] [,4]
## [1,]   18   29   70  115
## [2,]   17   28   30   41
## [3,]   11   10   11   20
chisq.test(dm)
## 
##  Pearson's Chi-squared test
## 
## data:  dm
## X-squared = 19.943, df = 6, p-value = 0.002835

結果の解釈

X-squared = 19.943というのがカイ2乗値 df=6というのが自由度 p-value = 0.002835がp値 5%有意水準を仮定すれば、p-value = 0.002835<0.05 なので、帰無仮説を棄却する(有意水準5%における棄却域に入る)。 このため、2つの変数間には関連がないとは言えない。

残差分析

どのセルがどれくらい予想より離れた値であるかは残差分析を行う。 下記など参照。 (リンク先のアドレスをコピーした上で、新しいタブで開くと開ける。そのままクリックするとアクセスを拒否される。) https://bob3.hatenablog.com/entry/20110521/p1