課題1(母平均の信頼区間)

𝑋̅=158cm, σ=10, n=5の場合の母平均μの95%信頼区間をRを用いて求めてください。

パッケージの用意

install.packages("dplyr",repos = "http://cran.us.r-project.org") # 一度もインストールしていない場合
## 
## The downloaded binary packages are in
##  /var/folders/r9/h9w1r6pn0qd3c5pc5bwjr7gc0000gp/T//Rtmp70fY7Y/downloaded_packages
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
install.packages("lattice",repos = "http://cran.us.r-project.org") # 一度もインストールしていない場合
## 
## The downloaded binary packages are in
##  /var/folders/r9/h9w1r6pn0qd3c5pc5bwjr7gc0000gp/T//Rtmp70fY7Y/downloaded_packages
install.packages("BSDA",repos = "http://cran.us.r-project.org") # 一度もインストールしていない場合
## 
## The downloaded binary packages are in
##  /var/folders/r9/h9w1r6pn0qd3c5pc5bwjr7gc0000gp/T//Rtmp70fY7Y/downloaded_packages

データの用意

set.seed(100)#乱数の再現性を担保するための関数。()内の数字が同じであれば、同じ乱数を発生させることができる。
data <- rnorm(5, 158, 10) %>% round() 
#平均158, 標準偏差10の標準正規分布に従う値5個の乱数を発生させ、 round()で整数値にして、変数「data」に格納する。

分析

library(BSDA)#z.testを行うために必要なパッケージ
## Loading required package: lattice
## 
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
## 
##     Orange
z.test(x=data, y = NULL, alternative = "two.sided", mu = 158, sigma.x = 10, sigma.y = NULL, conf.level = 0.95)#xは信頼区間を求めるデータを指定。yはこの場合、NULL(指定なし)。alternative="two.sided"は両側検定, mu=0は帰無仮説と平均値が違う場合に指定。sigma.xは母集団の標準偏差, sigma.yもデータがある場合は同様。conf.levelは指定したい信頼区間。
## 
##  One-sample z-Test
## 
## data:  data
## z = 0.22361, p-value = 0.8231
## alternative hypothesis: true mean is not equal to 158
## 95 percent confidence interval:
##  150.2348 167.7652
## sample estimates:
## mean of x 
##       159

結果の解釈

区間推定の結果を読み取ると、⺟平均μを95%信頼係数の元で区間推定すると150.2348cm以上167.7652cm以下の範囲に収まる。

課題2 (母分散の差の検定)

A校の生徒16名、B校の生徒12名に読解力テストを実施して、A校の平均73点、標準偏差27点、B校の平均56点、標準偏差14点を得ました。両校の成績のばらつきは異なると言えるでしょうか?Rを用いて求めてください。

データの用意

set.seed(110)
data1 <- rnorm(16, 73, 27) %>% round() 
#平均73, 標準偏差10の標準正規分布に従う値5個の乱数を発生させ、 round()で整数値にして、変数「data」に格納する。
set.seed(120)
data2<- rnorm(12, 56, 14) %>% round() 

分析

var.test(data1,data2)
## 
##  F test to compare two variances
## 
## data:  data1 and data2
## F = 3.7148, num df = 15, denom df = 11, p-value = 0.03351
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##   1.115584 11.173548
## sample estimates:
## ratio of variances 
##           3.714823

結果の解釈

帰無仮説 (H0) は2群間の母分散は等しい 対立仮説(H1)は2群間の母分散は等しくない

p-value = 0.03351なので、有意水準0.05を下回っている。このため、帰無仮説を棄却し、両校の成績にばらつきがないとは言えない。 結果の F,num df,denom df はそれぞれF統計量,分子の自由度,分母の自由度を示す。 95%信頼区間はデータBに対するデータAの比の信頼区間であり,左の値が最小値,右の値が最大値を示す。この場合、その区間に1が入らないため、データの分散の比が1に等しくないという対立仮説は採択される。 また,ratio of variances はデータAとBの単なる分散の比を示す。