統計学特論第11回解答例

（課題1）

1-1ある⼊学試験に700⼈の応募があった。試験の結果、100点満点で平均点は65点、標準偏差は10であった。上位の300⼈を合格とする時、何点以上が合格となるか。ただし、受験⽣の得点は正規分布に従うと仮定する。 1-2この時、85点以上の⼈は、全体の何%か︖

（課題2-1）

ある家電製品の寿命を区間推定して、取扱説明書に書き込みたい。今までのデータから、⺟標準偏差σ=150時間であることがわかっている。この製品を100個標本抽出し、検査をしたところ、寿命の標本平均は2520 時間であった。⺟平均μを95%信頼係数の元で区間推定せよ。

（参考文献：鳥居(1994)はじめての統計学, 日本経済新聞出版）

（課題2-1解き方）

パッケージの用意

install.packages("dplyr",repos = "http://cran.us.r-project.org") # 一度もインストールしていない場合

## 
## The downloaded binary packages are in
##  /var/folders/nm/m79f0x2d79768ww18g9h71340000gp/T//RtmpuImxCk/downloaded_packages

install.packages("ggplot2",repos = "http://cran.us.r-project.org") # 一度もインストールしていない場合

## 
## The downloaded binary packages are in
##  /var/folders/nm/m79f0x2d79768ww18g9h71340000gp/T//RtmpuImxCk/downloaded_packages

library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

library(ggplot2)

データの用意

set.seed(100)
data <- rnorm(100, 2520, 150) %>% round() 
#平均2520, 標準偏差150の標準正規分布に従う値100個の乱数を発生させ、 round()で整数値にして、変数「data」に格納する。

library(BSDA)#z.testを行うために必要なパッケージ

## Loading required package: lattice

## 
## Attaching package: 'BSDA'

## The following object is masked from 'package:datasets':
## 
##     Orange

z.test(x=data, y = NULL, alternative = "two.sided", mu = 0, sigma.x = 150, sigma.y = NULL, conf.level = 0.95)#xは信頼区間を求めるデータを指定。yはこの場合、NULL(指定なし)。alternative="two.sided"は両側検定, mu=0は帰無仮説と平均値が違う場合に指定。sigma.xは母集団の標準偏差, sigma.yもデータがある場合は同様。conf.levelは指定したい信頼区間。

## 
##  One-sample z-Test
## 
## data:  data
## z = 168.03, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  2491.021 2549.819
## sample estimates:
## mean of x 
##   2520.42

結果の解釈

区間推定の結果を読み取ると、⺟平均μを95%信頼係数の元で区間推定すると2491.021時間以上2549.819時間以下の範囲に収まる。

（課題2-2）

10000⼈にYoutubeの視聴率調査をしました。あるチャンネルを⾒た⼈は 2100⼈でした。このチャンネルの視聴率の95%信頼区間を求めてください。

（参考文献：稲垣他(2007)統計学講義, 裳華房）

（課題2-2の解き方）

prop.test(2100,10000)

## 
##  1-sample proportions test with continuity correction
## 
## data:  2100 out of 10000, null probability 0.5
## X-squared = 3362.8, df = 1, p-value < 2.2e-16
## alternative hypothesis: true p is not equal to 0.5
## 95 percent confidence interval:
##  0.2020797 0.2181444
## sample estimates:
##    p 
## 0.21

関数の説明

x：成功（または関心のあるカテゴリ）の数

n：試行回数（成功と失敗の合計）

p：オプションの成功の比例を指定する場合に使用します

alternative：代替仮説のタイプを指定します（“two.sided”、“less”、“greater”のいずれか）

conf.level：信頼水準（デフォルトは0.95）

prop.test()関数は、以下の情報を提供します。

推定された比率（割合）

比率が特定の値と等しいかどうかの検定結果（帰無仮説検定）

信頼区間（デフォルトでは95%信頼区間）

関数を実行すると、検定結果や推定値、信頼区間などの結果が表示されます。

例えば、

prop.test(25, 100, p =0.5)

は、成功回数が25で試行回数が100の場合に、成功の比例が0.5と等しいかどうかを検定します。

結果の解釈

この問題では、信頼区間を求めれば良いので、

95 percent confidence interval: 0.2020797 0.2181444

の部分を参照します。

このため、この候補者の95%信頼区間は、0.2020797以上 0.2181444以下となります。

つまり、真の視聴率がこの区間に含まれる確率が95%です。

統計学特論第11回解答例

2023-07-09

（課題1）

（課題2-1）

（課題2-1解き方）

パッケージの用意

データの用意

結果の解釈

（課題2-2）

（課題2-2の解き方）

関数の説明

結果の解釈