2장. 일표본 위치문제 연습문제

3. 다음은 전화 교환소에서 교환해 주는 두 전화 간 시간의 차이를 나타낸 데이터이다.(단위 : 초) 유의수준 \(\alpha = 0.05\)에서 부호검정을 이용하여 두 전화 간 시간의 차이가 6.2초보다 작은지에 대하여 검정하여라.

두 전화 간 시간의 차이 평균을 \(\delta\)라 하면, 가설은 다음과 같이 설정한다. \[H_0: \delta = 6.2 ; H_1: \delta \lt 6.2\]

데이터를 입력한다.

a <- c(6.8, 5.7,6.9,5.3,4.1,9.8,1.7,7.0,2.1,19.0,18.9,16.9,10.4,44.1,2.9,2.4,4.8,18.9,4.8,7.9)
a
##  [1]  6.8  5.7  6.9  5.3  4.1  9.8  1.7  7.0  2.1 19.0 18.9 16.9 10.4 44.1
## [15]  2.9  2.4  4.8 18.9  4.8  7.9

중앙값은 6.2(초), 단측검정이며 검정의 유의수준이 0.05이므로 신뢰수준을 0.95로 하였다.

library(BSDA)
## Loading required package: lattice
## 
## Attaching package: 'BSDA'
## The following object is masked from 'package:datasets':
## 
##     Orange
test.out <- SIGN.test(a, md = 6.2, alternative = "less", conf.level = 0.95)
test.out
## 
##  One-sample Sign-Test
## 
## data:  a
## s = 11, p-value = 0.7483
## alternative hypothesis: true median is less than 6.2
## 95 percent confidence interval:
##      -Inf 9.924322
## sample estimates:
## median of x 
##        6.85 
## 
## Achieved and Interpolated Confidence Intervals: 
## 
##                   Conf.Level L.E.pt  U.E.pt
## Lower Achieved CI     0.9423   -Inf  9.8000
## Interpolated CI       0.9500   -Inf  9.9243
## Upper Achieved CI     0.9793   -Inf 10.4000

부호 검정 결과에 따르면, 두 전화 간 시간의 차이를 데이터로 사용하면, 부호검정통계량이 11, 유의확률이 0.7483 임을 알 수 있다. 대립가설은 중앙값이 6.2(초)보다 작다는 단측 대립가설을 보여준다. 유의확률이 0.7485(>0.05)이므로 귀무가설을 기각하지 못한다. 따라서 유의수준 5%하에서 두 전화 간 시간의 차이는 6.2(초)와 같다는 결론을 내린다.

6. 랜덤하게 선택된 10명의 자연계열 신입생에게 심리검사를 실시한 결과 책임감에 대한 득점이 다음과 같이 나타났다.

6.1. 부호순위검정을 이용하여 모집단의 위치모수에 관한 점추정과 95% 신뢰구간을 구하여라.

데이터를 벡터 b에 입력한다.

b <- c(28.5,25.2,28.7,41.0,29.1,32.3,37.7,39.9,26.8,28.8)
b
##  [1] 28.5 25.2 28.7 41.0 29.1 32.3 37.7 39.9 26.8 28.8

데이터 b에 대해 표본 중앙값을 평균으로 잡고, 신뢰수준을 0.95로 입력하여 유의수준 0.05에서 부호순위검정을 실시했다.

wilcox.test(b, mu = median(b), conf.int = TRUE, conf.level = 0.95)
## 
##  Wilcoxon signed rank test
## 
## data:  b
## V = 34, p-value = 0.5566
## alternative hypothesis: true location is not equal to 28.95
## 95 percent confidence interval:
##  27.75 35.05
## sample estimates:
## (pseudo)median 
##          31.45

부호순위검정을 이용하여 모집단의 위치모수에 관한 점추정 결과 31.45로 나타났다. 또한, 95% 신뢰구간은 (27.75, 35.05) 이다.

6.2. 부호검정이 아닌 부호순위검정의 선택이 옳은가를 점분포도를 그려 확인하라.

점분포도(dot diagram)을 그리면 데이터가 한쪽으로 쏠려있어 대칭성을 확보하지 못하는 지를 한눈에 파악할 수 있다.

library(extrafont)
## Registering fonts with R
stripchart(b, pch = 20, col = 'blue', main = "점 분포도(dot diagram)", family = "NanumGothic")

위의 점 분포도(dot diagram)을 그려본 결과 25에서 30 구간에 비교적 많은 데이터가 몰려 있는 것으로 보인다. 나머지 구간은 1개에서 2개 데이터가 있으므로 좌우 대칭이라고 보기 어렵다.

11. 어떤 연속 대칭 분포로부터 얻은 확률표본의 값들을 나타낸 데이터이다. 부호순위검정을 이용하여 유의수준 \(\alpha = 0.05\)에서 평균의 값이 160보다 큰가에 대하여 검정하여라.

12. 서로 다른 7개의 우주선에 의해 계측된 지구와 달과의 질량의 비의 평균값들을 나타낸 것이다.

그러나 2~3년 전에 다른 우주선에 의하여 계측된 비는 81.3035이었다. 부호순위검정을 이용하여 유의수준 \(\alpha = 0.05\)에서 평균비가 81.3035인가에 대하여 검정하여라.

12.1. 부호순위검정을 이용하여 유의수준 \(\alpha = 0.05\)에서 평균비가 81.3035인가에 대하여 검정하여라.

지구와 달과의 질량의 비 평균값을 \(\theta\)라고 하면, 가설을 다음과 같이 설정한다. \[H_0: \theta = 81.3035 ; H_1: \theta \ne 81.3035\]

데이터를 입력한다.

d <- c(81.3001,81.3015,81.3006,81.3011,81.2997,81.3005,81.3021)
d
## [1] 81.3001 81.3015 81.3006 81.3011 81.2997 81.3005 81.3021

평균값은 81.3035, 양쪽검정이며 검정의 유의수준이 0.05이므로 신뢰수준을 0.95로 하였다.

wilcox.test(d, mu = 81.3035, alternative = "two.sided", conf.int = F, conf.level = 0.95)
## 
##  Wilcoxon signed rank test
## 
## data:  d
## V = 0, p-value = 0.01563
## alternative hypothesis: true location is not equal to 81.3035

부호순위검정 결과에 따르면, 지구와 달과의 질량의 비의 평균값들을 데이터로 사용하면, 부호순위검정통계량이 0이고, 유의확률이 0.01563 임을 알 수 있다. 대립가설은 평균이 81.3035과 같지 않다는 양측 대립가설을 보여준다. 유의확률이 0.01563(<0.05)이므로 귀무가설을 기각한다. 따라서 유의수준 5%하에서 지구와 달과의 질량의 평균비는 81.3035와 다르다는 결론을 내린다.

12.2. \(\theta\)의 점추정을 하여라. 신뢰수준이 90%로 변경하고 다시 부호순위검정을 실시했다.

wilcox.test(d, mu = 81.3035, alternative = "two.sided", conf.int = T, conf.level = 0.90)
## 
##  Wilcoxon signed rank test
## 
## data:  d
## V = 0, p-value = 0.01563
## alternative hypothesis: true location is not equal to 81.3035
## 90 percent confidence interval:
##  81.3001 81.3015
## sample estimates:
## (pseudo)median 
##        81.3008

위의 부호순위검정을 실시했을 때, 점추정량은 81.3008로 나타났다.

12.3. \(\theta\)에 대한 90% 신뢰구간을 구하여라. 신뢰수준이 90%로 변경하고 다시 부호순위검정을 실시했다.

wilcox.test(d, mu = 81.3035, alternative = "two.sided", conf.int = T, conf.level = 0.90)
## 
##  Wilcoxon signed rank test
## 
## data:  d
## V = 0, p-value = 0.01563
## alternative hypothesis: true location is not equal to 81.3035
## 90 percent confidence interval:
##  81.3001 81.3015
## sample estimates:
## (pseudo)median 
##        81.3008

부호순위검정을 실시한 결과, \(\theta\)에 대한 90% 신뢰구간은 (81.3001, 81.3015)임을 알 수 있다.

14. 육체적, 정신적으로 건강한 50 ~ 60세 사이의 남자들을 대상으로 실시한 잠자는 태도에 대한 연구 결과로 “0단계(stage 0)”가 총 수면시간에 차지하는 비율을 나타낸 것이다.(단위 : 퍼센트)

부호검정을 이용하여 비율의 위치모수에 대한 점추정과 90% 신뢰구간을 구하여라.

우선 데이터를 입력한다.

e <- c(0.07,0.69,1.74,1.90,1.99,2.41,3.07,3.08,3.10,3.53,3.71,4.01,8.11,8.23,9.10,10.16)
e
##  [1]  0.07  0.69  1.74  1.90  1.99  2.41  3.07  3.08  3.10  3.53  3.71
## [12]  4.01  8.11  8.23  9.10 10.16
test.out2 <- SIGN.test(e, md = median(e), conf.int = T, conf.level = 0.90)
test.out2
## 
##  One-sample Sign-Test
## 
## data:  e
## s = 8, p-value = 1
## alternative hypothesis: true median is not equal to 3.09
## 90 percent confidence interval:
##  2.063058 3.957816
## sample estimates:
## median of x 
##        3.09 
## 
## Achieved and Interpolated Confidence Intervals: 
## 
##                   Conf.Level L.E.pt U.E.pt
## Lower Achieved CI     0.7899 2.4100 3.7100
## Interpolated CI       0.9000 2.0631 3.9578
## Upper Achieved CI     0.9232 1.9900 4.0100

부호 검정을 실시한 결과에 따르면, 점 추정량은 3.09이고, 90% 신뢰구간은 (2.0631, 3.9578)이다.