공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개 샘플을 뽑았음 유의수준 5%에서 부호 검정하시오
# packages
library("tidyverse")
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.5 v dplyr 1.0.7
## v tidyr 1.1.4 v stringr 1.4.0
## v readr 2.0.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
데이터 EDA 수행 후, 분석가 입장에서 의미있는 탐색
tube <- read.csv("problem2.csv")
head(tube)
## name life.span
## 1 sample1 10000
## 2 sample2 9000
## 3 sample3 9500
## 4 sample4 10000
## 5 sample5 10000
## 6 sample6 8900
## name life.span
## Length:12 Min. : 8900
## Class :character 1st Qu.: 9725
## Mode :character Median :10000
## Mean : 9793
## 3rd Qu.:10005
## Max. :10300
귀무가설, 연구가설 세우기
# 귀무 가설 수명 1만 시간
# 연구 가설 수명 1만 시간 아니다
유효한 데이터의 개수는?
boxplot(tube$life.span) # 아래 2개는 이상치로 제거

tube %>% arrange(life.span)
## name life.span
## 1 sample6 8900
## 2 sample2 9000
## 3 sample3 9500
## 4 sample12 9800
## 5 sample7 9900
## 6 sample1 10000
## 7 sample4 10000
## 8 sample5 10000
## 9 sample11 10000
## 10 sample10 10020
## 11 sample8 10100
## 12 sample9 10300
ef.tube <- tube %>% filter(life.span > 9000)
ef.tube # 이상치 제거 데이터
## name life.span
## 1 sample1 10000
## 2 sample3 9500
## 3 sample4 10000
## 4 sample5 10000
## 5 sample7 9900
## 6 sample8 10100
## 7 sample9 10300
## 8 sample10 10020
## 9 sample11 10000
## 10 sample12 9800
검정통계량 및 연구가설 채택 여부를 작성하라
# p-value = 0.1368 -> 0.05 보다 크므로 정규분포다
shapiro.test(ef.tube$life.span)
##
## Shapiro-Wilk normality test
##
## data: ef.tube$life.span
## W = 0.8818, p-value = 0.1368
# p-value < 2.2e-16 -> 0.05 보다 작으므로 mu 기각
#수명은 1만시간다 라고 할 수 없다.
t.test(ef.tube$life.span, alternative = c("two.sided"), mu = 0)
##
## One Sample t-test
##
## data: ef.tube$life.span
## t = 152.12, df = 9, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## 9813.86 10110.14
## sample estimates:
## mean of x
## 9962