1 공장에서는 진공관 수명이 1만 시간이라고 주장하여 품질관리팀에서 12개 샘플을 뽑았음 유의수준 5%에서 부호 검정하시오


# packages
library("tidyverse") 
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.5     v dplyr   1.0.7
## v tidyr   1.1.4     v stringr 1.4.0
## v readr   2.0.2     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()

1.1 데이터 EDA 수행 후, 분석가 입장에서 의미있는 탐색

tube <- read.csv("problem2.csv")
head(tube)
##      name life.span
## 1 sample1     10000
## 2 sample2      9000
## 3 sample3      9500
## 4 sample4     10000
## 5 sample5     10000
## 6 sample6      8900
summary(tube)
##      name             life.span    
##  Length:12          Min.   : 8900  
##  Class :character   1st Qu.: 9725  
##  Mode  :character   Median :10000  
##                     Mean   : 9793  
##                     3rd Qu.:10005  
##                     Max.   :10300

1.2 귀무가설, 연구가설 세우기

# 귀무 가설 수명 1만 시간 
# 연구 가설 수명 1만 시간 아니다

1.3 유효한 데이터의 개수는?

boxplot(tube$life.span) # 아래 2개는 이상치로 제거 

tube %>% arrange(life.span)
##        name life.span
## 1   sample6      8900
## 2   sample2      9000
## 3   sample3      9500
## 4  sample12      9800
## 5   sample7      9900
## 6   sample1     10000
## 7   sample4     10000
## 8   sample5     10000
## 9  sample11     10000
## 10 sample10     10020
## 11  sample8     10100
## 12  sample9     10300
ef.tube <- tube %>% filter(life.span > 9000)
ef.tube # 이상치 제거 데이터
##        name life.span
## 1   sample1     10000
## 2   sample3      9500
## 3   sample4     10000
## 4   sample5     10000
## 5   sample7      9900
## 6   sample8     10100
## 7   sample9     10300
## 8  sample10     10020
## 9  sample11     10000
## 10 sample12      9800

1.4 검정통계량 및 연구가설 채택 여부를 작성하라

# p-value = 0.1368 -> 0.05 보다 크므로 정규분포다 
shapiro.test(ef.tube$life.span) 
## 
##  Shapiro-Wilk normality test
## 
## data:  ef.tube$life.span
## W = 0.8818, p-value = 0.1368
# p-value < 2.2e-16 -> 0.05 보다 작으므로 mu 기각 
#수명은 1만시간다 라고 할 수 없다.
t.test(ef.tube$life.span, alternative = c("two.sided"), mu = 0) 
## 
##  One Sample t-test
## 
## data:  ef.tube$life.span
## t = 152.12, df = 9, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##   9813.86 10110.14
## sample estimates:
## mean of x 
##      9962