cod<- c(57, 60, 49, 50, 51, 60, 49, 53, 49, 56, 64, 60, 49, 52, 69, 40, 44, 38, 53, 66)
cod
## [1] 57 60 49 50 51 60 49 53 49 56 64 60 49 52 69 40 44 38 53 66
str(cod)
## num [1:20] 57 60 49 50 51 60 49 53 49 56 ...
mean(cod)
## [1] 53.45
summary(cod)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 38.00 49.00 52.50 53.45 60.00 69.00
sort(cod)
## [1] 38 40 44 49 49 49 49 50 51 52 53 53 56 57 60 60 60 64 66 69
boxplot(cod, col="green", ylab = "Demanda Química de Oxigênio mg/l")
shapiro.test(cod)
##
## Shapiro-Wilk normality test
##
## data: cod
## W = 0.97281, p-value = 0.8127
# Diferença observada
mean(cod)
## [1] 53.45
### 4.1 - Teste de intervalo de confiança - Tstudent
#com alpha = 5%
t.test(cod, alternative = c("two.sided"), mu = 50, conf.level = 0.95)
##
## One Sample t-test
##
## data: cod
## t = 1.8894, df = 19, p-value = 0.07419
## alternative hypothesis: true mean is not equal to 50
## 95 percent confidence interval:
## 49.62825 57.27175
## sample estimates:
## mean of x
## 53.45
wilcox.test(cod, mu = 50, conf.int = TRUE)
##
## Wilcoxon signed rank test with continuity correction
##
## data: cod
## V = 139, p-value = 0.07905
## alternative hypothesis: true location is not equal to 50
## 95 percent confidence interval:
## 49.00001 58.00001
## sample estimates:
## (pseudo)median
## 53.66572
R: Não, a proposta da indústria é errônea. Mesmo que o valor da média da Demanda Química de Oxigênio (n= 53,45) esteja dentro da estimativa do intervalo de confiança (COD 49 a COD 58) pelo teste não-paramétrico de Wilcoxon e pelo Test T (COD 49,62 a COD 57,27), os valores medidos diariamente são absolutos e revelam um quantitativo superior ao autorizado. Assim, entende-se que a indústria deseja manipular erroneamente um modelo estatistico para que consiga despejar os efluentes. Baseando-se na rejeição da hipótese nula proposta pela industria, podemos obter os valores de diferença observada em 7% (p-value) devido ao erro de amostragem aleatória.
R: A industria continuaria despejando os efluentes acima do limite permitido pela sua autorização. Isto porque, o nível de significância é de 5%, sendo o valor de p-value (0.07905) superior, indicando que é provável que os dados de referência coletados sejam válidos para as 20 observações seguintes, rejeitando-se a hipótese nula e aceitando de que a concentração média mensal será superior ao permitido.