1 - Inserindo os dados no R

cod<- c(57, 60, 49, 50, 51, 60, 49, 53, 49, 56, 64, 60, 49, 52, 69, 40, 44, 38, 53, 66)
cod
##  [1] 57 60 49 50 51 60 49 53 49 56 64 60 49 52 69 40 44 38 53 66
str(cod)
##  num [1:20] 57 60 49 50 51 60 49 53 49 56 ...

Média

mean(cod)
## [1] 53.45

2 - Analise exploratória

summary(cod)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   38.00   49.00   52.50   53.45   60.00   69.00
sort(cod)
##  [1] 38 40 44 49 49 49 49 50 51 52 53 53 56 57 60 60 60 64 66 69

3 - Visualizando distribuição dos dados

boxplot(cod, col="green", ylab = "Demanda Química de Oxigênio mg/l")

4 - Teste de Shapiro-wilks de normalidade

shapiro.test(cod)
## 
##  Shapiro-Wilk normality test
## 
## data:  cod
## W = 0.97281, p-value = 0.8127
# Diferença observada 
mean(cod)
## [1] 53.45
### 4.1 - Teste de intervalo de confiança - Tstudent 

#com alpha = 5% 
t.test(cod, alternative = c("two.sided"), mu = 50, conf.level = 0.95)
## 
##  One Sample t-test
## 
## data:  cod
## t = 1.8894, df = 19, p-value = 0.07419
## alternative hypothesis: true mean is not equal to 50
## 95 percent confidence interval:
##  49.62825 57.27175
## sample estimates:
## mean of x 
##     53.45

5 - Teste não-paramétrico de Wilcoxon

wilcox.test(cod, mu = 50, conf.int = TRUE)
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  cod
## V = 139, p-value = 0.07905
## alternative hypothesis: true location is not equal to 50
## 95 percent confidence interval:
##  49.00001 58.00001
## sample estimates:
## (pseudo)median 
##       53.66572

Exercício 2

A autorização de despejo para uma indústria requer que a concentração média mensal de COD seja inferior a 50 mg/L. A indústria quer que isso seja interpretado como “50 mg/L está dentro do intervalo de confiança da média, que vai ser estimada a partir de 20 observações por mês.”

a) Você concorda com a interpretação proposta pela indústria? Por que?

R: Não, a proposta da indústria é errônea. Mesmo que o valor da média da Demanda Química de Oxigênio (n= 53,45) esteja dentro da estimativa do intervalo de confiança (COD 49 a COD 58) pelo teste não-paramétrico de Wilcoxon e pelo Test T (COD 49,62 a COD 57,27), os valores medidos diariamente são absolutos e revelam um quantitativo superior ao autorizado. Assim, entende-se que a indústria deseja manipular erroneamente um modelo estatistico para que consiga despejar os efluentes. Baseando-se na rejeição da hipótese nula proposta pela industria, podemos obter os valores de diferença observada em 7% (p-value) devido ao erro de amostragem aleatória.

b) Para as 20 observações seguintes, estaria a indústria em conformidade com a interpretação que você considerou adequada em a)?

R: A industria continuaria despejando os efluentes acima do limite permitido pela sua autorização. Isto porque, o nível de significância é de 5%, sendo o valor de p-value (0.07905) superior, indicando que é provável que os dados de referência coletados sejam válidos para as 20 observações seguintes, rejeitando-se a hipótese nula e aceitando de que a concentração média mensal será superior ao permitido.