Observações:

a) A resolução dos exercícios deve ser elaborada em um arquivo R Markdown; b) Formule os problemas como um teste de hipotese e como o cálculo de um Intervalo de Confiança; c) Faça uma análise exploratória breve; d) as conclusões devem ser claramente estabelecidas.


1- A autorização de despejo para uma indústria requer que a concentração média mensal de COD seja inferior a 50ml/L. A indústria quer que isso seja interpretado como “50ml/L está dentro do intervalo de confiança da média, que vai ser estimada a partir de 20 observações por mês”. Para as 20 observações seguintes, estaria a indústria em conformidade com esta interpretação do padrão?

conc <- c(57,60,49,50,51,60,49,53,49,56,64,60,49,52,69,40,44,38,53,66)


summary(conc)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   38.00   49.00   52.50   53.45   60.00   69.00
sort(conc)
##  [1] 38 40 44 49 49 49 49 50 51 52 53 53 56 57 60 60 60 64 66 69
stem(conc)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   3 | 8
##   4 | 049999
##   5 | 0123367
##   6 | 000469
boxplot(conc)

str(conc)
##  num [1:20] 57 60 49 50 51 60 49 53 49 56 ...
t.test (conc, mu=50, conf.level=0.95, alternative = c("less"))
## 
##  One Sample t-test
## 
## data:  conc
## t = 1.8894, df = 19, p-value = 0.9629
## alternative hypothesis: true mean is less than 50
## 95 percent confidence interval:
##     -Inf 56.6073
## sample estimates:
## mean of x 
##     53.45
t.test (conc, mu=50, conf.level=0.95, alternative = c("two.sided"))
## 
##  One Sample t-test
## 
## data:  conc
## t = 1.8894, df = 19, p-value = 0.07419
## alternative hypothesis: true mean is not equal to 50
## 95 percent confidence interval:
##  49.62825 57.27175
## sample estimates:
## mean of x 
##     53.45
t.test (conc, mu=50, conf.level=0.95, alternative = c("great"))
## 
##  One Sample t-test
## 
## data:  conc
## t = 1.8894, df = 19, p-value = 0.0371
## alternative hypothesis: true mean is greater than 50
## 95 percent confidence interval:
##  50.2927     Inf
## sample estimates:
## mean of x 
##     53.45
wilcox.test(conc,mu=50,conf.int= TRUE)
## Warning in wilcox.test.default(conc, mu = 50, conf.int = TRUE): cannot
## compute exact p-value with ties
## Warning in wilcox.test.default(conc, mu = 50, conf.int = TRUE): cannot
## compute exact confidence interval with ties
## Warning in wilcox.test.default(conc, mu = 50, conf.int = TRUE): cannot
## compute exact p-value with zeroes
## Warning in wilcox.test.default(conc, mu = 50, conf.int = TRUE): cannot
## compute exact confidence interval with zeroes
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  conc
## V = 139, p-value = 0.07905
## alternative hypothesis: true location is not equal to 50
## 95 percent confidence interval:
##  49.00001 58.00001
## sample estimates:
## (pseudo)median 
##       53.66572

CONCLUSÃO: De acordo com a interpretação proposta pela indústria para as 20 observações analisadas, a mesma estaria sim em conformidade com: “50ml/L está dentro do intervalo de confiança da média”, porém, apesar de se observar no gráfico de caule/folhas, no boxplot, no método T.test (com as três alternativas, less, great e two.sided) e também no método wilcox.test que todos apontam que o valor estaria dentro do IC, nota se uma desproporção muito grande para um desvio superior muito discrepante e consequentemente a proximidade com o limite inferior do valor em questão e por isso não se aconselharia a aceitação do despejo mas, a indústria estaria em conformidade com esta interpretação do padrão, pois o valor em questão encontra se dentro do intervalo de confiança.


2 - Um protocolo de garantia de qualidade laboratorial exige que as soluções padrão tenham 50mg/l de COT, tais amostras são inseridas de forma aleatória no fluxo do trabalho. Os analistas são cegos a estas normas. Estime o viés e a precisão das 16 observações mais recentes deste padrão. O processo de medição de COT está em conformidade com o padrão?

Obs.: Amostras: c(50.3, 51.2, 50.5, 50.2, 49.9, 50.2, 50.3, 50.5, 49.3, 50.0, 50.4, 50.1, 51.0, 49.8, 50.7, 50.6)

amostras <- c(50.3,51.2,50.5,50.2,49.9,50.2,50.3,50.5,49.3,50.0,50.4,50.1,51.0,49.8,50.7,50.6)

summary(amostras)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   49.30   50.08   50.30   50.31   50.52   51.20
sort(amostras)
##  [1] 49.3 49.8 49.9 50.0 50.1 50.2 50.2 50.3 50.3 50.4 50.5 50.5 50.6 50.7
## [15] 51.0 51.2
stem(amostras)
## 
##   The decimal point is at the |
## 
##   49 | 3
##   49 | 89
##   50 | 0122334
##   50 | 5567
##   51 | 02
boxplot(amostras)

str(amostras)
##  num [1:16] 50.3 51.2 50.5 50.2 49.9 50.2 50.3 50.5 49.3 50 ...
t.test (amostras, mu=50, conf.level=0.95, alternative = c("two.sided"))
## 
##  One Sample t-test
## 
## data:  amostras
## t = 2.7074, df = 15, p-value = 0.01622
## alternative hypothesis: true mean is not equal to 50
## 95 percent confidence interval:
##  50.06648 50.55852
## sample estimates:
## mean of x 
##   50.3125

CONCLUSÃO: Levando em consideração que obtém se o viés estimado subtraindo o valor padrão da média, tem se um viés de 0,31mg/l. Portanto conclui se que o processo de medição de COT está próximo do padrão. Tendo e vista a análise gráfica em caule/folhas e boxplot e também em t.test com nível de confiança em 0.95 (alfa=5%).


3 - O gás produzido a partir da fermentação biológica é oferecido para a venda com garantia de que o teor médio de metano de 72%. Uma amostra aleatória de n=7 amostras de gás forneceu conteúdo de metano em (%) de 64, 65, 75, 67, 65, 74 e 75.

- Efetue testes de hipótese com níveis de significância de 0,10, 0,05, 0,01 para determinar se é justo revindicar uma média de 72

- Calcular intervalos de confiança de 90%, 95% e 99% para avaliar a alegação de uma média de 72%

metano <- c(64, 65, 75, 67, 65, 74, 75)
summary(metano)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   64.00   65.00   67.00   69.29   74.50   75.00
sort(metano)
## [1] 64 65 65 67 74 75 75
stem(metano)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##   6 | 4
##   6 | 557
##   7 | 4
##   7 | 55
boxplot(metano)

str(metano)
##  num [1:7] 64 65 75 67 65 74 75
t.test(metano,alternative=c("two.sided"),mu=72,conf.level=0.90)
## 
##  One Sample t-test
## 
## data:  metano
## t = -1.402, df = 6, p-value = 0.2105
## alternative hypothesis: true mean is not equal to 72
## 90 percent confidence interval:
##  65.52362 73.04781
## sample estimates:
## mean of x 
##  69.28571
t.test(metano,alternative=c("two.sided"),mu=72,conf.level=0.95)
## 
##  One Sample t-test
## 
## data:  metano
## t = -1.402, df = 6, p-value = 0.2105
## alternative hypothesis: true mean is not equal to 72
## 95 percent confidence interval:
##  64.54836 74.02306
## sample estimates:
## mean of x 
##  69.28571
t.test(metano,alternative=c("two.sided"),mu=72,conf.level=0.99)
## 
##  One Sample t-test
## 
## data:  metano
## t = -1.402, df = 6, p-value = 0.2105
## alternative hypothesis: true mean is not equal to 72
## 99 percent confidence interval:
##  62.10794 76.46349
## sample estimates:
## mean of x 
##  69.28571
r10<-t.test(metano,alternative=c("two.sided"),mu=72,conf.level=0.90)
r10$conf.int[2]-r10$conf.int[1]
## [1] 7.524198
r5<-t.test(metano,alternative=c("two.sided"),mu=72,conf.level=0.95)
r5$conf.int[2]-r5$conf.int[1]
## [1] 9.4747
r1<-t.test(metano,alternative=c("two.sided"),mu=72,conf.level=0.99)
r1$conf.int[2]-r1$conf.int[1]
## [1] 14.35555

CONCLUSÃO: De acordo com a análise de testes de hipóteses com níveis de significância variados em 0,10, 0,05, 0,01, é justo sim revindicar um teor médio de 72% de metano pois, o valor se encontra dentro dos intervalos de confiança calculados.


4- Os seguintes dados foram obtidos a partir de medidas pareadas de nitrito em água e em águas residuais por eletrodo direto de íon-seletivo e um método colorimérico. Os dois métodos forneceram resultados consistentes?

MÉTODO ISE – 0.32 0.36 0.24 0.11 0.11 0.44 2.79 2.99 3.47
MÉTODO COLORIMETRIC – 0.36 0.37 0.21 0.09 0.11 0.42 2.77 2.91 3.52
metise <- c(0.32, 0.36, 0.24, 0.11, 0.11, 0.44, 2.79, 2.99, 3.47)
metcol <- c(0.36, 0.37, 0.21, 0.09, 0.11, 0.42, 2.77, 2.91, 3.52)
summary(metise)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.110   0.240   0.360   1.203   2.790   3.470
sort(metise)
## [1] 0.11 0.11 0.24 0.32 0.36 0.44 2.79 2.99 3.47
stem(metise)
## 
##   The decimal point is at the |
## 
##   0 | 112344
##   1 | 
##   2 | 8
##   3 | 05
boxplot(metise)

str(metise)
##  num [1:9] 0.32 0.36 0.24 0.11 0.11 0.44 2.79 2.99 3.47
t.test(metise,alternative=c("two.sided"),mu=0,conf.level=0.95)
## 
##  One Sample t-test
## 
## data:  metise
## t = 2.5337, df = 8, p-value = 0.03505
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  0.1081365 2.2985302
## sample estimates:
## mean of x 
##  1.203333
rmetise5<-t.test(metise,alternative=c("two.sided"),mu=0,conf.level=0.95)
rmetise5$conf.int[2]-rmetise5$conf.int[1]
## [1] 2.190394
summary(metcol)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.090   0.210   0.370   1.196   2.770   3.520
sort(metcol)
## [1] 0.09 0.11 0.21 0.36 0.37 0.42 2.77 2.91 3.52
stem(metcol)
## 
##   The decimal point is at the |
## 
##   0 | 112444
##   1 | 
##   2 | 89
##   3 | 5
boxplot(metcol)

str(metcol)
##  num [1:9] 0.36 0.37 0.21 0.09 0.11 0.42 2.77 2.91 3.52
t.test(metcol,alternative=c("two.sided"),mu=0,conf.level=0.95)
## 
##  One Sample t-test
## 
## data:  metcol
## t = 2.5224, df = 8, p-value = 0.03567
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  0.1025856 2.2885255
## sample estimates:
## mean of x 
##  1.195556
rmetcol5<-t.test(metise,alternative=c("two.sided"),mu=0,conf.level=0.95)
rmetcol5$conf.int[2]-rmetcol5$conf.int[1]
## [1] 2.190394

CONCLUSÃO: Analisando os dois métodos (ISE E COLORIMETRIC) pode se concluir que ambos apresentam resultados próximo, com o metcol com a média um pouco inferior, mas sempre com resultados parecidos, se chama se isto de consistência, os resultados foram consistentes.


5- Limites extremamente baixos existem agora para metais pesados em limites de águas residuais de efluentes. Pensa se frequentemente que, sempre que a concentração de metais pesados é demasiado elevada, o problema pode ser corrigido, forçando industrias a interromper a descarga de substância nociva. É possível, no entanto, que a concentração alvo do efluente ser tão baixa que elas podem ser ultrapassadas pela concentração em esgoto doméstico. Amostras de água potável foram coletadas de dois bairros residenciais, um servido pelo abastecimento de água da cidade e outro servido por poços particulares. As concentrações de mercúrio observadas estão listadas na tabela abaixo. Para estudos futuros sobre concentração de mercúrio em áreas residenciais, seria conveniente ser capaz de coletar dados em qualquer bairro, sem ter que se preocupar que o abastecimento de água pode afetar o resultado. Existe alguma diferença no teor de mercúrio das duas áreas residenciais?

Cidade (n=13) 0.34 0.18 0.13 0.09 0.16 0.09 0.16 0.10 0.14 0.26 0.06 0.26 0.07

Part (n=10) 0.26 0.06 0.16 0.19 0.32 0.16 0.08 0.05 0.10 0.13

cid <- c(0.34, 0.18, 0.13, 0.09, 0.16, 0.09, 0.16, 0.10, 0.14, 0.26, 0.06, 0.26, 0.07)

par <- c(0.26, 0.06, 0.16, 0.19, 0.32, 0.16, 0.08, 0.05, 0.10, 0.13)

summary(cid)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0600  0.0900  0.1400  0.1569  0.1800  0.3400
sort(cid)
##  [1] 0.06 0.07 0.09 0.09 0.10 0.13 0.14 0.16 0.16 0.18 0.26 0.26 0.34
stem(cid)
## 
##   The decimal point is 1 digit(s) to the left of the |
## 
##   0 | 6799
##   1 | 034668
##   2 | 66
##   3 | 4
boxplot(cid)

str(cid)
##  num [1:13] 0.34 0.18 0.13 0.09 0.16 0.09 0.16 0.1 0.14 0.26 ...
t.test(cid,alternative=c("two.sided"),mu=0,conf.level=0.95)
## 
##  One Sample t-test
## 
## data:  cid
## t = 6.7039, df = 12, p-value = 2.184e-05
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  0.1059217 0.2079245
## sample estimates:
## mean of x 
## 0.1569231
rcid5<-t.test(cid,alternative=c("two.sided"),mu=0,conf.level=0.95)
rcid5$conf.int[2]-rcid5$conf.int[1]
## [1] 0.1020028
summary(par)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0500  0.0850  0.1450  0.1510  0.1825  0.3200
sort(par)
##  [1] 0.05 0.06 0.08 0.10 0.13 0.16 0.16 0.19 0.26 0.32
stem(par)
## 
##   The decimal point is 1 digit(s) to the left of the |
## 
##   0 | 568
##   1 | 03669
##   2 | 6
##   3 | 2
boxplot(par)

str(par)
##  num [1:10] 0.26 0.06 0.16 0.19 0.32 0.16 0.08 0.05 0.1 0.13
t.test(par,alternative=c("two.sided"),mu=0,conf.level=0.95)
## 
##  One Sample t-test
## 
## data:  par
## t = 5.4658, df = 9, p-value = 0.0003974
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  0.08850457 0.21349543
## sample estimates:
## mean of x 
##     0.151
rpar5<-t.test(par,alternative=c("two.sided"),mu=0,conf.level=0.95)
rpar5$conf.int[2]-rpar5$conf.int[1]
## [1] 0.1249909

CONCLUSÃO: Analisando as duas amostras (CID E PAR) aparentemente existe uma diferença muito pequena no teor de mercúrio porém, deve se levar em consideração que a amostra CID tem mais observações o que influencia o resultado.