R Markdown

R Markdown

Exercício 01 Estatística

A autorização de despejo para uma indústria requer que a concentração media mensal de COD seja inferior a 50 mg/L. A indústria quer que isso seja interpretado como “50 mg/L que está dentro do intervalo de confiança da média, que vai ser estimada a partir de 20 observações por mês.”

cod<-c(57, 60, 49, 50, 51, 60, 49, 53, 49, 56, 64, 60, 49, 52, 69, 40, 44, 38, 53, 66)
cod
##  [1] 57 60 49 50 51 60 49 53 49 56 64 60 49 52 69 40 44 38 53 66
summary(cod)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   38.00   49.00   52.50   53.45   60.00   69.00
sort(cod)
##  [1] 38 40 44 49 49 49 49 50 51 52 53 53 56 57 60 60 60 64 66 69
mean(cod)
## [1] 53.45
median(cod)
## [1] 52.5
sd(cod)
## [1] 8.165879
var(cod)
## [1] 66.68158
boxplot(cod, main = "Gráfico Boxplot", ylab = "Valor", col="blue")

t.test(cod,alternative=c("two.sided"),mu=50, conf.level=0.95)
## 
##  One Sample t-test
## 
## data:  cod
## t = 1.8894, df = 19, p-value = 0.07419
## alternative hypothesis: true mean is not equal to 50
## 95 percent confidence interval:
##  49.62825 57.27175
## sample estimates:
## mean of x 
##     53.45
wilcox.test(cod, mu = 50, conf.int=TRUE)
## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact p-value with ties
## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact confidence interval with ties
## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact p-value with zeroes
## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact confidence interval with zeroes
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  cod
## V = 139, p-value = 0.07905
## alternative hypothesis: true location is not equal to 50
## 95 percent confidence interval:
##  49.00001 58.00001
## sample estimates:
## (pseudo)median 
##       53.66572
## A) Você concorda com a interpretação proposta pela indústria? Por que?

Não. Pois de acordo com a análise dos resultados a média mensal de COD para essa indústria em questão é superior a 50 mg/L, conforme média apurada e o gráfico boxplot.

## B) Para as 20 observações seguintes, estaria a indústria em conformidade com a interpretação que você considerou adequada em a)?

Para as 20 observações realizadas as análises apresentaram valores acima da concentração requerida, com intervalo de confiança entre 49.000 e 58.000, apresentando inconsistência com os padrões estabelecidos pela indústria, pode-se verificar também através do gráfico boxplot que os valores estão assimétricos, ou seja, fora da média de valores apresentados e que a indústria deseja. O intervalo de confiança apresentado nos testes foi de (limite inferior de 49.62825 e limite superior 57.27175) e o teste de Wilcoxon (limite inferior de 49.00001 e limite superior 58.00001).

Verifica-se também através do desvio padrão (sd = 8.165879) que os valores amostrais estão bem distantes do valor esperado pela indústria, sendo assim essa empresa está fora dos padrões para exercer suas funções.

Exercício 2

Os seguintes dados foram obtidos a partir de medidas pareadas de nitrito em água e em águas residuais por eletrodo direto de íon-seletivo e um método colorimétrico. Os dois métodos apresentaram resultados similares?

ISE<- c ( 0.32, 0.36, 0.24, 0.11, 0.11, 0.44, 2.79, 2.99, 3.47 )
Colorimetric <- c (0.36, 0.37, 0.21, 0.09, 0.11, 0.42, 2.77, 2.91, 3.52 )
ISE
## [1] 0.32 0.36 0.24 0.11 0.11 0.44 2.79 2.99 3.47
Colorimetric
## [1] 0.36 0.37 0.21 0.09 0.11 0.42 2.77 2.91 3.52
summary(ISE)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.110   0.240   0.360   1.203   2.790   3.470
summary(Colorimetric)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.090   0.210   0.370   1.196   2.770   3.520
sort(ISE)
## [1] 0.11 0.11 0.24 0.32 0.36 0.44 2.79 2.99 3.47
sort(Colorimetric)
## [1] 0.09 0.11 0.21 0.36 0.37 0.42 2.77 2.91 3.52
mean(ISE)
## [1] 1.203333
mean(Colorimetric)
## [1] 1.195556
median(ISE)
## [1] 0.36
median(Colorimetric)
## [1] 0.37
var(ISE)
## [1] 2.03005
var(Colorimetric)
## [1] 2.021803
sd(ISE)
## [1] 1.424798
sd(Colorimetric)
## [1] 1.421901
pnorm(ISE, mean = 1.203333, sd = 1.424798, lower.tail = TRUE, log.p = FALSE)
## [1] 0.2676385 0.2769599 0.2494825 0.2214338 0.2214338 0.2960663 0.8672764
## [8] 0.8950752 0.9441805
pnorm(Colorimetric, mean = 1.195556, sd = 1.421901, lower.tail = TRUE, log.p = FALSE)
## [1] 0.2783893 0.2807550 0.2441154 0.2184261 0.2225963 0.2927268 0.8659138
## [8] 0.8860413 0.9489486
par(mfrow=c(1,2))
boxplot(ISE, main="Método ISE", ylab="Valor", col="red")
boxplot(Colorimetric, main="Método Colorimetric", ylab="Valor", col="green")

t.test(ISE,Colorimetric, paired = TRUE, var.equal = FALSE)
## 
##  Paired t-test
## 
## data:  ISE and Colorimetric
## t = 0.5986, df = 8, p-value = 0.566
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.02218494  0.03774050
## sample estimates:
## mean of the differences 
##             0.007777778
wilcox.test(ISE, Colorimetric, paired=TRUE, var.equal=FALSE)
## Warning in wilcox.test.default(ISE, Colorimetric, paired = TRUE, var.equal
## = FALSE): cannot compute exact p-value with ties
## Warning in wilcox.test.default(ISE, Colorimetric, paired = TRUE, var.equal
## = FALSE): cannot compute exact p-value with zeroes
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  ISE and Colorimetric
## V = 22, p-value = 0.6236
## alternative hypothesis: true location shift is not equal to 0
shapiro.test(ISE)
## 
##  Shapiro-Wilk normality test
## 
## data:  ISE
## W = 0.72382, p-value = 0.00269
shapiro.test(Colorimetric)
## 
##  Shapiro-Wilk normality test
## 
## data:  Colorimetric
## W = 0.73167, p-value = 0.003321
par(mfrow=c(1,2))
qqnorm(ISE, main= "Método ISE", ylab = "Valor", lwd = 2, col = "red") 
qqline(ISE, col = "blue")

qqnorm(Colorimetric, main= "Método Colorimetric", ylab = "Valor", lwd = 2, col = "orange")
qqline(Colorimetric, col = "blue")

Formule o problema em termos de um teste de hipótese e da estimação de um IC?

Hipótese Nula ISE H0 = Normal Hipótese Alternativa ISE H1 # Normal

Hipótese Nula H0 Colorimetric = Normal Hipótese Alternativa Colorimetric H1 # Normal

Em ambos os casos a hipósete nula foi rejeitada porque de acordo com os dados do teste de Shapiro Wilks os dados estão fora da normalidade.

Os dois métodos forneceram resultados similares? Utilize um método tradicional adequado (paramétrico? Não-paramétrico?)

Os dois métodos forneceram resultados semelhantes. Porém para análisar esses dados foi utilizado métodos paramétricos e não paramétricos, sendo que de acordo com os mesmos, mais adequado para analisar estes dados são os métodos não paramétricos, pois os dados não seguem a distribuição normal.

No teste t o valor de p = 0.566 indica um valor maior que 5%, direcionando para a rejeição de H0

Exercício 3 - Cálculo do Poder do Teste

library(pwr)

Cálculo poder do Teste Exercício 1

library(pwr)
pwr.t.test(d = c (0.2, 0.5, 0.8), n = 20, sig.level = 0.05, type="one.sample", alternative="two.sided")
## 
##      One-sample t test power calculation 
## 
##               n = 20
##               d = 0.2, 0.5, 0.8
##       sig.level = 0.05
##           power = 0.1359563, 0.5645044, 0.9238988
##     alternative = two.sided

O teste de confiança apresentou um terceiro valor no comando pwr acima de 0.9238988, acima de 80%, significando um teste confiável.

Cálculo poder do Teste Exercício 2

pwr.t.test(d = c (0.2, 0.5, 0.8), n = 9, sig.level = 0.05, type="one.sample", alternative="two.sided")
## 
##      One-sample t test power calculation 
## 
##               n = 9
##               d = 0.2, 0.5, 0.8
##       sig.level = 0.05
##           power = 0.08291639, 0.26274609, 0.55909612
##     alternative = two.sided

No exercício 02 o 3º valor do pacote pwr é de 0.55909612, sendo menor que 80% significando que o teste não foi confiável.

Obtenha IC via bootstrap para média e para mediana com os dados do exercício 2

ISE = c(0.32, 0.36, 0.24, 0.11, 0.11, 0.44, 2.79, 2.99, 3.47)
xbar = c()
for (i in 1:1999) {
amostras = sample(ISE, size = length(ISE),
replace = TRUE)
xbar[i] = mean(amostras)
}

Estimativa IC Via Bootstrap Amostras ISE

quantile(xbar, c(.025, .975))
##      2.5%     97.5% 
## 0.3239444 2.0957222
Colorimetric = c(0.36, 0.37, 0.21, 0.09, 0.11, 0.42, 2.77, 2.91, 3.52)
xbar = c()
for (i in 1:1999) {
amostras = sample(Colorimetric, size = length(Colorimetric),
replace = TRUE)
xbar[i] = mean(amostras)
}

Estimativa IC Via Bootstrap Amostras Colorimetric

quantile(xbar, c(.025, .975))
##      2.5%     97.5% 
## 0.2932778 2.1200000