Exercício de Estatística

R Markdown

Exercício 01 Estatística - Pág 50

A autorização de despejo para uma indústria requer que a concentração media mensal de COD seja inferior a 50 mg/L. A indústria quer que isso seja interpretado como “50 mg/L que está dentro do intervalo de confiança da média, que vai ser estimada a partir de 20 observações por mês.”

A) Você concorda com a interpretação proposta pela indústria? Porque?

B) Para as 20 observações seguintes, estaria a indústria em conformidade com esta interpretação que você considerou adequada?

cod<-c(57, 60, 49, 50, 51, 60, 49, 53, 49, 56, 64, 60, 49, 52, 69, 40, 44, 38, 53, 66)
cod

##  [1] 57 60 49 50 51 60 49 53 49 56 64 60 49 52 69 40 44 38 53 66

summary(cod)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   38.00   49.00   52.50   53.45   60.00   69.00

sort(cod)

##  [1] 38 40 44 49 49 49 49 50 51 52 53 53 56 57 60 60 60 64 66 69

mean(cod)

## [1] 53.45

median(cod)

## [1] 52.5

sd(cod)

## [1] 8.165879

var(cod)

## [1] 66.68158

boxplot(cod, main = "Gráfico Boxplot", ylab = "Valor", col="orange")

t.test(cod,alternative=c("two.sided"),mu=50, conf.level=0.95)

## 
##  One Sample t-test
## 
## data:  cod
## t = 1.8894, df = 19, p-value = 0.07419
## alternative hypothesis: true mean is not equal to 50
## 95 percent confidence interval:
##  49.62825 57.27175
## sample estimates:
## mean of x 
##     53.45

wilcox.test(cod, mu = 50, conf.int=TRUE)

## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact p-value with ties

## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact confidence interval with ties

## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact p-value with zeroes

## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact confidence interval with zeroes

## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  cod
## V = 139, p-value = 0.07905
## alternative hypothesis: true location is not equal to 50
## 95 percent confidence interval:
##  49.00001 58.00001
## sample estimates:
## (pseudo)median 
##       53.66572

## A) Você concorda com a interpretação proposta pela indústria? Por que?

Não. De acordo com os resultados obtidos através do t-test e do gráfico boxplot, foi identificado que a média apurada no valor de 53,45 encontra-se superior ao valor em que a indústria determinou que é de 50 mg/L.

## B) Para as 20 observações seguintes, estaria a indústria em conformidade com a interpretação que você considerou adequada em A)?

Foram apresentados os seguintes resultados: Intervalo de Confiança do teste t: limite inferior de 49.62825 e limite superior 57.27175. Teste de Wilcoxon: limite inferior de 49.00001 e limite superior 58.00001

Considerando as 20 observações realizadas, os valores obtidos apresentaram incoenrência com os padroes determinados pela indústria. Esta análise se deu a partir da verificação dos resultados de Intervalo de Confiança que foram entre 49.000 e 58.000 e do gráfico boxplot, o qual apresentou valores desiguais indicando que os resultados ficaram fora da média apresentada “desejada” pela indústria (50mg/L).

Também observou - se que o Desvio Padrão sendo: sd = 8.165879, os valores amostrais também encontravam-se distantes do valor esperado pela indústria, levando a condição da empresa para fora dos padrões exigíveis para exercer suas funções.

Exercício 02 Estatística - Pág 51

Os seguintes dados foram obtidos a partir de medidas pareadas de nitrito em água e em águas residuais por eletrodo direto de íon-seletivo e um método colorimétrico.

ISE <- c (0.32, 0.36, 0.24, 0.11, 0.11, 0.44, 2.79, 2.99, 3.47)
Colorimetric <- c (0.36, 0.37, 0.21, 0.09, 0.11, 0.42, 2.77, 2.91, 3.52 )
ISE

## [1] 0.32 0.36 0.24 0.11 0.11 0.44 2.79 2.99 3.47

Colorimetric

## [1] 0.36 0.37 0.21 0.09 0.11 0.42 2.77 2.91 3.52

summary(ISE)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.110   0.240   0.360   1.203   2.790   3.470

summary(Colorimetric)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.090   0.210   0.370   1.196   2.770   3.520

sort(ISE)

## [1] 0.11 0.11 0.24 0.32 0.36 0.44 2.79 2.99 3.47

sort(Colorimetric)

## [1] 0.09 0.11 0.21 0.36 0.37 0.42 2.77 2.91 3.52

mean(ISE)

## [1] 1.203333

mean(Colorimetric)

## [1] 1.195556

median(ISE)

## [1] 0.36

median(Colorimetric)

## [1] 0.37

var(ISE)

## [1] 2.03005

var(Colorimetric)

## [1] 2.021803

sd(ISE)

## [1] 1.424798

sd(Colorimetric)

## [1] 1.421901

pnorm(ISE, mean = 1.203333, sd = 1.424798, lower.tail = TRUE, log.p = FALSE)

## [1] 0.2676385 0.2769599 0.2494825 0.2214338 0.2214338 0.2960663 0.8672764
## [8] 0.8950752 0.9441805

pnorm(Colorimetric, mean = 1.195556, sd = 1.421901, lower.tail = TRUE, log.p = FALSE)

## [1] 0.2783893 0.2807550 0.2441154 0.2184261 0.2225963 0.2927268 0.8659138
## [8] 0.8860413 0.9489486

par(mfrow=c(1,2))
boxplot(ISE, main = "Método ISE", ylab = "valor", col = "Orange")
boxplot(Colorimetric, main="Método Colorimetric", ylab="Valor", col="green")

t.test(ISE, Colorimetric, paired = TRUE, var.equal = FALSE)

## 
##  Paired t-test
## 
## data:  ISE and Colorimetric
## t = 0.5986, df = 8, p-value = 0.566
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.02218494  0.03774050
## sample estimates:
## mean of the differences 
##             0.007777778

wilcox.test(ISE, Colorimetric, paired = TRUE, var.equal = FALSE)

## Warning in wilcox.test.default(ISE, Colorimetric, paired = TRUE, var.equal
## = FALSE): cannot compute exact p-value with ties

## Warning in wilcox.test.default(ISE, Colorimetric, paired = TRUE, var.equal
## = FALSE): cannot compute exact p-value with zeroes

## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  ISE and Colorimetric
## V = 22, p-value = 0.6236
## alternative hypothesis: true location shift is not equal to 0

shapiro.test(ISE)

## 
##  Shapiro-Wilk normality test
## 
## data:  ISE
## W = 0.72382, p-value = 0.00269

shapiro.test(Colorimetric)

## 
##  Shapiro-Wilk normality test
## 
## data:  Colorimetric
## W = 0.73167, p-value = 0.003321

par(mfrow=c(1,2))
qqnorm(ISE, main = "Método ISE", ylab = "valor", col ="orange", lwd = "5")
qqline(ISE, col = "blue", lwd="2.5")

qqnorm(Colorimetric, main = "Método ISE", ylab = "valor", col ="green", lwd = "5")
qqline(Colorimetric, col="blue", lwd ="2.5", pch = "5")

Formule o problema em termos de um teste de hipótese e da etimação de um IC?

Hipótese Nula ISE H0 = normal Hipótese Alternativa ISE H1 # normal

Hipótese Nula Colorimetric H0 = normal Hipótese Alternativa Colorimetric H1 # normal

A Hipótese Nula é rejeitada nos dois métodos porque, de acordo com os dados de Shapiro Wilks, estão foram da normalidade.

Os dois métodos forneceram resultados similares? Utilize um método tradicional adequado (Paramétrico? Não-paramétrico?)

No Teste t (paramétrico) o valor de p-value = 0,566 indica um valor maior de 5% direcionando para a rejeição de H0.

Os resultados apresentaram similaridade em ambos os métodos analisados. Contudo, como os resultados levaram a uma distribuição não-normal. Para esta conclusçao, foi utilizado os métodos paramétrico e não-paramétrico, sSendo que o mais adequado para analisar estes dados são os métodos não-paramétricos devido os resultados nao seguirem a distibuição normal.

Exercício 03 Estatística - Pág 65

Cálculo do poder do Teste do Exercício 1

library(pwr)

library(pwr)
pwr.t.test (d = c (0.2, 0.5, 0.8), n = 20, sig.level = 0.05, type="one.sample", alternative="two.sided")

## 
##      One-sample t test power calculation 
## 
##               n = 20
##               d = 0.2, 0.5, 0.8
##       sig.level = 0.05
##           power = 0.1359563, 0.5645044, 0.9238988
##     alternative = two.sided

O teste de confiança apresentou um terceiro valor no comando “pwr” de 0.9238988, acima de 80%, significando assim um teste confiável.

Cálculo do poder do Teste do Exercício 2

library(pwr)
pwr.t.test (d = c (0.2, 0.5, 0.8), n = 9, sig.level = 0.05, type="one.sample", alternative="two.sided")

## 
##      One-sample t test power calculation 
## 
##               n = 9
##               d = 0.2, 0.5, 0.8
##       sig.level = 0.05
##           power = 0.08291639, 0.26274609, 0.55909612
##     alternative = two.sided

O teste de confiança apresentou um terceiro valor no comando “pwr” de 0.55909612, abaixo de 80%, significando assim um teste não confiável.

Exercício 04 Estatística - Pág 71

Cálculo da Bootstrap

Obtenha IC via bootstrap para a média e para a mediana com os dados dos exercícios 1 e 2

ISE = c(0.32, 0.36, 0.24, 0.11, 0.11, 0.44, 2.79, 2.99, 3.47)
xbar = c()
for (i in 1:1999) {
amostras = sample(ISE, size = length(ISE),
replace = TRUE)
xbar[i] = mean(amostras)
}

Estimativa IC via Bootstrap Amostras ISE

quantile(xbar, c(.025, .975))

##      2.5%     97.5% 
## 0.4822222 2.1433333

Colorimetric = c(0.36, 0.37, 0.21, 0.09, 0.11, 0.42, 2.77, 2.91, 3.52)
xbar = c()
for (i in 1:1999) {
amostras = sample(Colorimetric, size = length(Colorimetric),
replace = TRUE)
xbar[i] = mean(amostras)
}

Estimativa IC Via Bootstrap Amostras Colorimetric

quantile(xbar, c(.025, .975))

##     2.5%    97.5% 
## 0.290000 2.136722