atividadeestatistica

R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)

##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

Exercício 01 Estatística

A autorização de despejo para uma indústria requer que a concentração media mensal de COD seja inferior a 50 mg/L. A indústria quer que isso seja interpretado como “50 mg/L que está dentro do intervalo de confiança da média, que vai ser estimada a partir de 20 observações por mês.”

cod<-c(57, 60, 49, 50, 51, 60, 49, 53, 49, 56, 64, 60, 49, 52, 69, 40, 44, 38, 53, 66)
cod

##  [1] 57 60 49 50 51 60 49 53 49 56 64 60 49 52 69 40 44 38 53 66

summary(cod)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   38.00   49.00   52.50   53.45   60.00   69.00

sort(cod)

##  [1] 38 40 44 49 49 49 49 50 51 52 53 53 56 57 60 60 60 64 66 69

mean(cod)

## [1] 53.45

median(cod)

## [1] 52.5

sd(cod)

## [1] 8.165879

var(cod)

## [1] 66.68158

boxplot(cod, main = "Gráfico Boxplot", ylab = "Valor", col="pink")

t.test(cod,alternative=c("two.sided"),mu=50, conf.level=0.95)

## 
##  One Sample t-test
## 
## data:  cod
## t = 1.8894, df = 19, p-value = 0.07419
## alternative hypothesis: true mean is not equal to 50
## 95 percent confidence interval:
##  49.62825 57.27175
## sample estimates:
## mean of x 
##     53.45

wilcox.test(cod, mu = 50, conf.int=TRUE)

## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact p-value with ties

## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact confidence interval with ties

## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact p-value with zeroes

## Warning in wilcox.test.default(cod, mu = 50, conf.int = TRUE): cannot
## compute exact confidence interval with zeroes

## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  cod
## V = 139, p-value = 0.07905
## alternative hypothesis: true location is not equal to 50
## 95 percent confidence interval:
##  49.00001 58.00001
## sample estimates:
## (pseudo)median 
##       53.66572

## A) Você concorda com a interpretação proposta pela indústria? Por que?

Não. Devido a verificação dos resultados a média mensal de COD na indústria em questão, o valor é superior a 50 mg/L, segundo média calculada e o gráfico boxplot.

## B) Para as 20 observações seguintes, estaria a indústria em conformidade com a interpretação que você considerou adequada em a)?

Conforme as 20 observações efetivada, as análises dos dados apresentaram valores acima da concentração proposta pela indústria, onde o intervalo de confiança está entre 49.000 e 58.000, expondo a inconsistência dos padrões estabelecidos pela indústria, pode averiguar também por meio do gráfico boxplot que os valores estão desigual, ou seja, está fora da média dos dados apresentados e que a indústria almeja. Entretanto, o intervalo de confiança mostrado nos testes tem o limite inferior de 49.62825 e limite superior 57.27175, já o teste de Wilcoxon tem limite inferior de 49.00001 e limite superior 58.00001.

Além disso, ao averiguar o desvio padrão, cujo o valor é 8.165879, quando compara com valores amostrais estão longe do valor almejado pela indústria. Devido isso, essa empresa não está respeitando a legislação, como consequência a mesma não está apta para o funcionamento.

Exercício 2

Os seguintes dados foram obtidos a partir de medidas pareadas de nitrito em água e em águas residuais por eletrodo direto de íon-seletivo e um método colorimétrico. Os dois métodos apresentaram resultados similares?

ISE<- c ( 0.32, 0.36, 0.24, 0.11, 0.11, 0.44, 2.79, 2.99, 3.47 )
Cmetric <- c (0.36, 0.37, 0.21, 0.09, 0.11, 0.42, 2.77, 2.91, 3.52 )
ISE

## [1] 0.32 0.36 0.24 0.11 0.11 0.44 2.79 2.99 3.47

Cmetric

## [1] 0.36 0.37 0.21 0.09 0.11 0.42 2.77 2.91 3.52

summary(ISE)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.110   0.240   0.360   1.203   2.790   3.470

summary(Cmetric)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.090   0.210   0.370   1.196   2.770   3.520

sort(ISE)

## [1] 0.11 0.11 0.24 0.32 0.36 0.44 2.79 2.99 3.47

sort(Cmetric)

## [1] 0.09 0.11 0.21 0.36 0.37 0.42 2.77 2.91 3.52

mean(ISE)

## [1] 1.203333

mean(Cmetric)

## [1] 1.195556

median(ISE)

## [1] 0.36

median(Cmetric)

## [1] 0.37

var(ISE)

## [1] 2.03005

var(Cmetric)

## [1] 2.021803

sd(ISE)

## [1] 1.424798

sd(Cmetric)

## [1] 1.421901

pnorm(ISE, mean = 1.203333, sd = 1.424798, lower.tail = TRUE, log.p = FALSE)

## [1] 0.2676385 0.2769599 0.2494825 0.2214338 0.2214338 0.2960663 0.8672764
## [8] 0.8950752 0.9441805

pnorm(Cmetric, mean = 1.195556, sd = 1.421901, lower.tail = TRUE, log.p = FALSE)

## [1] 0.2783893 0.2807550 0.2441154 0.2184261 0.2225963 0.2927268 0.8659138
## [8] 0.8860413 0.9489486

par(mfrow=c(1,2))
boxplot(ISE, main="Método ISE", ylab="Valor", col="purple")
boxplot(Cmetric, main="Método Cmetric", ylab="Valor", col="orange")

t.test(ISE,Cmetric, paired = TRUE, var.equal = FALSE)

## 
##  Paired t-test
## 
## data:  ISE and Cmetric
## t = 0.5986, df = 8, p-value = 0.566
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.02218494  0.03774050
## sample estimates:
## mean of the differences 
##             0.007777778

wilcox.test(ISE, Cmetric, paired=TRUE, var.equal=FALSE)

## Warning in wilcox.test.default(ISE, Cmetric, paired = TRUE, var.equal =
## FALSE): cannot compute exact p-value with ties

## Warning in wilcox.test.default(ISE, Cmetric, paired = TRUE, var.equal =
## FALSE): cannot compute exact p-value with zeroes

## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  ISE and Cmetric
## V = 22, p-value = 0.6236
## alternative hypothesis: true location shift is not equal to 0

shapiro.test(ISE)

## 
##  Shapiro-Wilk normality test
## 
## data:  ISE
## W = 0.72382, p-value = 0.00269

shapiro.test(Cmetric)

## 
##  Shapiro-Wilk normality test
## 
## data:  Cmetric
## W = 0.73167, p-value = 0.003321

par(mfrow=c(1,2))
qqnorm(ISE, main= "Método ISE", ylab = "Valor", col = "blue") 
qqline(ISE, col = "red")

qqnorm(Cmetric, main= "Método Cmetric", ylab = "Valor", col = "orange")
qqline(Cmetric, col = "blue")

Formule o problema em termos de um teste de hipótese e da estimação de um IC?

O teste de hipótese realizado para o íon-seletivo obteve como resultado: Hipótese Nula ISE H0 = Normal Hipótese Alternativa ISE H1 # Normal. E o teste de hipótese realizado para método colorimétrico obteve como resultado: Hipótese Nula H0 Colorimetric = Normal Hipótese Alternativa Colorimetric H1 # Normal

Nos dois testes realizado, a hipósete nula será rejeitada, pois conforme o resultado do teste de Shapiro Wilks os dados se encontra fora da normalidade.

Os dois métodos forneceram resultados similares? Utilize um método tradicional adequado (paramétrico? Não-paramétrico?)

Os dois métodos realizados forneceram resultados similares. Entretanto para verificar esses dados foi usado os métodos paramétricos e não paramétricos, conforme os resultados dos mesmos, pode-se afirmar que o apropriado para analisar estes dados é o método não paramétricos, visto que os dados analisado não seguirão distribuição normal. Conforme o teste t o valor de p é de 0.566 o que apresenta que valor calculado é superior a 5%, com isso tem-se a rejeição da hipótese nula.

Exercício 3 - Cálculo do Poder do Teste

library(pwr)

Cálculo poder do Teste Exercício 1

library(pwr)
pwr.t.test(d = c (0.2, 0.5, 0.8), n = 20, sig.level = 0.05, type="one.sample", alternative="two.sided")

## 
##      One-sample t test power calculation 
## 
##               n = 20
##               d = 0.2, 0.5, 0.8
##       sig.level = 0.05
##           power = 0.1359563, 0.5645044, 0.9238988
##     alternative = two.sided

O teste de confiança mostrou-se um terceiro valor no comando pwr superior a 0.9238988, ou seja, maior que 80%, significando um teste confiável.

Cálculo poder do Teste Exercício 2

pwr.t.test(d = c (0.2, 0.5, 0.8), n = 9, sig.level = 0.05, type="one.sample", alternative="two.sided")

## 
##      One-sample t test power calculation 
## 
##               n = 9
##               d = 0.2, 0.5, 0.8
##       sig.level = 0.05
##           power = 0.08291639, 0.26274609, 0.55909612
##     alternative = two.sided

Na segunda atividade o terceiro valor do pacote pwr é de 0.55909612, ou seja, é menor que 80% significando que o teste não foi confiável.

Obtenha IC via bootstrap para média e para mediana com os dados do exercício 2

ISE = c(0.32, 0.36, 0.24, 0.11, 0.11, 0.44, 2.79, 2.99, 3.47)
xbar = c()
for (i in 1:1999) {
amostras = sample(ISE, size = length(ISE),
replace = TRUE)
xbar[i] = mean(amostras)
}

Estimativa IC Via Bootstrap Amostras ISE

quantile(xbar, c(.025, .975))

##      2.5%     97.5% 
## 0.4403333 2.1535000

Colorimetric = c(0.36, 0.37, 0.21, 0.09, 0.11, 0.42, 2.77, 2.91, 3.52)
xbar = c()
for (i in 1:1999) {
amostras = sample(Cmetric, size = length(Cmetric),
replace = TRUE)
xbar[i] = mean(amostras)
}

Estimativa IC Via Bootstrap Amostras Cmetric

quantile(xbar, c(.025, .975))

##      2.5%     97.5% 
## 0.4666111 2.0836111

atividadeestatistica_lorena

Lorena

21/11/2019