Trabalho de Estatística - Relatório III

Lista de Testes de Hipóteses

Trace uma curva normal e sombreie a área desejada obtendo então a informação.

Área à direita de $Z = 1$

1-pnorm(q=1, mean = 0, sd=1)

## [1] 0.1586553

pnormGC(1, region="above", mean=0,
        sd=1, graph=TRUE)

## [1] 0.1586553

Área à esquerda de $Z = 1$

pnorm(q=1, mean = 0, sd=1)

## [1] 0.8413447

pnormGC(1, region="below", mean=0,
        sd=1, graph=TRUE)

## [1] 0.8413447

Área entre $Z = 0$ e $Z = 1.5$

pnorm(q=1.5, mean = 0, sd=1)-0.5

## [1] 0.4331928

pnormGC(c(0,1.5), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.4331928

Área entre $Z = −0,56$ e $Z = −0,2$

pnorm(q=-0.2, mean = 0, sd=1)-pnorm(q=-0.56, mean = 0, sd=1)

## [1] 0.1330006

pnormGC(c(-0.56,-0.2), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.1330006

Área entre $Z = 0, 5$ e $Z = 0, 5$

pnorm(q=1.5, mean = 0, sd=1) - pnorm(q=1.5, mean = 0, sd=1)

## [1] 0

pnormGC(c(0.5,0.5), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0

Área entre $Z = 0$ e $Z = −2, 5$

pnorm(q=0, mean = 0, sd=1) - pnorm(q=-2.5, mean = 0, sd=1)

## [1] 0.4937903

pnormGC(c(-2.5,0), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.4937903

Usando a tabela da distribuição normal, determine os valores de $Z$ que correspondem às seguintes áreas:

Área de 0,0505 à esquerda de Z.

qnorm(0.0505, mean = 0, sd=1, lower.tail = TRUE)

## [1] -1.640025

pnormGC(qnorm(0.0505, mean = 0, sd=1), region="below", mean=0,
        sd=1, graph=TRUE)

## [1] 0.0505

Área de 0,0228 à direita de Z

qnorm(0.0228, mean = 0, sd=1, lower.tail = FALSE)

## [1] 1.999077

pnormGC(qnorm(0.0228, mean = 0, sd=1 , lower.tail = FALSE), region="above", mean=0, sd=1, graph=TRUE)

## [1] 0.0228

Área de 0,0228 à esquerda de Z

qnorm(0.0228, mean = 0, sd=1, lower.tail = TRUE)

## [1] -1.999077

pnormGC(qnorm(0.0228, mean = 0, sd=1), region="below", mean=0,
        sd=1, graph=TRUE)

## [1] 0.0228

0,4772 entre 0 e z

qnorm(0.0228, mean = 0, sd=1, lower.tail = TRUE)

## [1] -1.999077

pnormGC(c(qnorm(0.0228, mean = 0, sd=1, lower.tail = TRUE), 0), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.4772

Consultando a tabela, determine a probabilidade de certo valor padronizado de Z estar entre $Z_0 = −1, 20$ e $Z_1 = 2, 00.$ Desenhe o gráfico.

pnorm(2, mean = 0, sd=1, lower.tail = TRUE) - pnorm(-1.2, mean = 0, sd=1, lower.tail = TRUE)

## [1] 0.8621802

pnormGC(c(2,-1.2), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.8621802

Dado uma variável X com distribuição normal de média 25 e desvio-padrão 2, determine os valores de Z para os seguintes valores (x) :

Sabemos que $Z=\frac{X-\mu}{\sigma},$ logo:

(Z=(23-25)/2)

## [1] -1

23,5

(Z=(23.5-25)/2)

## [1] -0.75

(Z=(24-25)/2)

## [1] -0.5

25,2

(Z=(25.2-25)/2)

## [1] 0.1

25,5

(Z=(25.5-25)/2)

## [1] 0.25

Determine a probabilidade de certo valor padronizado de Z estar entre $Z_0 = −1, 30$ e $Z_1 = 1.5.$ Desenhe o gráfico.

pnorm(1.5, mean = 0, sd=1, lower.tail = TRUE) - pnorm(-1.3, mean = 0, sd=1, lower.tail = TRUE)

## [1] 0.8363923

pnormGC(c(1.5,-1.3), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.8363923

Uma população normal tem média 40 e desvio-padrão 3. Determine os valores da população correspondentes aos seguintes de Z:

Sabemos que $Z=\frac{X-\mu}{\sigma},$ logo, dado Z, temos que $X=Z\sigma+\mu,$ assim:

0,10

(X=(0.1*3)+40)

## [1] 40.3

2,00

(X=(2*3)+40)

## [1] 46

0,75

(X=(0.75*3)+40)

## [1] 42.25

-3,00

(X=(-3*3)+40)

## [1] 31

-2,53

(X=(-2.53*3)+40)

## [1] 32.41

Explique com suas palavras, exemplificando, o significado de:

teste de hipótese;

O teste de hipótese é uma maneira de testar alguma hipótese estatística formulada e verificar quais evidências os dados trazem em relação as nossas suposições. Dessa forma, estabelecemos uma hipótese nula e uma alternativa.

Hipótese nula e alternativa;

A Hipótese nula é a suposição inicial que estabelecemos sobre o nosso teste e a alternativa é uma hipótese contrária a inicial que propusemos. Assim, analisamos as evidências dos nossos dados e determinamos se podemos ou não recusar a hipótese nula e ficar a favor da alternativa.

erros do tipo I e II;

O erro do tipo I é quando você recusa a hipótese nula porém não deveria, isso é relacionado ao nível de significância de seu teste. Por outro lado, o erro do tipo II ocorre quando você deveria ficar a favor da hipótese alternativa, mas não recusa a hipótese nula.

nível de significância.

Nível de significância é a probabilidade de rejeição da hipótese nula quando ela é verdadeira, indicando o nível de confiança que encontramos no nosso teste.

Enuncie a hipótese nula e a hipótese alternativa em cada um dos casos a seguir.

A produção média de certo cereal é de 40 toneladas por hectare. Acredita-se que um novo tipo de adubo aumenta a produção média por hectare.

$H_{0}:\mu=40$ toneladas por hectare

$H_{1}:\mu>40$ toneladas por hectare

#H0:mu=40
#H1:mu>40

Um sindicato de empregados de certa categoria deseja verificar se a taxa de desemprego em certo município é maior que a taxa de 12% observada seis meses antes.,

$H_{0}:p > 0.12$

$H_{1}:p ≤ 0.12$

#H0:mu = 0.12
#H1:mu > 0.12

O fabricante de certa marca de suco informa que as embalagens de seu produto têm em média 500 ml, com desvio padrão igual a 10 ml. Tendo sido encontradas no mercado algumas embalagens com menos de 500 ml, suspeita-se que a informação do fabricante seja falsa. Para verificar se isto ocorre, um fiscal analisa uma amostra de 200 embalagens escolhidas aleatoriamente no mercado e constata que as mesmas contêm em média 498 ml. Considerando-se um nível de significância de $5\%$, pode-se afirmar que o fabricante está mentindo? Calcule o valor da prova para esta amostra.

mu <- 500
sigma <- 10
n <- 200
xbarra <- 498
alpha <- 0.05
#H0: mu=500
#H1: mu<500 (Unilateral a esquerda)
#Estatística do Teste
Zcal <- (xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] -2.828427

pnormGC(Zcal, region="below", mean=0,
        sd=1, graph=TRUE)

## [1] 0.002338867

Ztab <- qnorm(alpha)
Ztab

## [1] -1.644854

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.05 de significância"

#Logo, o fabricante está mentindo!
(pvalor <- pnorm(Zcal))

## [1] 0.002338867

A duração das lâmpadas produzidas por certo fabricante tem distribuição normal com média igual a 1200 horas e desvio padrão igual a 300 horas. O fabricante introduz um novo processo na produção das lâmpadas. Para verificar se o novo processo produz lâmpadas de maior duração, o fabricante observa 100 lâmpadas produzidas pelo novo processo e constata que as mesmas duram em média 1265 horas. Admitindo-se um nível de significância de $5\%$, pode-se concluir que o novo processo produz lâmpadas com maior duração?

n <- 100
xbarra <- 1265
mu <- 1200
sigma <- 300
alpha <- 0.05
#H0:mu = 1200h
#H1:mu > 1200h (Teste-z unilateral)
#Estatística do Teste
Zcal <- (xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] 2.166667

pnormGC(Zcal, region="above", mean=0,
        sd=1, graph=TRUE)

## [1] 0.01513014

Ztab <- qnorm(alpha, mean = 0, sd=1, lower.tail = FALSE)
Ztab

## [1] 1.644854

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.05 de significância"

#Logo, o fabricante está mentindo!
(pvalor <- pnorm(Zcal, lower.tail = FALSE))

## [1] 0.01513014

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoZ

## [1] "Como p-valor< 0.05  Rejeita-se H0"

O custo de produção de certo artigo numa localidade tem distribuição normal com média igual a $R\$~42, 00.$ Desenvolve-se uma política de redução de custos na empresa para melhorar a competitividade do referido produto no mercado. Observando-se os custos de 10 unidades deste produto, obtiveram-se os seguintes valores: 34, 41, 36, 41, 29, 32, 38, 35, 33 e 30. Admitindo-se um nível de significância de $5\%$, pode-se afirmar que o custo do produto considerado diminuiu?

mu <- 42
n <- 10
x <- c(34, 41, 36, 41, 29, 32, 38, 35, 33, 30)
xbarra <- mean(x)
s <- sd(x)
alpha <- 0.05
#H0: mu = 42 
#H1: mu < 42 (Teste-t unilateral)
gl <- n-1
#Estatística do Teste
Tcal <- (xbarra-mu)/(s/sqrt(n))
Tcal

## [1] -5.377348

Ttab <- qt(alpha, df=gl, lower.tail = TRUE,)
Ttab

## [1] -1.833113

ConclusaoT <- ifelse(abs(Tcal)>abs(Ttab),paste(
"Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Tcal|<|Ttab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoT

## [1] "Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de 0.05 de significância"

#Logo, o fabricante está mentindo!
(pvalor <- pt(Tcal, df = gl, lower.tail = TRUE))

## [1] 0.0002230215

ConclusaoT <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoT

## [1] "Como p-valor< 0.05  Rejeita-se H0"

O controle de qualidade das peças produzidas por certa fábrica exige que o diâmetro médio das mesmas seja 57 mm. Para verificar se o processo de produção está sob controle, observam-se os diâmetros de 10 peças, constatando-se os seguintes valores em mm: $56,5; 56,6; 57,3; 56,9; 57,1; 56,7; 57,1; 56,8; 57,1; 57,0.$ Admitindo-se um nível de significância de $5\%$, pode-se concluir que o processo de produção está sob controle?

mu <- 57
n <- 10
x <- c(56.5, 56.6, 57.3, 56.9, 57.1, 56.7, 57.1, 56.8, 57.1, 57.0)
xbarra <- mean(x)
s <- sd(x)
alpha <- 0.05
#H0: mu = 57
#H1: mu != 57 (Teste-t bilateral)
gl <- n-1
#Estatística do Teste
Tcal <- (xbarra-mu)/(s/sqrt(n))
Tcal

## [1] -1.112516

Ttab <- qt(alpha, df=gl, lower.tail = TRUE)
Ttab

## [1] -1.833113

ConclusaoT <- ifelse(abs(Tcal)>abs(Ttab),paste(
"Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como -Ttab <Tcal< Ttab Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoT

## [1] "Como -Ttab <Tcal< Ttab Não Rejeita-se H0 ao nível de 0.05 de significância"

#Logo, o fabricante está mentindo!
(pvalor <- pt(Tcal, df = gl, lower.tail = TRUE))

## [1] 0.1473741

ConclusaoT <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoT

## [1] "Como p-valor> 0.05  Não Rejeita-se H0"

Numa localidade, 32% dos consumidores consomem determinado produto. Foi lançado no mercado da localidade um produto concorrente. Uma pesquisa realizada com 500 consumidores escolhidos ao acaso revelou que 145 dentre estes consomem o antigo produto. Pode-se concluir, num nível de significância de 2%, que a preferência pelo produto antigo diminuiu com a entrada do concorrente no mercado? Calcule o valor da prova para esta amostra.

mu <- 0.32
p <- 145/500
sigma <- sqrt(p*(1-p))
n <- 500
xbarra <- 0.29
alpha <- 0.02
#H0: mu= 0.32
#H1: mu< 0.32 (Unilateral a esquerda)
#Estatística do Teste
Zcal <- (xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] -1.478353

Ztab <- qnorm(alpha)
Ztab

## [1] -2.053749

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de 0.02 de significância"

(pvalor <- pnorm(Zcal, lower.tail = TRUE))

## [1] 0.06965669

(ConclusaoT <- ifelse(pvalor > alpha,
                     paste("Como p-valor >", alpha, "não rejeita-se H0"), 
                     paste("Como p-valor <", alpha, "rejeita-se H0")))

## [1] "Como p-valor > 0.02 não rejeita-se H0"

Sabe-se que 6% das unidades de certo produto são substituídas gratuitamente por apresentar defeitos de fabricação. Para reduzir este percentual, o fabricante investiu na melhoria da qualidade do produto. Constase que 12 dentre 400 unidades vendidas tiveram que ser substituídas gratuitamente por apresentar defeitos de fabricação. Pode-se concluir, num nível de significância de 3%, que a qualidade do produto melhorou?

mu <- 0.06
p <-12 / 400
sigma = sqrt(p * (1 - p))
n <- 400
alpha <- 0.03
#H0: mu = 0.06
#H1: mu < 0.06 (Unilateral a esquerda)
#Estatística do Teste
Zcal <- (p-mu)/(sigma/sqrt(n))
Zcal

## [1] -3.517262

Ztab <- qnorm(alpha, lower.tail = TRUE)
Ztab

## [1] -1.880794

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.03 de significância"

(pvalor <- pnorm(Zcal))

## [1] 0.0002180113

(ConclusaoT <- ifelse(pvalor > alpha,
                     paste("Como p-valor >", alpha, "não rejeita-se H0"), 
                     paste("Como p-valor <", alpha, "rejeita-se H0")))

## [1] "Como p-valor < 0.03 rejeita-se H0"

Suponha que o tempo necessário para que estudantes completem uma prova tenha distribuição normal com média 90 minutos e desvio padrão 15 minutos.

Qual é a probabilidade do estudante terminar a prova em menos de 80 minutos?

(pMenor80 <- pnorm(80, mean = 90, sd = 15, lower.tail = TRUE))

## [1] 0.2524925

Em mais de 120 minutos?

(pMaior120 <- pnorm(120, mean = 90, sd = 15, lower.tail = FALSE))

## [1] 0.02275013

Entre 75 e 85 minutos?

(pentre <- pnorm(85, mean = 90, sd = 15, lower.tail = TRUE) -  pnorm(75, mean = 90, sd = 15, lower.tail = TRUE))

## [1] 0.2107861

Qual é o tempo necessário para que 98% dos estudantes terminem a prova?

qnorm(0.98, mean = 90, sd = 15)

## [1] 120.8062

Uma v.a. X tem distribuição normal, com média 100 e desvio padrão 10.

Qual a $P(90 < X < 110)?$

pnorm(110, mean = 100, sd = 10)-pnorm(90, mean = 100, sd = 10)

## [1] 0.6826895

Se $\bar{X}$ for a média de uma amostra de 16 elementos retirados dessa população, calcule $P(90 < \bar{X} < 110).$

sigma <- 10/sqrt(n)

pnorm(110, mean = 100, sd = sigma)-pnorm(90, mean = 100, sd = sigma)

## [1] 1

Represente, num único gráfico, as distribuições de $X$ e $\bar{X}$.

n <- 16
x <- seq(-50, 150, length=1000)
mu <- 100
sigma <- 10/sqrt(n)
z <- dnorm(x, mean = 100, sd = 10)
colors <- "blue"
plot(x, z, type="l", lty=2, xlab="x", ylim = c(0,0.2),
    ylab="Densidade", main="Comparação de distribuições normais")
lines(x, dnorm(x,mu,sigma), lwd=2, col=colors)

Que tamanho deveria ter a amostra para que $P(90 < \bar{X}< 110) = 0, 95?$

$P(P(90 < \bar{X}< 110) = P\Big(\frac{90-\mu}{\frac{\sigma}{\sqrt{n}}}< \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}< \frac{110-\mu}{\frac{\sigma}{\sqrt{n}}}\Big )=P(-\sqrt{n}<Z<\sqrt{n})=0.95\Rightarrow \sqrt{n}=1.96;$

Para que $P(90 < \bar{X}< 110) = 0, 95?$ devemos ter $n\approx$ 3.8416

Nas situações abaixo, escolha como hipótese nula, $H_0,$ aquela que para você leva a um erro tipo I mais importante. Descreva quais os dois erros em cada caso.

O trabalho de um operador de radar é detectar aeronaves inimigas. Quando surge alguma coisa estranha na tela, ele deve decidir entre as hipotéses:

está começando um ataque;
tudo bem, apenas uma leve interferência.

$H_{0}:$está começando um ataque

Rejeitar $H_{0}$ e ela ser verdadeira, significa que, estamos afirmando que um ataque começando é apenas uma leve interferência. Nesse sentido, acredito que em questões de defesa é mais importante ter certeza que um ataque será considerado um ataque do que uma leve interferência ser considerada um ataque.

Num júri, um indivíduo está sendo julgado por um crime. As hipóteses sujeitas ao júri são:

o acusado é inocente;
o acusado é culpado.

$H_{0}:$o acusado é inocente

Rejeitar $H_{0}$ e ela ser verdadeira, significa que, estamos afirmando ser culpada uma pessoa inocente. Acredito que é mais importante ter certeza que uma pessoa inocente será considerada inocente do que uma pessoa culpada ser considerada inocente.

Um pesquisador acredita que descobriu uma vacina contra resfriado. Ele irá conduzir uma pesquisa de laboratório para verificar a veracidade da afirmação. De acordo com o resultado, ele lançará ou não a vacina no mercado. As hipóteses que pode testar são:

a vacina é eficaz;
a vacina não é eficaz.

$H_{0}:$a vacina não é eficaz

Rejeitar $H_{0}$ e ela ser verdadeira, significa que, estamos afirmando que uma vacina não eficaz é eficiente. Nesse sentido, é mais importante garantirmos com certeza que uma vacina não será considerada eficaz do que uma vacina eficiente ser vista como não eficaz.

Uma fábrica de automóveis anuncia que seus carros consomem, em média, 11 litros por 100 km, com desvio padrão de 0,8 litros. Uma revista resolve testar essa afirmação e analisa 35 automóveis dessa marca, obtendo 11,3 litros por 100 km como consumo médio (considerar distribução normal). O que a revista pode concluir sobre o anúncio da fábrica, no nível de $10\%$?

mu <- 11 #litros por 100 quilometro
sigma <- 0.8 #litros
n <- 35
xbarra <- 11.3 #litros por 100 quilometro
alpha <- 0.1
#H0:mu=11
#H1:mu!=11 (Teste Z bilateral)

#Estatística do Teste
Zcal <- (xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] 2.21853

Ztab <- qnorm(alpha, mean = 0, sd=1, lower.tail = FALSE)
Ztab

## [1] 1.281552

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.1 de significância"

pnormGC(c(qnorm(0.05), qnorm(0.05, lower.tail = F)), region="between", mean=0, sd=1, graph=TRUE)

## [1] 0.9

#Logo, o fabricante está mentindo!
(pvalor <- 2*pnorm(Zcal, lower.tail = FALSE))

## [1] 0.02651872

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoZ

## [1] "Como p-valor< 0.1  Rejeita-se H0"

Duas máquinas, A e B, são usadas para empacotar pó de café. A experiência passada garante que o desvio padrão para ambas é de 10 g. Porém, suspeita-se que elas têm médias diferentes. Para verificar, sortearam-se duas amostras: uma com 25 pacotes da máquina A e outra com 16 pacotes da máquina B. As médias foram, respectivamente, $\bar{X}_{A} = 502, 74g$ e $\bar{X}_{B} = 496, 60g.$ Com esses números, e com o nível de $5\%$, qual seria a conclusão do teste $H_{0} : \mu_A = \mu_B?$

sigma <- 10
nA <- 25
nB <- 16
xAbarra <- 502.74
xBbarra <- 496.6
alpha <- 0.05
#H0:muA=MuB
#H1:muA!=muB (Teste-z bilateral)

#Estatística do Teste
Zcal <- (xAbarra-xBbarra)/(sqrt((sigma^2)*((1/nA)+(1/nB))))
Zcal

## [1] 1.917814

Ztab <- qnorm((alpha)/2, mean = 0, sd=1, lower.tail = FALSE)
Ztab

## [1] 1.959964

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de 0.05 de significância"

pnormGC(c(qnorm((alpha)/2), qnorm((alpha)/2, lower.tail = F)), region="between", mean=0, sd=1, graph=TRUE)

## [1] 0.95

#Logo, o fabricante está mentindo!
(pvalor <- 2*pnorm(Zcal, lower.tail = FALSE))

## [1] 0.05513463

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoZ

## [1] "Como p-valor> 0.05  Não Rejeita-se H0"

Uma fábrica de embalagens para produtos químicos está estudando dois processos para combater a corrosão de suas latas especiais. Para verificar o efeito dos tratamentos, foram usadas amostras cujos resultados estão no quadro abaixo (em porcentagem de corrosão eliminada). Qual seria a conclusão sobre os dois tratamentos?

Método	Amostra	Média	Desvio Padrão
A	15	48	10
B	12	52	15

nA <- 15
nB <- 12
xAbarra <- 48
xBbarra <- 52
sA <- 10
sB <- 15
#H0:muA=muB
#H1:muA!=muB (Teste-t bilateral)
#Precisamos proceder antes do teste-T o teste-F.
#H0:SigmaA^2=SigmaB^2
#H1:SigmaA^2<SigmaB^2 (Teste unilateral)

(Fcal <- (sB^2)/(sA^2))

## [1] 2.25

(pvalor <- pf(q=Fcal, df1 = nB-1, df2 = nA-1))

## [1] 0.9224523

#Conclusao: Não rejeita-se H0 para todo alpha < pvalor. Assim, para realizar o teste - t, vamos considerar que as variâncias do método A 
#e método B são iguais (SigmaA^2=SigmaB^2). Dessa forma, procedemos 
# o teste-t para variâncias populacionais iguais.

#H0:muA=muB
#H1:muA!=muB (Teste-t bilateral)

#A <- (sA^2)/nA
#B <- (sB^2)/nB
#df <- ((A+B)^2)/(((A^2)/(nA-1))+((B^2)/(nB-1)))
df <- nA+nB-2  
Sc <- sqrt((((sA^2)*(nA-1))+((sB^2)*(nB-1)))/(nA+nB-2))  
#Estatística do Teste
Tcal <- (xAbarra-xBbarra)/(Sc*sqrt((1/nA)+(1/nB)))
Tcal

## [1] -0.8295614

(pvalor <- pt(Tcal, df = df, lower.tail = TRUE))

## [1] 0.207319

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoZ

## [1] "Como p-valor> 0.05  Não Rejeita-se H0"

Para investigar a influência da opção profissional sobre o salário inicial de recém-formados, investigaram-se dois grupos de profissionais: um de liberais em geral e outro de formandos em Administração de Empresas. Com os resultados abaixo, expressos em salários mínimos, quais seriam suas conclusões?

Liberais	6,6	10,3	10,8	12,9	9,2	12,3	7,0
Administradores	8,1	9,8	8,7	10,0	10,2	8,2	8,7

Li <- c(6.6, 10.3, 10.8, 12.9, 9.2, 12.3, 7.0)
Ad <- c(8.1, 9.8, 8.7, 10.0, 10.2, 8.2, 8.7, 10.1)
sd(Li)

## [1] 2.432909

sd(Ad)

## [1] 0.8876132

nLi <- length(Li)
nAd <- length(Ad)
#Teste-F
#H0:SigmaLi^2=SigmaAd^2
#H1:SigmaLi^2!=SigmaAd^2

var.test(Li, Ad, alternative = "two.sided")

## 
##  F test to compare two variances
## 
## data:  Li and Ad
## F = 7.5128, num df = 6, denom df = 7, p-value = 0.01768
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##   1.467755 42.789180
## sample estimates:
## ratio of variances 
##           7.512844

print("Para alpha > p-value=0.01768 rejeita-se H0, logo, devemos proceder o teste-t para variâncias desiguais.")

## [1] "Para alpha > p-value=0.01768 rejeita-se H0, logo, devemos proceder o teste-t para variâncias desiguais."

#H0:muLi=muAd
#H1:muLi!=muAd

t.test(Li, Ad, alternative = "two.sided", var.equal = FALSE)

## 
##  Welch Two Sample t-test
## 
## data:  Li and Ad
## t = 0.6653, df = 7.393, p-value = 0.5261
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.626575  2.919433
## sample estimates:
## mean of x mean of y 
##  9.871429  9.225000

print("Para alpha menor do que p-value=0.5261, não rejeita-se H0. Ou seja nesse caso, as médias salariais são iguais.")

## [1] "Para alpha menor do que p-value=0.5261, não rejeita-se H0. Ou seja nesse caso, as médias salariais são iguais."

Os dados abaixo referem-se a medidas de determinada variável em 19 pessoas antes e depois de uma cirurgia. Verifique se as medidas pré e pós-operatórias apresentam a mesma média. Que suposições você faria para resolver o problema?

Pessoas	Pré	Pós	Pessoas	Pré	Pós
1	50,0	42,0	10	40,0	50,0
2	50,0	42,0	11	50,0	48,0
3	50,0	78,0	12	75,0	52,0
4	87,5	33,0	13	92,5	74,0
5	32,5	96,0	14	38,0	47,5
6	35,0	82,0	15	46,5	49,0
7	40,0	44,0	16	50,0	58,0
8	45,0	31,0	17	30,0	42,0
9	62,5	87,0	18	35,0	60,0
10			19	39,4	28,0

Pre <- c(50.0,50.0,50.0,87.5,32.5,35.0,40.0,45.0,62.5,40.0,50.0,75.0,92.5,38.0,46.5,50.0,30.0,35.0,39.4)
Pos <- c(42.0,42.0,78.0,33.0,96.0,82.0,44.0,31.0,87.0,50.0,48.0,52.0,74.0,47.5,49.0,58.0,42.0,60.0,28.0)
Dif <- Pre-Pos
sd(Dif)

## [1] 26.35174

mean(Dif)

## [1] -4.978947

#H0:muDif=0
#H1:muDif!=0

t.test(Dif, alternative = "two.sided")

## 
##  One Sample t-test
## 
## data:  Dif
## t = -0.82358, df = 18, p-value = 0.421
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -17.680077   7.722183
## sample estimates:
## mean of x 
## -4.978947

print("Não rejeita-se H0 ao nível de 5% de significância, pois pvalor é maior que alpha=0.05")

## [1] "Não rejeita-se H0 ao nível de 5% de significância, pois pvalor é maior que alpha=0.05"

Como a variância da diferença entre os valores Pré e Pós-Operatório do exercício é muito alta, nós não rejeitamos H0, mesmo observando um valor bem diferente de 0. Para corrigir o teste e/ou rejeitarmos H0 com um valor de média tão discrepante de 0, precisamos corrigir a variabilidade da diferente entre o pré e o pós-operatório.

Uma empresa deseja estudar o efeito de uma pausa de dez minutos para um cafezinho sobre a produtividade de seus trabalhadores. Para isso, sorteou seis operários, e contou o número de peças produzidas durante uma semana sem intervalo e uma semana com intervalo. Os resultados sugerem se há ou não melhora na produtividade? Caso haja melhora, qual deve ser o acréscimo médio de produção para todos os trabalhadores da fábrica?

Operário	1	2	3	4	5	6
Sem intervalo	23	35	29	33	43	32
Com intervalo	28	38	29	37	42	30

SI <- c(23, 35, 29, 33, 43, 32)
CI <- c(28, 38, 29, 37, 42, 30)

# primeiro, testamos as variâncias
var.test(SI, CI, alternative = "two.sided")

## 
##  F test to compare two variances
## 
## data:  SI and CI
## F = 1.3223, num df = 5, denom df = 5, p-value = 0.7667
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.1850292 9.4495832
## sample estimates:
## ratio of variances 
##           1.322289

print("Para p-value > alpha devemos proceder o teste-t para variâncias iguais.")

## [1] "Para p-value > alpha devemos proceder o teste-t para variâncias iguais."

#H0:muDif=0
#H1:muDif!=0

t.test(SI, CI, alternative = "two.sided", var.equal = TRUE)

## 
##  Two Sample t-test
## 
## data:  SI and CI
## t = -0.41845, df = 10, p-value = 0.6845
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -9.487186  6.487186
## sample estimates:
## mean of x mean of y 
##      32.5      34.0

print("Observamos que pvalor > alpha, então não podemos rejeitar H0 e concluímos que não houve melhora na produtividade")

## [1] "Observamos que pvalor > alpha, então não podemos rejeitar H0 e concluímos que não houve melhora na produtividade"

Num levantamento feito com os operários da indústria mecânica, chegou-se aos seguintes números: salário médio = 3,64 salários mínimos e desvio padrão = 0,85 salário mínimo. Suspeita-se que os salários de subclasse formada pelos torneiros mecânicos são diferentes dos salários do conjunto todo, tanto na média como na variância. Que conclusões você obteria se uma amostra de 25 torneiros apresentasse salário médio igual a 4,22 salários mínimos e desvio padrão igual a 1,25 salário mínimo?

mu <- 3.64
sigma_1 <- 0.85
sigma_2 = 1.25
n <- 25
x <- 4.22 
alpha <- 0.05

#H0:mu = xbarra
#H1:mu != xbarra (Teste t bilateral)

Tcal <- (x - mu)/(sigma_1/(sqrt(n)))

(pvalor <- pt(Tcal, df = n - 1, lower.tail = TRUE))

## [1] 0.9988548

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, ", não rejeita-se H0"
), paste(
"Como p-valor<", alpha, ", então rejeita-se a Hipótese nula")
)
ConclusaoZ

## [1] "Como p-valor> 0.05 , não rejeita-se H0"

Um partido afirma que a porcentagem de votos masculinos a seu favor será de 10 % a mais do que a porcentagem de votos femininos. Numa pesquisa feita entre 400 homens, 170 votariam no partido, enquanto entre 625 mulheres, 194 lhe seriam favoráveis. A afirmação do partido é verdadeira ou não?

p_1 = 170/400
p_2 = 194/625
n1 = 400
n2 = 625
alpha = 0.05

#Ho: p_1 = p_2+0.10
#H1: p_1 != p_2 + 0.10
s1 = (p_1*(1 - p_1))/n1
s2 = (p_2*(1 - p_2))/n2
s = s1+s2
sigma = sqrt(s)

Z = (p_1 - p_2 - 0.1)/sigma
Ztab = -1.96
print(paste("Zcal é igual a",round(Z,4), "e Ztab é igual a", Ztab))

## [1] "Zcal é igual a 0.4728 e Ztab é igual a -1.96"

ConclusaoZ <- ifelse(abs(Z)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância, então a afirmação do partido é verdadeira"
))
ConclusaoZ

## [1] "Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de 0.05 de significância, então a afirmação do partido é verdadeira"

De 400 moradores sorteados de uma grande cidade industrial, 300 são favoráveis a um projeto governamental, e de uma amostra de 160 moradores de uma cidade cuja principal atividade é o turismo, 120 são contra. a) Você diria que a diferença de opiniões nas duas cidades é estatisticamente significante?

p_1 = 300/400
p_2 = 40/160
n1 = 400
n2 = 160
alpha = 0.05

#Ho: p_1 = p_2
#H1: p_1 != p_2
s1 = (p_1*(1 - p_1))/n1
s2 = (p_2*(1 - p_2))/n2
s = s1+s2
sigma = sqrt(s)

Z = (p_1 - p_2)/sigma
Ztab = -1.96
print(paste("Zcal é igual a",round(Z,4), "e Ztab é igual a", Ztab))

## [1] "Zcal é igual a 12.3443 e Ztab é igual a -1.96"

ConclusaoZ <- ifelse(abs(Z)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância, então a diferença de opiniões é significante"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância, então a diferença de opiniões não é significante"))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.05 de significância, então a diferença de opiniões é significante"

Para verificar o grau de adesão de uma nova cola para vidros, preparam-se dois tipos de montagem: cruzado (A), onde a cola é posta em forma de X, e quadrado (B), onde a cola é posta apenas nas quatro bordas. Os resultados da resistência para as duas amostras de 10 cada estão abaixo. Que tipo de conclusão poderia ser tirada?

Método	A	16	14	19	18	19	20	15	18	17	18
Método	B	13	19	14	17	21	24	10	14	13	15

A <- c(16, 14, 19, 18, 19, 20, 15, 18, 17, 18)
B <- c(13, 19, 14, 17, 21, 24, 10, 14, 13, 15)
Dif <- B-A
sigma = sd(Dif)
mu = mean(Dif)
#H0:muDif=0 Grau de adesão é o mesmo
#H1:muDif!=0 Grau de adesão é diferente

t.test(Dif, alternative = "two.sided")

## 
##  One Sample t-test
## 
## data:  Dif
## t = -1.1813, df = 9, p-value = 0.2677
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -4.080866  1.280866
## sample estimates:
## mean of x 
##      -1.4

print("Não rejeita-se H0 ao nível de 5% de significância, pois pvalor é maior que alpha=0.05, então o grau de adesão aparenta ser o mesmo")

## [1] "Não rejeita-se H0 ao nível de 5% de significância, pois pvalor é maior que alpha=0.05, então o grau de adesão aparenta ser o mesmo"

Em um estudo para comparar os efeitos de duas dietas, A e B, sobre o crescimento, 6 ratos foram submetidos à dieta A, e 9 ratos à dieta B. Após 5 semanas, os ganhos em peso foram:

Dieta A	15	18	12	11	14	15
Dieta B	11	11	12	16	12	13	8	10	13

A <- c(15, 18, 12,11, 14, 15)
B <- c(11, 11, 12, 16, 12, 13, 8, 10, 13)

#Teste-F
#H0:SigmaA^2=SigmaB^2
#H1:SigmaA^2!=SigmaB^2

var.test(A, B, alternative = "two.sided")

## 
##  F test to compare two variances
## 
## data:  A and B
## F = 1.2472, num df = 5, denom df = 8, p-value = 0.7425
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.2588997 8.4274842
## sample estimates:
## ratio of variances 
##           1.247191

print("Para alpha = 0.05 < p-value = 0.7425 não rejeita-se H0, logo, devemos proceder o teste-t para variâncias iguais.")

## [1] "Para alpha = 0.05 < p-value = 0.7425 não rejeita-se H0, logo, devemos proceder o teste-t para variâncias iguais."

#H0:muA=muB
#H1:muA!=muB

t.test(A, B, alternative = "two.sided", var.equal = TRUE)

## 
##  Two Sample t-test
## 
## data:  A and B
## t = 1.9479, df = 13, p-value = 0.07335
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.2605688  5.0383466
## sample estimates:
## mean of x mean of y 
##  14.16667  11.77778

print("Para alpha = 0.05 < p-value=0.07335, não rejeita-se H0. Ou seja nesse caso, os ganhos em peso são iguais.")

## [1] "Para alpha = 0.05 < p-value=0.07335, não rejeita-se H0. Ou seja nesse caso, os ganhos em peso são iguais."

Admitindo que temos duas amostras independentes de populações normais, teste a hipótese de que não há diferença entre as duas dietas, contra a alternativa que a dieta A é mais eficaz, usando o teste t de Student, no nível de $\alpha = 0, 01.$

A <- c(15, 18, 12,11, 14, 15)
B <- c(11, 11, 12, 16, 12, 13, 8, 10, 13)

#Teste-F
#H0:SigmaA^2=SigmaB^2
#H1:SigmaA^2!=SigmaB^2

var.test(A, B, alternative = "two.sided")

## 
##  F test to compare two variances
## 
## data:  A and B
## F = 1.2472, num df = 5, denom df = 8, p-value = 0.7425
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.2588997 8.4274842
## sample estimates:
## ratio of variances 
##           1.247191

print("Para alpha = 0.01 < p-value = 0.7425 não rejeita-se H0, logo, devemos proceder o teste-t para variâncias iguais.")

## [1] "Para alpha = 0.01 < p-value = 0.7425 não rejeita-se H0, logo, devemos proceder o teste-t para variâncias iguais."

#H0:muA=muB
#H1:muA<muB

t.test(A, B, alternative = "two.sided", var.equal = TRUE)

## 
##  Two Sample t-test
## 
## data:  A and B
## t = 1.9479, df = 13, p-value = 0.07335
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.2605688  5.0383466
## sample estimates:
## mean of x mean of y 
##  14.16667  11.77778

print("Para alpha = 0.01 < p-value=0.07335, não rejeita-se H0. Então, não há diferença entre as duas dietas.")

## [1] "Para alpha = 0.01 < p-value=0.07335, não rejeita-se H0. Então, não há diferença entre as duas dietas."

Suponha que o tempo necessário para atendimento de clientes em uma central de atendimento telefônico siga uma distribuição normal de média de 8 minutos e desvio padrão de 2 minutos.

Qual é a probabilidade de que um atendimento dure menos de 5 minutos?

# P(X<5)
pnorm(5, mean = 8, sd = 2, lower.tail = TRUE)

## [1] 0.0668072

E mais do que 9,5 minutos?

# P(X>9.5)
pnorm(9.5, mean = 8, sd = 2, lower.tail = FALSE)

## [1] 0.2266274

E entre 7 e 10 minutos?

# P(7<X<10)
pnorm(10, mean = 8, sd = 2, lower.tail = TRUE) - pnorm(7, mean = 8, sd = 2, lower.tail = TRUE)

## [1] 0.5328072

7$5\%$ das chamadas telefônicas requerem pelo menos quanto tempo de atendimento?

# Olhando na tabela Normal vemos que o Z que corresponde a 25% de baixo é -0.6745
Z = -0.6745
X = (Z *2)+8 
pnormGC(X, mean = 8, sd = 2, graph = "TRUE", region = "above")

## [1] 0.7500033

print("Então 75% das chamadas requerem no mínimo aproximadamente 6.6 minutos")

## [1] "Então 75% das chamadas requerem no mínimo aproximadamente 6.6 minutos"

A distribuição dos pesos de coelhos criados numa granja pode muito bem ser representada por uma distribuição Normal, com média 5 kg e desvio padrão 0,9 kg. Um abatedouro comprará 5000 coelhos e pretende classificá-los de acordo com o peso do seguinte modo: 1$5\%$ dos mais leves como pequenos, os $50\%$ seguintes como médios, os $20\%$ seguintes como grandes e os 1$5\%$ mais pesados como extras. Quais os limites de peso para cada classificação?

# Olhando na tabela Normal vemos que o Z que corresponde a 15% é igual a -1.0365 (Mais leves)
Z = -1.0365
X = (Z *0.9)+5 
pnormGC(X, mean = 5, sd = 0.9, graph = "TRUE", region = "below")

## [1] 0.1499845

print("Então o limite de peso para os mais leves é aproximadamente 4.07 Kg")

## [1] "Então o limite de peso para os mais leves é aproximadamente 4.07 Kg"

# Olhando na tabela Normal vemos que o Z que corresponde a 15% é igual a -1.0365 e de 65% é 0.3854
Z2 = 0.3854
Z = -1.0365
X = (Z *0.9)+5
Y = (Z2 *0.9)+5
pnormGC(c(X,Y), mean = 5, sd = 0.9, graph = "TRUE", region = "between")

## [1] 0.500045

print("Então o limite de peso para os médios é aproximadamente entre 4.07 Kg e 5.35 Kg")

## [1] "Então o limite de peso para os médios é aproximadamente entre 4.07 Kg e 5.35 Kg"

# Olhando na tabela Normal vemos que o Z que corresponde a 65% é 0.3854 e 85% é 1.0365
Z2 = 0.3854
Z = 1.0365
X = (Z *0.9)+5
Y = (Z2 *0.9)+5
pnormGC(c(Y,X), mean = 5, sd = 0.9, graph = "TRUE", region = "between")

## [1] 0.1999861

print("Então o limite de peso para os grandes é aproximadamente entre 5.35 Kg e 5.93 Kg")

## [1] "Então o limite de peso para os grandes é aproximadamente entre 5.35 Kg e 5.93 Kg"

# Olhando na tabela Normal vemos que o Z que corresponde a 85% é aproximadamente 1.0365 e 100% 3.9
Z = 1.0365
Z2 = 3.99
X = (Z *0.9)+5
Y = (Z2 *0.9)+5
pnormGC(c(X,Y), mean = 5, sd = 0.9, graph = "TRUE", region = "between")

## [1] 0.1499514

print("Então o limite de peso para os extras é aproximadamente entre 5.93 Kg e 8.591")

## [1] "Então o limite de peso para os extras é aproximadamente entre 5.93 Kg e 8.591"

Uma enchedora automática de refrigerantes está regulada para que o volume médio de líquido em cada garrafa seja de $1000cm^{3}$ e desvio padrão de $10m^{3}.$ Admita que o volume siga uma distribuição normal.

Qual é a porcentagem de garrafas em que o volume de líquido é menor que $990cm^{3}?$

# P(X<990)
mu = 1000
sd = 10000000
pnormGC(990, mu, sd, graph = "TRUE", region = "below")

## [1] 0.4999996

Qual é a porcentagem de garrafas em que o volume de líquido não se desvia da média em mais do que dois desvios padrões?

mu = 1000
sd = 10000000
X = mu + 2*sd
pnormGC(X, mu, sd, graph = "TRUE", region = "below")

## [1] 0.9772499

Uma empresa produz televisores de 2 tipos, tipo A (comum) e tipo B (luxo), e garante a restituição da quantia paga se qualquer televisor apresentar defeito grave no prazo de seis meses. O tempo para ocorrência de algum defeito grave nos televisores tem distribuição normal sendo que, no tipo A, com média de 10 meses e desvio padrão de 2 meses e no tipo B, com média de 11 meses e desvio padrão de 3 meses. Os televisores de tipo A e B são produzidos com lucro de 1200 u.m. e 2100 u.m. respectivamente e, caso haja restituição, com prejuízo de 2500 u.m. e 7000 u.m. Respectivamente.

Calcule as probabilidades de haver restituição nos televisores do tipo A e do tipo B.

# P(X < 6)
mA = 10
sA = 2
mB = 11
sB = 3
print(paste("Probabilidade de A é igual a", round(pnorm(6, mA, sA),3)))

## [1] "Probabilidade de A é igual a 0.023"

print(paste("Probabilidade de B é igual a", round(pnorm(6, mB, sB),3)))

## [1] "Probabilidade de B é igual a 0.048"

Calcule o lucro médio para os televisores do tipo A e para os televisores do tipo B. Baseando-se nos lucros médios, a empresa deveria incentivar as vendas dos aparelhos do tipo A ou do tipo B?

l_a = (1-pnorm(6, mA, sA))*1200 - pnorm(6, mA, sA)*2500
l_b = (1-pnorm(6, mB, sB))*2100 - pnorm(6, mB, sB)*7000
print(paste("Lucro médio para os televisores do tipo A é igual a", round(l_a,3)))

## [1] "Lucro médio para os televisores do tipo A é igual a 1115.825"

print(paste("Lucro médio para os televisores do tipo B é igual a", round(l_b,3)))

## [1] "Lucro médio para os televisores do tipo B é igual a 1665.108"

print("Então, a empresa deveria incentivar as vendas dos aparelhos tipo B")

## [1] "Então, a empresa deveria incentivar as vendas dos aparelhos tipo B"

Um estudo comparou dois métodos (A e B) para ensinar matemática a alunos do primeiro grau. Após 10 semanas, o desempenho dos alunos foi avaliado em um teste. Teste a hipótese de que o método A resulta num melhor desempenho médio, ao nível $\alpha=5\%$, com base nos resultados da tabela a seguir:

Método	Número de alunos	Média das notas	Desvio padrão das notas
A	10	8.15	1.15
B	8	7.31	1.94

n <- 10
na <- 10
nb <- 8
ma <- 8.15
mb <- 7.31
da <- 1.15
db <- 1.94
alpha <- 0.05
# testando as var
Fcal = (da ^ 2) / (db ^2)
pf(Fcal, na - 1, nb - 1, lower.tail = TRUE)

## [1] 0.07326077

# variâncias iguais
# teste t com variâncias iguais:

gl <- na + nb - 2
Sc <- sqrt((((da^2)*(na - 1))+((db^2)*(nb - 1)))/gl)
Tcal <- (ma - mb)/(Sc*sqrt((1/na)+(1/nb)))
(pvalor <- pt(Tcal, df = gl, lower.tail = TRUE))

## [1] 0.8655499

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoZ

## [1] "Como p-valor> 0.05  Não Rejeita-se H0"

A lei trabalhista estabelece que o pagamento diário mínimo deve ser de 13, 20 U.M. (unidades monetárias). Assuma distribuição normal com desvio padrão igual a 2,0 U.M. Uma amostra aleatória de 40 trabalhadores de uma firma revelou média diária de 12,20 U.M. Esta firma deve ser acusada de estar infringindo a lei? Conclua a $1\%$ de probabilidade.

mu <- 13.2
dp <- 2
n <- 40
x <- 12.2
alpha <- 0.01
Tcal <- (x - mu) / (dp / sqrt(n))

(pvalor <- pt(Tcal, df = n - 1, lower.tail = TRUE))

## [1] 0.001513711

print("Podemos acusar a firma de infringir a lei, já que rejeitamos H0, porque p-valor < 0.01")

## [1] "Podemos acusar a firma de infringir a lei, já que rejeitamos H0, porque p-valor < 0.01"

A tabela a seguir mostra a frequência de acidentes automobilísticos por ano, de acordo com a faixa etária (idade) do motorista, para motoristas com idade inferior a 25 anos. Teste a hipótese de que o número de acidentes independe da idade, a $5\%$ de probabilidade. Isto é, teste a hipótese de que o número anual de acidentes se distribui proporcionalmente nas faixas etárias. A tabela abaixo apresenta o percentual de motoristas em cada faixa etária.

% de motoristas	10	20	20	25	25
idade (anos)	15-16	17-18	19-20	21-22	23-24
número de acidentes	8	15	13	11	8

alpha <- 0.05
(TotalAcidentes <- 8+15+13+11+8)

## [1] 55

Obs <- c(8,15,13,11,8)

#H0:O percentual de acidentes independe da idade
#H1:Não H0
XiQuad <- chisq.test(Obs, p = c(0.1,0.2,0.2,0.25,0.25))
XiQuad

## 
##  Chi-squared test for given probabilities
## 
## data:  Obs
## X-squared = 5.9091, df = 4, p-value = 0.206

Uma indústria farmacêutica conduziu um estudo para avaliar o tempo médio em dias para recuperação dos efeitos da gripe. O estudo comparou o tempo de indivíduos que tomaram 500 mg diárias de vitamina C, contra indivíduos que não tomaram vitamina C (nenhum suplemento). Com base nos dados a seguir, conclua e interprete a $5\%$ de probabilidade.

	Nenhum suplemento 500mg	Vit. C
Tamanho da amostra	12	12
Tempo médio	7,4	5,8
Variâncias	2,9	2,4

# A = Vit. C
# B = Nenhum

nA <- 12
nA <- 12
xA <- 7.4
xB <- 5.8
vA <- 2.9
vB <- 2.4
alpha <- 0.05
sA <- sqrt(vA)
sB <- sqrt(vB)

Fcal <- (vA)/(vB)
pf(Fcal, na - 1, nb - 1)

## [1] 0.5893959

#H0: xA=xB
#H1: xA>xB
# encontramos que as variâncias são iguais,
# realizamos teste t com variâncias iguais

gl <- nA + nB - 2
Sc <- sqrt((((sA^2)*(na - 1))+((sB^2)*(nb - 1)))/gl)

Tcal <- (xB - xA)/(Sc*sqrt((1/nA)+(1/nB))) 

(pvalor <- pt(Tcal, df = gl, lower.tail = TRUE))

## [1] 0.005140307

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " então rejeita-se H0, a favor de que o tempo de recuperação é menor entre os pacientes que tomaram vitamina C")
)
ConclusaoZ

## [1] "Como p-valor< 0.05  então rejeita-se H0, a favor de que o tempo de recuperação é menor entre os pacientes que tomaram vitamina C"

Um pesquisa de opinião entrevistou 50 pessoas em dois distritos. O objetivo era verificar se a distribuição das opiniões era homogênea nos dois distritos. Com base nos dados da tabela, teste a hipótese de homogeneidade de opiniões usando $\alpha=5\%$.

	Sim	Indeciso	Não	Total
Distrito A	20	9	21	50
Distrito B	26	3	21	50
Total	46	12	42	100

Fobs <- data.frame(Distrito=c("Distrito A", "Distrito B"), Sim=c(20,26),
                   Indeciso=c(9,3), Nao=c(21,21), row.names = TRUE)
alpha <- 0.05
#H0: As opiniões são homogêneas
#H1: As opiniões não são homogêneas

chisq.test(Fobs, correct = TRUE)

## 
##  Pearson's Chi-squared test
## 
## data:  Fobs
## X-squared = 3.7826, df = 2, p-value = 0.1509

Uma associação comercial afirma que o número médio de dias de trabalho perdidos anualmente, devido a problemas de saúde, é igual a 60. Uma extensa campanha educacional visando a conscientizar os trabalhadores quanto a importância de uma alimentação balanceada, higiene pessoal, prática de esportes etc, foi conduzida com o intuito de melhorar este quadro. Um ano após esta campanha, um estudo com 30 trabalhadores forneceu média igual a 55 dias. Assuma que o número de dias de trabalho perdidos anualmente é normalmente distribuído com variância $\sigma^{2}=275$. Pede-se:

Pode-se afirmar que a campanha foi eficaz ao nível de $\alpha= 1\%$ de probabilidade?

mu <- 60
n <- 30
x <- 55
var <- 275
alpha <- 0.01
sd <- sqrt(var)
#Ho: mu=x
#H1: mu>x
Tcal <- (x - mu) / (sd / sqrt(n))

(pt(Tcal, df = n - 1, lower.tail = TRUE))

## [1] 0.05471847

print("Como pvalor > 0.05, não é possível rejeitar a hipótese nula de que a campanha não foi eficaz.")

## [1] "Como pvalor > 0.05, não é possível rejeitar a hipótese nula de que a campanha não foi eficaz."

Para qual nível de significância se pode afirmar que a campanha educacional foi eficaz?

(pt(Tcal, df = n - 1, lower.tail = TRUE))

## [1] 0.05471847

print(paste("A campanha foi eficaz a um nível de significância de 5.4%"))

## [1] "A campanha foi eficaz a um nível de significância de 5.4%"

Um gerente comercial acredita que um número excessivo de horas estejam sendo desperdiçadas em contatos comerciais, via telefone, entre os seus vendedores e os clientes em potencial. Ele deseja no máximo quinze horas por semana por vendedor. Este gerente comercial contratou uma empresa especializada para treinar seus vendedores. Após este treinamento, uma amostra de 36 vendedores revelou média igual a 17h por semana por vendedor. O que pode ser concluído quanto a eficácia do treinamento? Assuma $\sigma^{2}=9$ e utilize $\alpha=5\%$.

mu <- 15
n <- 36
x <- 17
var <- 9
sd <- sqrt(var)
alpha <- 0.05
# mu > x
# mu < x
Tcal <- (x - mu) / (sd / sqrt(n))
(pvalor <- pt(Tcal, df = n-1, lower.tail = FALSE))

## [1] 0.0001561009

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0, então o número excessivo de horas diminuiu"
), paste(
"Como p-valor<", alpha, " então rejeita-se a Hipótese nula de que número excessivo de horas diminuiu, a favor de que a situação piorou")
)
ConclusaoZ

## [1] "Como p-valor< 0.05  então rejeita-se a Hipótese nula de que número excessivo de horas diminuiu, a favor de que a situação piorou"

Com base em dados obtidos de 400 mulheres, apresentados na tabela abaixo, pode-se concluir que o nível educacional e a adaptação à vida conjugal são independentes? Conclua a $5\%$ de probabilidade.

Nível educacional	ruim	razoável	boa	muito boa
Universidade	18	29	70	115
2º grau	17	28	30	41
3º grau	11	10	11	20

alpha <- 0.05
Fobs <- data.frame(Educa = c("Universidade", "2º grau", "3º grau"), 
                   Ruim = c(18, 17, 11),
                   Razoável = c(29, 28, 10),
                   Boa = c(70, 30, 11),
                   MtBoa = c(115, 41, 20),
                   row.names = TRUE)

#H0: nível educacional e adaptação à vida conjugal são independentes
#H1: nível educacional e adaptação à vida conjugal não são independentes 

chisq.test(Fobs, correct = TRUE)

## 
##  Pearson's Chi-squared test
## 
## data:  Fobs
## X-squared = 19.943, df = 6, p-value = 0.002835

print("As variáveis são dependentes, pois encontramos um p-valor < nível de significância de 5%")

## [1] "As variáveis são dependentes, pois encontramos um p-valor < nível de significância de 5%"

Uma cooperativa de produtores possui uma máquina de encher vasilhame com um litro de leite. Para assegurar que em média cada vasilhame não terá leite a mais e nem a menos, o responsável pelo controle de qualidade amostra, semanalmente, 75 vasilhames enchidos pela máquina. Se uma amostra fornecer 63, 97 litros e desvio padrão $s = 0, 25$ litros, deve-se parar a máquina para regulagem ou continuar a produção? Qual deve ser o procedimento adotado a $\alpha=5\%$ de probabilidade?

mu <- 1
n <- 75
x <- 63.97/75
s <- 0.25
alpha <- 0.05
Tcal <- (x - mu) / (s)
#Ho: mu=x
#H1: mu!= x
(pvalor <- pt(Tcal, df = n - 1, lower.tail = TRUE))

## [1] 0.2790723

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0, então a máquina está dentro do padrão"
), paste(
"Como p-valor<", alpha, ",então rejeita-se a Hipótese nula de que a máquina esteja está enchendo vasilhames com média igual a 1 litro, ou seja, precisa ser consertada")
)
ConclusaoZ

## [1] "Como p-valor> 0.05  Não Rejeita-se H0, então a máquina está dentro do padrão"

A renda média de famílias com 4 pessoas na região sudeste do Brasil, no ano de 1975, era de 5 U.M. Economistas acreditam que atualmente a renda média é maior. Pede-se,

Quais seriam as hipóteses estatísticas (H0 e Ha), para se tentar provar que atualmente a renda média é maior do que em 1975?

# H0: renda_média = 5 U.M.
# H1: renda_média > 5 U.M.

Quais são as informações necessárias para se realizar um teste Z?

print("Para realizar um teste Z é preciso termos uma amostra suficientemente grande e representativa que siga uma distribuição normalizada, além de dados referentes a sua média e a variância")

## [1] "Para realizar um teste Z é preciso termos uma amostra suficientemente grande e representativa que siga uma distribuição normalizada, além de dados referentes a sua média e a variância"

Quais são as informações necessárias para se realizar um teste t?

print("Para realizar um teste t precisamos ter uma amostra com sua média e variância")

## [1] "Para realizar um teste t precisamos ter uma amostra com sua média e variância"

Explique os dois possíveis erros (erro tipo I e erro tipo II) de decisão que podem ocorrer neste exemplo?

print("O erro tipo 1 é quando rejeitamos H0 sendo que a hipótese é verdadeira, ou seja, informar que a renda aumentou enquanto ela na realidade se manteve igual")

## [1] "O erro tipo 1 é quando rejeitamos H0 sendo que a hipótese é verdadeira, ou seja, informar que a renda aumentou enquanto ela na realidade se manteve igual"

print("O erro tipo 2 é quando não rejeitamos H0 sendo que a hipótese é falsa, ou seja, dizer que a renda está igual quando na verdade ela aumentou")

## [1] "O erro tipo 2 é quando não rejeitamos H0 sendo que a hipótese é falsa, ou seja, dizer que a renda está igual quando na verdade ela aumentou"

Assuma que o consumo mensal per capita de determinado produto tem distribuição normal com desvio padrão igual a 5 kg. Com a atual crise (do dólar, do apagão, do futebol…várias opções!) o departamento de vendas da fábrica decidiu que irá retirar o produto do mercado, caso o consumo médio $(\mu)$ per capita seja inferior a 10kg. Se uma pesquisa de mercado, com uma amostra de 100 indivíduos, revelar consumo médio mensal per capita de 9 kg, pede-se: Qual deve ser a afirmação, ao nível de significância de $1, 5\%?$

sd <- 5
mu <- 10
n <- 100
x <- 9
alpha <- 0.015
Zcal <- (x - mu) / (sd / sqrt(n))

(pvalor <- pnorm(Zcal, lower.tail = TRUE))

## [1] 0.02275013

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0, então o consumo médio per capita é inferior a 10kg."
), paste(
"Como p-valor<", alpha, ",Rejeita-se H0, então o consumo médio per capita é superior a 10kg.")
)
ConclusaoZ

## [1] "Como p-valor> 0.015  Não Rejeita-se H0, então o consumo médio per capita é inferior a 10kg."

No quadro abaixo estão as opiniões, com respeito ao desempenho e a potência do motor, de proprietários de veículos de um determinado fabricante. As opiniões foram classificadas pela idade do proprietário.

Idade	Ruim	Bom
Jovem	30	20
Experiente	20	30

O que pode ser afirmado quanto à seguinte hipótese de nulidade? H0 : Idade e opinião são independentes.

Fobs <- data.frame(Idade = c("Jovem", "Experiente"), 
                   Ruim = c(30, 20),
                   Bom = c(20, 30), 
                   row.names = TRUE)

#H0: Idade e opinião são independentes
#H1: Idade e opinião não são independentes

chisq.test(Fobs, correct = TRUE)

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  Fobs
## X-squared = 3.24, df = 1, p-value = 0.07186

print("Temos que pvalor > 0.05, então Idade e opinião são independentes")

## [1] "Temos que pvalor > 0.05, então Idade e opinião são independentes"

Para comparar duas marcas de pará-choques, montaram-se seis de cada marca em 12 carros compactos, fazendo-se cada carro colidir com um muro de concreto, a uma velocidade de 40 km Registraram-se os seguintes custos de reparo:

Pára-choque	Custo (R$)	Média	Variância
A	320 310 380 360 320 345	339,17	744,17
B	305 290 340 315 280 305	305,80	434,17

Teste ($\alpha=5\%$) a hipótese de igualdade entre os custos médios de reparo dos pará-choques.

a <- c(320, 310, 380, 360, 320, 345)
b <- c(305, 290, 340, 315, 280, 305)
alpha = 0.05

# testando variâncias
var.test(a, b, alternative = "two.sided")

## 
##  F test to compare two variances
## 
## data:  a and b
## F = 1.714, num df = 5, denom df = 5, p-value = 0.5687
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##   0.2398433 12.2489808
## sample estimates:
## ratio of variances 
##           1.714012

# variâncias iguais. teste t com variâncias iguais
t.test(a, b, alternative = "two.sided", var.equal = TRUE)

## 
##  Two Sample t-test
## 
## data:  a and b
## t = 2.3786, df = 10, p-value = 0.03871
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   2.108458 64.558208
## sample estimates:
## mean of x mean of y 
##  339.1667  305.8333

print("Encontramos que pvalor < alpha, então rejeitamos a hipótese nula que os custos médios de reparo são igais")

## [1] "Encontramos que pvalor < alpha, então rejeitamos a hipótese nula que os custos médios de reparo são igais"

Se um dado não é viciado cada uma das seis faces ocorre com igual probabilidade. Um determinado dado foi lançado 720 vezes, obtendo-se:

Face	1	2	3	4	5	6	Total
Frequência observada	129	107	98	132	136	118	720

O dado será considerado viciado para qual nível de significância? Explique sua resposta.

Fobs <- data.frame(Face = c("1", "2", "3", "4", "5", "6"), 
                   Freq_obs = c(129, 107, 98, 132, 136, 118),
                   Freq_esperada = rep(120, 6), 
                   row.names = TRUE)

#H0: dado é não viciado
#H1: dado é viciado

chisq.test(Fobs, correct = TRUE)

## 
##  Pearson's Chi-squared test
## 
## data:  Fobs
## X-squared = 4.8782, df = 5, p-value = 0.4309

print("Pelo teste de qui quadrado encontramos pvalor = 0.4309, então o dado será considerado viciado para um nível de significância de 43.09%")

## [1] "Pelo teste de qui quadrado encontramos pvalor = 0.4309, então o dado será considerado viciado para um nível de significância de 43.09%"

O tempo médio, por operário, para executar uma tarefa, tem sido 100 minutos. Introduziu-se uma modificação para diminuir esse tempo, e, após certo período, sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução de cada um. O tempo médio da amostra foi 85 minutos, e o desvio padrão foi 12 minutos. Estes resultados trazem evidências estatísticas da melhora desejada, considerando $\alpha=5\%$? Apresente as suposições teóricas usadas para resolver problema.

mu <- 100
n <- 16
x <- 85
s <- 12

Tcal <- (x - mu) / (s/sqrt(n))

(pt(Tcal, df = n - 1, lower.tail = TRUE))

## [1] 7.918476e-05

print("Como alpha > pvalor, temos evidências para descartar a igualdade entre a médias dos tempos e afirmar que uma melhora aconteceu após a modificação. As suposições do problemas foi assumir uma distribuição T-Student, por termos uma amostra pequena e usarmos a variância amostral no cálculo.")

## [1] "Como alpha > pvalor, temos evidências para descartar a igualdade entre a médias dos tempos e afirmar que uma melhora aconteceu após a modificação. As suposições do problemas foi assumir uma distribuição T-Student, por termos uma amostra pequena e usarmos a variância amostral no cálculo."

Trabalho de Estatística - Relatório III

Luis Eduardo

2022-03-28

Lista de Testes de Hipóteses