Relatório 3

Lista de Testes de Hipóteses

1) Trace uma curva normal e sombreie a área desejada obtendo então a informação.

a) Área à direita de $Z = 1$

1-pnorm(q=1, mean = 0, sd=1)

## [1] 0.1586553

pnormGC(1, region="above", mean=0,
        sd=1, graph=TRUE)

## [1] 0.1586553

b) Área à esquerda de $Z = 1$

pnorm(q=1, mean = 0, sd=1)

## [1] 0.8413447

pnormGC(1, region="below", mean=0,
        sd=1, graph=TRUE)

## [1] 0.8413447

c) Área entre $Z = 0$ e $Z = 1.5$

pnorm(q=1.5, mean = 0, sd=1)-0.5

## [1] 0.4331928

pnormGC(c(0,1.5), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.4331928

d) Área entre $Z = −0,56$ e $Z = −0,2$

pnorm(q=-0.2, mean = 0, sd=1)-pnorm(q=-0.56, mean = 0, sd=1)

## [1] 0.1330006

pnormGC(c(-0.56,-0.2), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.1330006

e) Área entre $Z = 0, 5$ e $Z = 0, 5$

pnorm(q=-0.5, mean = 0, sd=1)-pnorm(q=-0.5, mean = 0, sd=1)

## [1] 0

pnormGC(c(-0.5,-0.5), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0

f) Área entre $Z = 0$ e $Z = −2, 5$

pnorm(q=0, mean = -2.5, sd=1)-pnorm(q=-2.5, mean = 0, sd=1)

## [1] 0.9875807

pnormGC(c(0,-2.5), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.4937903

2) Usando a tabela da distribuição normal, determine os valores de $Z$ que correspondem às seguintes áreas:

a) Área de 0,0505 à esquerda de Z.

qnorm(0.0505, mean = 0, sd=1, lower.tail = TRUE)

## [1] -1.640025

pnormGC(qnorm(0.0505, mean = 0, sd=1), region="below", mean=0,
        sd=1, graph=TRUE)

## [1] 0.0505

b) Área de 0,0228 à direita de Z

qnorm(0.0228, mean = 0, sd=1, lower.tail = FALSE)

## [1] 1.999077

pnormGC(qnorm(0.0228, mean = 0, sd=1 , lower.tail = FALSE), region="above", mean=0, sd=1, graph=TRUE)

## [1] 0.0228

c) Área de 0,0228 à esquerda de Z

qnorm(0.0228, mean = 0, sd=1, lower.tail = TRUE)

## [1] -1.999077

pnormGC(qnorm(0.0228, mean = 0, sd=1), region="below", mean=0,
        sd=1, graph=TRUE)

## [1] 0.0228

d) 0,4772 entre 0 e z

qnorm(0.9772)

## [1] 1.999077

3) Consultando a tabela, determine a probabilidade de certo valor padronizado de Z estar entre $Z_0 = −1, 20$ e $Z_1 = 2, 00.$ Desenhe o gráfico.

pnorm(-1,2) - pnorm(2)

## [1] -0.9759

#Gráfico:
pnormGC(c(-1,2), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.8185946

4) Dado uma variável X com distribuição normal de média 25 e desvio-padrão 2, determine os valores de Z para os seguintes valores (x) :

Sabemos que $Z=\frac{X-\mu}{\sigma},$ logo:

a) 23

(Z=(23-25)/2)

## [1] -1

b) 23,5

mu= 25
sd=2

z <- (23.5-mu)/sd
z

## [1] -0.75

c) 24

mu= 25
sd=2

z <- (24-mu)/sd
z

## [1] -0.5

d) 25,2

mu= 25
sd=2

z <- (25.2-mu)/sd
z

## [1] 0.1

e) 25,5

mu= 25
sd=2

z <- (25.5-mu)/sd
z

## [1] 0.25

5) Determine a probabilidade de certo valor padronizado de Z estar entre $Z_0 = −1, 30$ e $Z_1 = 1.5.$ Desenhe o gráfico.

pnorm(1.5)-pnorm(-1.3)

## [1] 0.8363923

#Gráfico:
pnormGC(c(-1.30,1.5), region="between", mean=0,
        sd=1, graph=TRUE)

## [1] 0.8363923

6) Uma população normal tem média 40 e desvio-padrão 3. Determine os valores da população correspondentes aos seguintes de Z:

Sabemos que $Z=\frac{X-\mu}{\sigma},$ logo, dado Z, temos que $X=Z\sigma+\mu,$ assim:

a) 0,10

mu <- 40
sd <- 3

(X=(0.1*3)+40)

## [1] 40.3

b) 2,00

mu <- 40
sd <- 3

(X=(2*3)+40)

## [1] 46

c) 0,75

mu <- 40
sd <- 3

(X=(0.75*3)+40)

## [1] 42.25

d) -3,00

mu <- 40
sd <- 3

(X=(-3*3)+40)

## [1] 31

e) -2,53

mu <- 40
sd <- 3

(X=(2.53*3)+40)

## [1] 47.59

7) Explique com suas palavras, exemplificando, o significado de:

a) Teste de hipótese:

Corresponde a um tipo de processo estatístico que possibilita a escolha de uma das hipóteses extraída de uma amostra aleatória e que com base nos dados obtidos inicialmente é possível comprovar tal afirmação sobre um parâmetro questionado.

b) Hipótese nula e alternativa:

A hipótese nula se baseia na tentativa de provar que algo é verdadeiro ou falso, baseado em afirmações e análises prévias. Já a hipótese alternativa corresponde a uma hipótese que é menor, maior ou diferente do valor hipoteticaente levantado ou nula.

c) Erros do tipo I e II:

O erro do tipo I é a probabilidade de rejeitar H0 e H0 ser verdadeiro, seriam os falsos positivos. Já o erro do tipo II é não rejeitar a hipótese (HO) nula e ela ser falsa, ou seja, seriam os falsos negativos.

d) Nível de significância:

É um limite que determina se o estudo estatístico é significativo ou não.

8) Enuncie a hipótese nula e a hipótese alternativa em cada um dos casos a seguir.

a) A produção média de certo cereal é de 40 toneladas por hectare. Acredita-se que um novo tipo de adubo aumenta a produção média por hectare.

$H_{0}:\mu=40$ toneladas por hectare

$H_{1}:\mu>40$ toneladas por hectare

#H0:mu=40
#H1:mu>40

b) Um sindicato de empregados de certa categoria deseja verificar se a taxa de desemprego em certo município é maior que a taxa de 12% observada seis meses antes.

#H0:mu=12%
#H1:mu>12%

9) O fabricante de certa marca de suco informa que as embalagens de seu produto têm em média 500 ml, com desvio padrão igual a 10 ml. Tendo sido encontradas no mercado algumas embalagens com menos de 500 ml, suspeita-se que a informação do fabricante seja falsa. Para verificar se isto ocorre, um fiscal analisa uma amostra de 200 embalagens escolhidas aleatoriamente no mercado e constata que as mesmas contêm em média 498 ml. Considerando-se um nível de significância de $5\%$, pode-se afirmar que o fabricante está mentindo? Calcule o valor da prova para esta amostra.

mu <- 500
sigma <- 10
n <- 200
xbarra <- 498
alpha <- 0.05
#H0: mu=500
#H1: mu<500 (Unilateral a esquerda)
#Estatística do Teste
Zcal <- (xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] -2.828427

pnormGC(Zcal, region="below", mean=0,
        sd=1, graph=TRUE)

## [1] 0.002338867

Ztab <- qnorm(alpha)
Ztab

## [1] -1.644854

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.05 de significância"

#Logo, o fabricante está mentindo!
(pvalor <- pnorm(Zcal))

## [1] 0.002338867

10) A duração das lâmpadas produzidas por certo fabricante tem distribuição normal com média igual a 1200 horas e desvio padrão igual a 300 horas. O fabricante introduz um novo processo na produção das lâmpadas. Para verificar se o novo processo produz lâmpadas de maior duração, o fabricante observa 100 lâmpadas produzidas pelo novo processo e constata que as mesmas duram em média 1265 horas. Admitindo-se um nível de significância de $5\%$, pode-se concluir que o novo processo produz lâmpadas com maior duração?

n <- 100
xbarra <- 1265
mu <- 1200
sigma <- 300
alpha <- 0.05
#H0:mu = 1200h
#H1:mu > 1200h (Teste-z unilateral)
#Estatística do Teste
Zcal <- (xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] 2.166667

pnormGC(Zcal, region="above", mean=0,
        sd=1, graph=TRUE)

## [1] 0.01513014

Ztab <- qnorm(alpha, mean = 0, sd=1, lower.tail = FALSE)
Ztab

## [1] 1.644854

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.05 de significância"

#Logo, o fabricante está mentindo!
(pvalor <- pnorm(Zcal, lower.tail = FALSE))

## [1] 0.01513014

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoZ

## [1] "Como p-valor< 0.05  Rejeita-se H0"

11) O custo de produção de certo artigo numa localidade tem distribuição normal com média igual a $R\$~42, 00.$ Desenvolve-se uma política de redução de custos na empresa para melhorar a competitividade do referido produto no mercado. Observando-se os custos de 10 unidades deste produto, obtiveram-se os seguintes valores: 34, 41, 36, 41, 29, 32, 38, 35, 33 e 30. Admitindo-se um nível de significância de $5\%$, pode-se afirmar que o custo do produto considerado diminuiu?

mu <- 42
n <- 10
x <- c(34, 41, 36, 41, 29, 32, 38, 35, 33, 30)
xbarra <- mean(x)
s <- sd(x)
alpha <- 0.05
#H0: mu = 42 
#H1: mu < 42 (Teste-t unilateral)
gl <- n-1
#Estatística do Teste
Tcal <- (xbarra-mu)/(s/sqrt(n))
Tcal

## [1] -5.377348

Ttab <- qt(alpha, df=gl, lower.tail = TRUE,)
Ttab

## [1] -1.833113

ConclusaoT <- ifelse(abs(Tcal)>abs(Ttab),paste(
"Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Tcal|<|Ttab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoT

## [1] "Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de 0.05 de significância"

#Logo, o fabricante está mentindo!
(pvalor <- pt(Tcal, df = gl, lower.tail = TRUE))

## [1] 0.0002230215

ConclusaoT <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoT

## [1] "Como p-valor< 0.05  Rejeita-se H0"

12) O controle de qualidade das peças produzidas por certa fábrica exige que o diâmetro médio das mesmas seja 57 mm. Para verificar se o processo de produção está sob controle, observam-se os diâmetros de 10 peças, constatando-se os seguintes valores em mm: $56,5; 56,6; 57,3; 56,9; 57,1; 56,7; 57,1; 56,8; 57,1; 57,0.$ Admitindo-se um nível de significância de $5\%$, pode-se concluir que o processo de produção está sob controle?

mu <- 57
#sd=?
n <- 10
alpha=0.025
alpha1=0.05
x <- mean(56.5, 56.6, 57.3, 56.9, 57.1, 56.7, 57.1, 56.8, 57.1, 57)
xbarra <- mean(x)

dp <- sd(c(56.5, 56.6, 57.3, 56.9, 57.1, 56.7, 57.1, 56.8, 57.1, 57))
dp

## [1] 0.2558211

#H0: mu = 57mm 
#H1: mu diferente de 57mm (Teste-t unilateral)

#Estatística do Teste
Tcal <- (xbarra-mu)/(s/sqrt(n))
Tcal

## [1] -0.3786865

Ttab <- qt(alpha, n-1, lower.tail = TRUE,)
Ttab

## [1] -2.262157

ConclusaoT <- ifelse(abs(Tcal)>abs(Ttab),paste(
"Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Tcal|<|Ttab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoT

## [1] "Como |Tcal|<|Ttab| Não Rejeita-se H0 ao nível de 0.025 de significância"

(pvalor <- pt(Tcal, df = gl, lower.tail = TRUE))

## [1] 0.3568497

ConclusaoT <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoT

## [1] "Como p-valor> 0.025  Não Rejeita-se H0"

15) Suponha que o tempo necessário para que estudantes completem uma prova tenha distribuição normal com média 90 minutos e desvio padrão 15 minutos.

a) Qual é a probabilidade do estudante terminar a prova em menos de 80 minutos?

(pMenor80 <- pnorm(80, mean = 90, sd = 15, lower.tail = TRUE))

## [1] 0.2524925

b) Em mais de 120 minutos?

(pMaior120 <- pnorm(120, mean = 90, sd = 15, lower.tail = FALSE))

## [1] 0.02275013

c) Entre 75 e 85 minutos?

mu <- 90
sd <- 15

z <-(75-mu)/sd
z

## [1] -1

y <- (85-mu)/sd

pnorm(y)-pnorm(z)

## [1] 0.2107861

d) Qual é o tempo necessário para que 98% dos estudantes terminem a prova?

qnorm(0.98, mean = 90, sd = 15)

## [1] 120.8062

16) Uma v.a. X tem distribuição normal, com média 100 e desvio padrão 10.

a) Qual a $P(90 < X < 110)?$

pnorm(110, mean = 100, sd = 10)-pnorm(90, mean = 100, sd = 10)

## [1] 0.6826895

b) Se $\bar{X}$ for a média de uma amostra de 16 elementos retirados dessa população, calcule $P(90 < \bar{X} < 110).$

sigma <- 10/sqrt(n)

pnorm(110, mean = 100, sd = sigma)-pnorm(90, mean = 100, sd = sigma)

## [1] 0.9984346

c) Represente, num único gráfico, as distribuições de $X$ e $\bar{X}$.

n <- 16
x <- seq(-50, 150, length=1000)
mu <- 100
sigma <- 10/sqrt(n)
z <- dnorm(x, mean = 100, sd = 10)
colors <- "blue"
plot(x, z, type="l", lty=2, xlab="x", ylim = c(0,0.2),
    ylab="Densidade", main="Comparação de distribuições normais")
lines(x, dnorm(x,mu,sigma), lwd=2, col=colors)

d) Que tamanho deveria ter a amostra para que $P(90 < \bar{X}< 110) = 0, 95?$

$P(P(90 < \bar{X}< 110) = P\Big(\frac{90-\mu}{\frac{\sigma}{\sqrt{n}}}< \frac{\bar{X}-\mu}{\frac{\sigma}{\sqrt{n}}}< \frac{110-\mu}{\frac{\sigma}{\sqrt{n}}}\Big )=P(-\sqrt{n}<Z<\sqrt{n})=0.95\Rightarrow \sqrt{n}=1.96;$

Para que $P(90 < \bar{X}< 110) = 0, 95?$ devemos ter $n\approx$ 3.8416

17) Nas situações abaixo, escolha como hipótese nula, H0, aquela que para você leva a um erro tipo I mais importante. Descreva quais os dois erros em cada caso.

a) O trabalho de um operador de radar é detectar aeronaves inimigas. Quando surge alguma coisa estranha na tela, ele deve decidir entre as hipotéses:

está começando um ataque;
tudo bem, apenas uma leve interferência.

Deve-se considerar H0=1 porque o ataque está começando o ataque e H1=2 que significa apenas uma interferência. No exemplo de erro do tipo 1 o radar constata que está tudo bem, mas na verdade é um engano e está iniciando um ataque. O erro do tipo 2 se baseia seria que um ataque é confirmado mas na verdade não está e foi apenas um erro causado pela interferência.

b) Num júri, um indivíduo está sendo julgado por um crime. As hipóteses sujeitas ao júri são:

o acusado é inocente;
o acusado é culpado.

H0=o acusado é inocente e H1= o acusado é culpado. No exemplo de erro do tipo 1 é considerado o mais importante, sendo o júri considerar o acusado inocente quando, na verdade, ele é culpado. O erro do tipo 2 seria considerar que o acusado é culpado mas na verdade ele é inocente.

c) Um pesquisador acredita que descobriu uma vacina contra resfriado. Ele irá conduzir uma pesquisa de laboratório para verificar a veracidade da afirmação. De acordo com o resultado, ele lançará ou não a vacina no mercado. As hipóteses que pode testar são:

a vacina é eficaz;
a vacina não é eficaz.

Para que ocorra o erro do tipo 1, H0=2 a vacina não é eficaz e H1=1 a vacina é eficaz. O erro do tipo 1 seria considerar que a vacina é eficaz quando, na verdade, não possui eficácia. O erro do tipo 2 é considerar que a vacina não é eficaz mas a verdade é que ela tem eficácia.

18) Uma fábrica de automóveis anuncia que seus carros consomem, em média, 11 litros por 100 km, com desvio padrão de 0,8 litros. Uma revista resolve testar essa afirmação e analisa 35 automóveis dessa marca, obtendo 11,3 litros por 100 km como consumo médio (considerar distribução normal). O que a revista pode concluir sobre o anúncio da fábrica, no nível de $10\%$?

mu <- 11 #litros por 100 quilometro
sigma <- 0.8 #litros
n <- 35
xbarra <- 11.3 #litros por 100 quilometro
alpha <- 0.1
#H0:mu=11
#H1:mu!=11 (Teste Z bilateral)

#Estatística do Teste
Zcal <- (xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] 2.21853

Ztab <- qnorm(alpha, mean = 0, sd=1, lower.tail = FALSE)
Ztab

## [1] 1.281552

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.1 de significância"

pnormGC(c(qnorm(0.05), qnorm(0.05, lower.tail = F)), region="between", mean=0, sd=1, graph=TRUE)

## [1] 0.9

#Logo, o fabricante está mentindo!
(pvalor <- 2*pnorm(Zcal, lower.tail = FALSE))

## [1] 0.02651872

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoZ

## [1] "Como p-valor< 0.1  Rejeita-se H0"

19) Duas máquinas, A e B, são usadas para empacotar pó de café. A experiência passada garante que o desvio padrão para ambas é de 10 g. Porém, suspeita-se que elas têm médias diferentes. Para verificar, sortearam-se duas amostras: uma com 25 pacotes da máquina A e outra com 16 pacotes da máquina B. As médias foram, respectivamente, $\bar{X}_{A} = 502, 74g$ e $\bar{X}_{B} = 496, 60g.$ Com esses números, e com o nível de $5\%$, qual seria a conclusão do teste $H_{0} : \mu_A = \mu_B?$

sigma <- 10
nA <- 25
nB <- 16
xAbarra <- 502.74
xBbarra <- 496.6
alpha <- 0.05
#H0:muA=MuB
#H1:muA!=muB (Teste-z bilateral)

#Estatística do Teste
Zcal <- (xAbarra-xBbarra)/(sqrt((sigma^2)*((1/nA)+(1/nB))))
Zcal

## [1] 1.917814

Ztab <- qnorm((alpha)/2, mean = 0, sd=1, lower.tail = FALSE)
Ztab

## [1] 1.959964

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste(
"Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
), paste(
"Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de"
, alpha ,
"de significância"
))
ConclusaoZ

## [1] "Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de 0.05 de significância"

pnormGC(c(qnorm((alpha)/2), qnorm((alpha)/2, lower.tail = F)), region="between", mean=0, sd=1, graph=TRUE)

## [1] 0.95

#Logo, o fabricante está mentindo!
(pvalor <- 2*pnorm(Zcal, lower.tail = FALSE))

## [1] 0.05513463

ConclusaoZ <- ifelse(pvalor>alpha,paste(
"Como p-valor>", alpha, " Não Rejeita-se H0"
), paste(
"Como p-valor<", alpha, " Rejeita-se H0")
)
ConclusaoZ

## [1] "Como p-valor> 0.05  Não Rejeita-se H0"

20) Uma fábrica de embalagens para produtos químicos está estudando dois processos para combater a corrosão de suas latas especiais. Para verificar o efeito dos tratamentos, foram usadas amostras cujos resultados estão no quadro abaixo (em porcentagem de corrosão eliminada). Qual seria a conclusão sobre os dois tratamentos?

Método	Amostra	Média	Desvio Padrão
A	15	48	10
B	12	52	15

nA <- 15
nB <- 12
xAbarra <- 48
xBbarra <- 52
sA <- 10
sB <- 15
#H0:muA=muB
#H1:muA!=muB (Teste-t bilateral)
#Precisamos proceder antes do teste-T o teste-F.
#H0:SigmaA^2=SigmaB^2
#H1:SigmaA^2<SigmaB^2 (Teste unilateral)

(Fcal <- (sB^2)/(sA^2))

## [1] 2.25

(pvalor <- pf(q=Fcal, df1 = nB-1, df2 = nA-1))

## [1] 0.9224523

#Conclusao: Não rejeita-se H0 para todo alpha < pvalor. Assim, para realizar o teste - t, vamos considerar que as variâncias do método A 
#e método B são iguais (SigmaA^2=SigmaB^2). Dessa forma, procedemos 
# o teste-t para variâncias populacionais iguais.

#H0:muA=muB
#H1:muA!=muB (Teste-t bilateral)

#A <- (sA^2)/nA
#B <- (sB^2)/nB
#
#df <- ((A+B)^2)/(((A^2)/(nA-1))+((B^2)/(nB-1)))
df <- nA+nB-2  
Sc <- sqrt((((sA^2)*(nA-1))+((sB^2)*(nB-1)))/(nA+nB-2))  
#Estatística do Teste
Tcal <- (xAbarra-xBbarra)/(Sc*sqrt((1/nA)+(1/nB)))
Tcal

## [1] -0.8295614

(pvalor <- pt(Tcal, df = gl, lower.tail = TRUE))

## [1] 0.2141203

ConclusaoT <- "Não rejeita-se H0 para alpha menor que pvalor"

21) Para investigar a influência da opção profissional sobre o salário inicial de recém-formados, investigaram-se dois grupos de profissionais: um de liberais em geral e outro de formandos em Administração de Empresas.

Com os resultados abaixo, expressos em salários mínimos, quais seriam suas conclusões?

Liberais	6,6	10,3	10,8	12,9	9,2	12,3	7,0
Administradores	8,1	9,8	8,7	10,0	10,2	8,2	8,7

Li <- c(6.6, 10.3, 10.8, 12.9, 9.2, 12.3, 7.0)
Ad <- c(8.1, 9.8, 8.7, 10.0, 10.2, 8.2, 8.7, 10.1)
sd(Li)

## [1] 2.432909

sd(Ad)

## [1] 0.8876132

nLi <- length(Li)
nAd <- length(Ad)
#Teste-F
#H0:SigmaLi^2=SigmaAd^2
#H1:SigmaLi^2!=SigmaAd^2

var.test(Li, Ad, alternative = "two.sided")

## 
##  F test to compare two variances
## 
## data:  Li and Ad
## F = 7.5128, num df = 6, denom df = 7, p-value = 0.01768
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##   1.467755 42.789180
## sample estimates:
## ratio of variances 
##           7.512844

print("Para alpha > p-value=0.01768 rejeita-se H0, logo, devemos proceder o teste-t para variâncias desiguais.")

## [1] "Para alpha > p-value=0.01768 rejeita-se H0, logo, devemos proceder o teste-t para variâncias desiguais."

#H0:muLi=muAd
#H1:muLi!=muAd

t.test(Li, Ad, alternative = "two.sided", var.equal = FALSE)

## 
##  Welch Two Sample t-test
## 
## data:  Li and Ad
## t = 0.6653, df = 7.393, p-value = 0.5261
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.626575  2.919433
## sample estimates:
## mean of x mean of y 
##  9.871429  9.225000

print("Para alpha menor do que p-value=0.5261, não rejeita-se H0. Ou seja nesse caso, as médias salariais são iguais.")

## [1] "Para alpha menor do que p-value=0.5261, não rejeita-se H0. Ou seja nesse caso, as médias salariais são iguais."

22) Os dados abaixo referem-se a medidas de determinada variável em 19 pessoas antes e depois de uma cirurgia. Verifique se as medidas pré e pós-operatórias apresentam a mesma média. Que suposições você faria para resolver o problema?

Pessoas	Pré	Pós	Pessoas	Pré	Pós
1	50,0	42,0	10	40,0	50,0
2	50,0	42,0	11	50,0	48,0
3	50,0	78,0	12	75,0	52,0
4	87,5	33,0	13	92,5	74,0
5	32,5	96,0	14	38,0	47,5
6	35,0	82,0	15	46,5	49,0
7	40,0	44,0	16	50,0	58,0
8	45,0	31,0	17	30,0	42,0
9	62,5	87,0	18	35,0	60,0
10			19	39,4	28,0

Pre <- c(50.0,50.0,50.0,87.5,32.5,35.0,40.0,45.0,62.5,40.0,50.0,75.0,92.5,38.0,46.5,50.0,30.0,35.0,39.4)
Pos <- c(42.0,42.0,78.0,33.0,96.0,82.0,44.0,31.0,87.0,50.0,48.0,52.0,74.0,47.5,49.0,58.0,42.0,60.0,28.0)
Dif <- Pre-Pos
sd(Dif)

## [1] 26.35174

mean(Dif)

## [1] -4.978947

#H0:muDif=0
#H1:muDif!=0

t.test(Dif, alternative = "two.sided")

## 
##  One Sample t-test
## 
## data:  Dif
## t = -0.82358, df = 18, p-value = 0.421
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -17.680077   7.722183
## sample estimates:
## mean of x 
## -4.978947

print("Não rejeita-se H0 ao nível de 5% de significância, pois pvalor é maior que alpha=0.05")

## [1] "Não rejeita-se H0 ao nível de 5% de significância, pois pvalor é maior que alpha=0.05"

Como a variância da diferença entre os valores Pré e Pós-Operatório do exercício é muito alta, nós não rejeitamos H0, mesmo observando um valor bem diferente de 0. Para corrigir o teste e/ou rejeitarmos H0 com um valor de média tão discrepante de 0, precisamos corrigir a variabilidade da diferente entre o pré e o pós-operatório.

23) Uma empresa deseja estudar o efeito de uma pausa de dez minutos para um cafezinho sobre a produtividade de seus trabalhadores. Para isso, sorteou seis operários, e contou o número de peças produzidas durante uma semana sem intervalo e uma semana com intervalo. Os resultados sugerem se há ou não melhora na produtividade? Caso haja melhora, qual deve ser o acréscimo médio de produção para todos os trabalhadores da fábrica?

Operário	1	2	3	4	5	6
Sem intervalo	23	35	29	33	43	32
Com intervalo	28	38	29	37	42	30

Si <- c(26,35,29,33,43,32)
Ci <- c(28,38,29,37,30)

#H0:musi=muci
#H1:musi!=muci

Dif <- Si-Ci

## Warning in Si - Ci: longer object length is not a multiple of shorter object
## length

sd(Dif)

## [1] 6.377042

mean(Dif)

## [1] 1.333333

t.test(Dif, alternative = "two.sided")

## 
##  One Sample t-test
## 
## data:  Dif
## t = 0.51215, df = 5, p-value = 0.6304
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -5.358962  8.025629
## sample estimates:
## mean of x 
##  1.333333

# Paired t-test
## Si Ci
## data:  Dif
## t = -1.2753, df = 5, p-value = 0.2582
## Interval:
## -4.523395  1.523395
## sample estimates:
#mean of differences
-1.5

## [1] -1.5

#paired t-teste

print("O teste não terá significância, pois pvalor é maior que alpha=0.05, portanto não ocorreu alteração na produtividade.")

## [1] "O teste não terá significância, pois pvalor é maior que alpha=0.05, portanto não ocorreu alteração na produtividade."

24) Num levantamento feito com os operários da indústria mecânica, chegou-se aos seguintes números: salário médio = 3,64 salários mínimos e desvio padrão = 0,85 salário mínimo. Suspeita-se que os salários de subclasse formada pelos torneiros mecânicos são diferentes dos salários do conjunto todo, tanto na média como na variância. Que conclusões você obteria se uma amostra de 25 torneiros apresentasse salário médio igual a 4,22 salários mínimos e desvio padrão igual a 1,25 salário mínimo?

mu <- 3.64
sigma <- 0.85
n <- 25
xbarra <- 4.22
s <- 1.25
#H0:mu=3.64
#H1: mu!=3.64

## Para  variânica
#H0:Sigma^2=0.85
#H1:Sigma^2!=0.85

25) Para verificar o grau de adesão de uma nova cola para vidros, preparam-se dois tipos de montagem: cruzado (A), onde a cola é posta em forma de X, e quadrado (B), onde a cola é posta apenas nas quatro bordas. Os resultados da resistência para as duas amostras de 10 cada estão abaixo. Que tipo de conclusão poderia ser tirada?

Método	A	16	14	19	18	19	20	15	18	17	18
Método	B	13	19	14	17	21	24	10	14	13	15

A <- c(16,14,19,18,19,20,15,18,17,18)
B <- c(13,19,14,17,21,24,10,14,13,15)

Dif <- A-B
sd(Dif)

## [1] 3.747592

mean(Dif)

## [1] 1.4

#H0:muDif=0
#H1:muDif!=0

t.test(Dif, alternative = "two.sided")

## 
##  One Sample t-test
## 
## data:  Dif
## t = 1.1813, df = 9, p-value = 0.2677
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -1.280866  4.080866
## sample estimates:
## mean of x 
##       1.4

#teste F


print("Não rejeita-se H0 ao nível de 0.05 de significância, pois pvalor>alpha. Sem diferença na adesão da cola.")

## [1] "Não rejeita-se H0 ao nível de 0.05 de significância, pois pvalor>alpha. Sem diferença na adesão da cola."

28) Em um estudo para comparar os efeitos de duas dietas, A e B, sobre o crescimento, 6 ratos foram submetidos à dieta A, e 9 ratos à dieta B. Após 5 semanas, os ganhos em peso foram:

Admitindo que temos duas amostras independentes de populações normais, teste a hipótese de que não há diferença entre as duas dietas, contra a alternativa que a dieta A é mais eficaz, usando o teste t de Student, no nível de $\alpha = 0, 01.$

Dieta A	15	18	12	11	14	15
Dieta B	11	11	12	16	12	13	8	10	13

A <- c(15,18,12,11,14,15)
B <- c(11,11,12,16,12,13,8,10,13)
Dif <- A-B

## Warning in A - B: longer object length is not a multiple of shorter object
## length

sd(Dif)

## [1] 4.301163

mean(Dif)

## [1] 2.666667

#H0:muDif=0
#H1:muDif!=0

t.test(Dif, alternative = "two.sided")

## 
##  One Sample t-test
## 
## data:  Dif
## t = 1.86, df = 8, p-value = 0.09994
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -0.6394996  5.9728329
## sample estimates:
## mean of x 
##  2.666667

#teste F

print("Não rejeita-se H0,pois pvalor>alpha=0.01. As duas dietas apresentadas são eficazes.")

## [1] "Não rejeita-se H0,pois pvalor>alpha=0.01. As duas dietas apresentadas são eficazes."

29) Suponha que o tempo necessário para atendimento de clientes em uma central de atendimento telefônico siga uma distribuição normal de média de 8 minutos e desvio padrão de 2 minutos.

Qual é a probabilidade de que um atendimento dure menos de 5 minutos?

mu <- 8
x <- 5
sigma <- 2

pnorm(q=5, mean = mu, sd=sigma)

## [1] 0.0668072

E mais do que 9,5 minutos?

mu <- 8
x <- 9.5
sigma <- 2

pnorm(9.5, mean = mu, sd=sigma, lower.tail = FALSE)

## [1] 0.2266274

E entre 7 e 10 minutos?

mu <- 8
x <- 7
sigma <- 2

a=10

pnorm(10, mean = mu, sd=sigma)-pnorm(7, mean = mu, sd=sigma)

## [1] 0.5328072

7$5\%$ das chamadas telefônicas requerem pelo menos quanto tempo de atendimento?

x <- qnorm(0.75, mean = 8, sd = 2, lower.tail = FALSE)
x

## [1] 6.65102

31) A distribuição dos pesos de coelhos criados numa granja pode muito bem ser representada por uma distribuição Normal, com média 5 kg e desvio padrão 0,9 kg. Um abatedouro comprará 5000 coelhos e pretende classificá-los de acordo com o peso do seguinte modo: 1$5\%$ dos mais leves como pequenos, os $50\%$ seguintes como médios, os $20\%$ seguintes como grandes e os 1$5\%$ mais pesados como extras. Quais os limites de peso para cada classificação?

#pequenos=15%

mu <- 5
sd <- 0.9

x1 <- qnorm(0.15, mu, sd)
x1

## [1] 4.06721

#médios=50%

x2 <- qnorm(0.5, mu, sd)
x2

## [1] 5

#grandes=20%

x3 <- qnorm(0.2, mu, sd)
x3

## [1] 4.242541

#extra=15%

z <- qnorm(0.15, mu, sd)
z

## [1] 4.06721

32) Uma enchedora automática de refrigerantes está regulada para que o volume médio de líquido em cada garrafa seja de $1000cm^{3}$ e desvio padrão de $10m^{3}.$ Admita que o volume siga uma distribuição normal.

Qual é a porcentagem de garrafas em que o volume de líquido é menor que $990cm^{3}?$

mu <- 1000
sigma <- 10*1000000

pnorm(q=990, mean = mu, sd=sigma)

## [1] 0.4999996

Qual é a porcentagem de garrafas em que o volume de líquido não se desvia da média em mais do que dois desvios padrões?

mu <- 1000
sigma <- 10
dp <- 2*(sigma)

x <- (mu-dp)
x

## [1] 980

y <- (mu+dp)
y

## [1] 1020

#fazer a comparação 

x1 <- (z-mu)/sigma
x1

## [1] -99.59328

x2 <- (y-mu)/sigma
x2

## [1] 2

#diferençã entre

pnorm(x2)-pnorm(x1)

## [1] 0.9772499

print("De acordo com o exemplo acima, a porcentagem de garrafa não se desvia em mais do que dois desvios padrões é de 97%.")

## [1] "De acordo com o exemplo acima, a porcentagem de garrafa não se desvia em mais do que dois desvios padrões é de 97%."

33) Uma empresa produz televisores de 2 tipos, tipo A (comum) e tipo B (luxo), e garante a restituição da quantia paga se qualquer televisor apresentar defeito grave no prazo de seis meses. O tempo para ocorrência de algum defeito grave nos televisores tem distribuição normal sendo que, no tipo A, com média de 10 meses e desvio padrão de 2 meses e no tipo B, com média de 11 meses e desvio padrão de 3 meses. Os televisores de tipo A e B são produzidos com lucro de 1200 u.m. e 2100 u.m. respectivamente e, caso haja restituição, com prejuízo de 2500 u.m. e 7000 u.m. Respectivamente.

Calcule as probabilidades de haver restituição nos televisores do tipo A e do tipo B.

#tipo A

mu=10
sigma=2
probA <- pnorm(q=6, mean = mu, sd=sigma)
pnorm(q=6, mean = mu, sd=sigma)

## [1] 0.02275013

#tipo B
mu=11
sigma=3
probB <- pnorm(q=6, mean = mu, sd=sigma)
pnorm(q=6, mean = mu, sd=sigma)

## [1] 0.04779035

Calcule o lucro médio para os televisores do tipo A e para os televisores do tipo B.

#Lucro para televisores do tipo A e restituição com prejuízo

#A-B:

1-probA

## [1] 0.9772499

1200*1-probA - 2500*probA

## [1] 1143.102

#Lucro para televisores do tipo B e restituição com prejuízo

#B-A:

1-probB

## [1] 0.9522096

2100*1-probB - 7000*probB

## [1] 1765.42

Baseando-se nos lucros médios, a empresa deveria incentivar as vendas dos aparelhos do tipo A ou do tipo B?

print("Tipo B, pois o lucro B é maior que o lucro médio de A, quando comparados com o preço da restituição dos televisores do tipo B.")

## [1] "Tipo B, pois o lucro B é maior que o lucro médio de A, quando comparados com o preço da restituição dos televisores do tipo B."

34) Um estudo comparou dois métodos (A e B) para ensinar matemática a alunos do primeiro grau. Após 10 semanas, o desempenho dos alunos foi avaliado em um teste. Teste a hipótese de que o método A resulta num melhor desempenho médio, ao nível $\alpha=5\%$, com base nos resultados da tabela a seguir:

Método	Número de alunos	Média das notas	Desvio padrão das notas
A	10	8.15	1.15
B	8	7.31	1.94

#H0: \sigma_{A}^{2}=\sigma_{B}^{2}
#H1: \sigma_{A}^{2}!=\sigma_{B}^{2}

#método A
S1 <- 1.15
n1 <-10
xbarra1 <- 8.15

#método B
S2 <- 1.94
n2 <- 8
xbarra2 <- 7.31
alpha <- 0.05


#Teste f

#Ho: sigma1^2= sigma2^2
#H1: sigma1^2<sigma2^2
Fcal <- (S2^2)/(S1^2)
Fcal

## [1] 2.845822

Ftab <- qf(alpha, n2-1, n1-1)
Ftab

## [1] 0.2719849

ConclusaoF <- ifelse(Fcal>Ftab,paste("Como Fcal>Ftab Rejeita-se H0 ao nível de", alpha ,"de significância"), paste("Como Fcal<Ftab Não Rejeita-se H0 ao nível de", alpha ,"de significância"))
ConclusaoF

## [1] "Como Fcal>Ftab Rejeita-se H0 ao nível de 0.05 de significância"

#Teste-t
#H0:mu1=mu2
#Hmu1!=mu2
Tcal <- (xbarra1-xbarra2)/sqrt(((S2^2)/n2)+((S1^2)/n1))
Tcal

## [1] 1.082004

A <- (S2^2)/n2
B <- (S1^2)/n1
df <- ((A+B)^2)/(((A^2)/(nA-1))+((B^2)/(nB-1)))
df <- round(df, digits = 0)

Ttab= qt(alpha, df)
Ttab

## [1] -1.720743

ConclusaoT <-  ifelse(abs(Tcal)>abs(Ttab),paste("Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de"
, alpha1 ,"de significância"), paste("Como |Tcal|<|Ttab| Não Rejeita-se H0 ao nível de", alpha1
,"de significância"))
ConclusaoT

## [1] "Como |Tcal|<|Ttab| Não Rejeita-se H0 ao nível de 0.05 de significância"

35) A lei trabalhista estabelece que o pagamento diário mínimo deve ser de 13, 20 U.M. (unidades monetárias). Assuma distribuição normal com desvio padrão igual a 2,0 U.M. Uma amostra aleatória de 40 trabalhadores de uma firma revelou média diária de 12,20 U.M .Esta firma deve ser acusada de estar infringindo a lei? Conclua a $1\%$ de probabilidade.

mu= 13.2
xbarra=12.20
n=40
sigma=2
alpha= 0.01
#teste z(conhece amostra e significancia):

#H0:mu= 13,2 U.M
#Ha:mu < 13,2 salários mínimos

#Valor calculado do teste
Zcal <-(xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] -3.162278

Ztab <- qnorm(0.01)
Ztab

## [1] -2.326348

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste("Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,"de significância"), paste("Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de", alpha
,"de significância"))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.01 de significância"

36) A tabela a seguir mostra a frequência de acidentes automobilísticos por ano, de acordo som a faixa etária (idade) do motorista, para motoristas com idade inferior a 25 anos. Teste a hipótese de que o número de acidentes independe da idade, a $5\%$ de probabilidade. Isto é, teste a hipótese de que o número anual de acidentes se distribui proporcionalmente nas faixas etárias. A tabela abaixo apresenta o percentual de motoristas em cada faixa etária.

% de motoristas	10	20	20	25	25
idade (anos)	15-16	17-18	19-20	21-22	23-24
número de acidentes	8	15	13	11	8

alpha <- 0.05
(TotalAcidentes <- 8+15+13+11+8)

## [1] 55

Obs <- c(8,15,13,11,8)
#H0:O percentual de acidentes independe da idade
#H1:Não H0
XiQuad <- chisq.test(Obs, p = c(0.1,0.2,0.2,0.25,0.25))
XiQuad

## 
##  Chi-squared test for given probabilities
## 
## data:  Obs
## X-squared = 5.9091, df = 4, p-value = 0.206

37) Uma indústria farmacêutica conduziu um estudo para avaliar o tempo médio em dias para recuperação dos efeitos da gripe. O estudo comparou o tempo de indivíduos que tomaram 500 mg diárias de vitamina C, contra indivíduos que não tomaram vitamina C (nenhum suplemento). Com base nos dados a seguir, conclua e interprete a $5\%$ de probabilidade.

	Nenhum suplemento 500mg	Vit. C
Tamanho da amostra	12	12
Tempo médio	7,4	5,8
Variâncias	2,9	2,4

nA <- 12
nB <- 12
xAbarra <- 7.4
xBbarra <- 5.8
sA <- sqrt(2.9)
sB <- sqrt(2.4)

(Fcal <- (sB^2)/(sA^2))

## [1] 0.8275862

(pvalor <- pf(q=Fcal, df1 = nB-1, df2 = nA-1))

## [1] 0.3795903

df <- nA+nB-2

sC <- sqrt((((sA^2)*(nA-1))+((sB^2)*(nB-1)))/(nA+nB-2))  
Tcal <- (xAbarra-xBbarra)/(sC*sqrt((1/nA)+(1/nB)))
Tcal

## [1] 2.407535

#pvalor <- pt(Tcal, df = gl, lower.tail = TRUE)

print("Não rejeita-se H0 quando o alpha é menor que pvalor")

## [1] "Não rejeita-se H0 quando o alpha é menor que pvalor"

38) Um pesquisa de opinião entrevistou 50 pessoas em dois distritos. O objetivo era verificar se a distribuição das opiniões era homogênea nos dois distritos. Com base nos dados da tabela, teste a hipótese de homogeneidade de opiniões usando $\alpha=5\%$.

	Sim	Indeciso	Não	Total
Distrito A	20	9	21	50
Distrito B	26	3	21	50
Total	46	12	42	100

Fobs <- data.frame(Distrito=c("Distrito A", "Distrito B"), Sim=c(20,26),
                   Indeciso=c(9,3), Nao=c(21,21), row.names = TRUE)

#H0: As opiniões são homogêneas
#H1: Não H0

chisq.test(Fobs, correct = TRUE)

## 
##  Pearson's Chi-squared test
## 
## data:  Fobs
## X-squared = 3.7826, df = 2, p-value = 0.1509

#conclusão: não rejeitamos H0 para todo e qualquer valor de alpha menor do que p-valor=0.1509.

39) Uma associação comercial afirma que o número médio de dias de trabalho perdidos anualmente, devido a problemas de saúde, é igual a 60. Uma extensa campanha educacional visando a conscientizar os trabalhadores quanto a importância de uma alimentação balanceada, higiene pessoal, prática de esportes etc, foi conduzida com o intuito de melhorar este quadro. Um ano após esta campanha, um estudo com 30 trabalhadores forneceu média igual a 55 dias. Assuma que o número de dias de trabalho perdidos anualmente é

normalmente distribuído com variância $\sigma^{2}=275$. Pede-se:

Pode-se afirmar que a campanha foi eficaz ao nível de $\alpha= 1\%$ de probabilidade?

#α = 1% de probabilidade

mu=60
sigma= sqrt(275)
sigma

## [1] 16.58312

n=30
xbarra=55
alpha=0.01

#teste z(conhece amostra e significancia)

#H0:mu= 60 dias
#Ha:mu < 60 dias

Zcal <-(xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] -1.651446

Ztab <- qnorm(0.01)
Ztab

## [1] -2.326348

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste("Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,"de significância"), paste("Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de", alpha
,"de significância"))
ConclusaoZ

## [1] "Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de 0.01 de significância"

Para qual nível de significância se pode afirmar que a campanha educacional foi eficaz?

# Com o alpha a 0.05

print("Para valores abaixo de 46% de significância a campanha foi eficaz.")

## [1] "Para valores abaixo de 46% de significância a campanha foi eficaz."

40) Um gerente comercial acredita que um número excessivo de horas estejam sendo desperdiçadas em contatos comerciais, via telefone, entre os seus vendedores e os clientes em potencial. Ele deseja no máximo quinze horas por semana por vendedor. Este gerente comercial contratou uma empresa especializada para treinar seus vendedores. Após este treinamento, uma amostra de 36 vendedores revelou média igual a 17h por semana por vendedor. O que pode ser concluído quanto a eficácia do treinamento? Assuma $\sigma^{2}=9$ e utilize $\alpha=5\%$.

mu= 15
sigma= sqrt(9)
sigma

## [1] 3

n=36
xbarra= 17
alpha=0.05
#teste z(conhece amostra e significancia)
#H0:mu = 15 horas
#Ha:mu > 15 horas
#Valor calculado do teste
Zcal <-(xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] 4

Ztab <- qnorm(0.05)
Ztab

## [1] -1.644854

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste("Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,"de significância"), paste("Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de", alpha
,"de significância"))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.05 de significância"

41) Com base em dados obtidos de 400 mulheres, apresentados na tabela abaixo, pode-se concluir que o nível educacional e a adaptação à vida conjugal são independentes? Conclua a $5\%$ de probabilidade.

Nível educacional	ruim	razoável	boa	muito boa
Universidade	18	29	70	115
2º grau	17	28	30	41
3º grau	11	10	11	20

F0 <- data.frame(Nivel= c("1º grau", "2º grau", "3º grau"),
                 ruim= c(18,17,11), razoavel= c(29,28,10),
                 boa= c(70,30,11), 
                 mb= c(115,41,20), 
                 row.names = TRUE)
F0

##         ruim razoavel boa  mb
## 1º grau   18       29  70 115
## 2º grau   17       28  30  41
## 3º grau   11       10  11  20

alpha <- 0.05
Xiquad <- chisq.test(F0, correct= FALSE)
Xiquad$expected

##          ruim razoavel   boa     mb
## 1º grau 26.68    38.86 64.38 102.08
## 2º grau 13.34    19.43 32.19  51.04
## 3º grau  5.98     8.71 14.43  22.88

Fe <- data.frame(Xiquad$expected)
Fe

##          ruim razoavel   boa     mb
## 1º grau 26.68    38.86 64.38 102.08
## 2º grau 13.34    19.43 32.19  51.04
## 3º grau  5.98     8.71 14.43  22.88

Xiquad

## 
##  Pearson's Chi-squared test
## 
## data:  F0
## X-squared = 19.943, df = 6, p-value = 0.002835

#conclusão: Rejeitamos H0 para todo e qualquer valor de alpha maior do que p-valor=0.002212

42) Uma cooperativa de produtores possui uma máquina de encher vasilhame com um litro de leite. Para assegurar que em média cada vasilhame não terá leite a mais e nem a menos, o responsável pelo controle de qualidade amostra, semanalmente, 75 vasilhames enchidos pela máquina. Se uma amostra fornecer 63, 97 litros e desvio padrão $s = 0, 25$ litros, deve-se parar a máquina para regulagem ou continuar a produção? Qual deve ser o procedimento adotado a $\alpha=5\%$ de probabilidade?

n = 75
mu= 1
sigma = 0.25
alpha = 0.05
xbarra= 63.97/75
xbarra

## [1] 0.8529333

#teste z porqur se conhece amostra e significancia
#H0:mu= 1 Litro
#Ha:mu!1 Litro

Zcal <-(xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] -5.094539

Ztab <- qnorm(0.05)
Ztab

## [1] -1.644854

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste("Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,"de significância"), paste("Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de", alpha
,"de significância"))
ConclusaoZ

## [1] "Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de 0.05 de significância"

43) A renda média de famílias com 4 pessoas na região sudeste do Brasil, no ano de 1975, era de 5 U.M. Economistas acreditam que atualmente a renda média é maior. Pede-se,

Quais seriam as hipóteses estatísticas (H0 e Ha), para se tentar provar que atualmente a renda média é maior do que em 1975?

#H0 = 5 U.M H1 > 5 U.M

Quais são as informações necessárias para se realizar um teste Z?

#Para se realizar um teste z a variância da população deve ser conhecida, o tamanho da amostra, média da amostra e desvio padrão (que é o sigma).

Quais são as informações necessárias para se realizar um teste t?

#Para se realizar um teste t, não precisa ter o desvio padrão amostral conhecido, mas precisa se dos valores da amostra ou a média amostral.

Explique os dois possíveis erros (erro tipo I e erro tipo II) de decisão que podem ocorrer neste exemplo?

#O erro tipo I que pode ocorrer é considerar que a renda é maior que 5 U.M quando deveria considerar que é igual a 5 U.M
#O erro tipo II seria considerar que o a renda é igual a 5 U.M sendo que na verdade ela é maior que 5 U.M

44) Assuma que o consumo mensal per capita de determinado produto tem distribuição normal com desvio padrão igual a 5 kg. Com a atual crise (do dólar, do apagão, do futebol…várias opções!) o departamento de vendas da fábrica decidiu que irá retirar o produto do mercado, caso o consumo médio $(\mu)$ per capita seja inferior a 10kg. Se uma pesquisa de mercado, com uma amostra de 100 indivíduos, revelar consumo médio mensal per capita de 9 kg, pede-se: Qual deve ser a afirmação, ao nível de significância de $1, 5\%?$

mu= 10
sigma=5
n=100
xbarra=9
alpha= 0.015

#teste z(conhece amostra e significancia)
#H0:mu = 10 kg
#Ha:mu < 10 kg

Zcal <-(xbarra-mu)/(sigma/sqrt(n))
Zcal

## [1] -2

Ztab <- qnorm(0.015)
Ztab

## [1] -2.17009

ConclusaoZ <- ifelse(abs(Zcal)>abs(Ztab),paste("Como |Zcal|>|Ztab| Rejeita-se H0 ao nível de"
, alpha ,"de significância"), paste("Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de", alpha
,"de significância"))
ConclusaoZ

## [1] "Como |Zcal|<|Ztab| Não Rejeita-se H0 ao nível de 0.015 de significância"

45) No quadro abaixo estão as opiniões, com respeito ao desempenho e a potência do motor, de proprietários de veículos de um determinado fabricante. As opiniões foram classificadas pela idade do proprietário.

Idade	Ruim	Bom
Jovem	30	20
Experiente	20	30

O que pode ser afirmado quanto à seguinte hipótese de nulidade? H0 : Idade e opinião são independentes.

F0 <- data.frame(Idade= c("Jovem", "Experiente"), Ruim=c(30,20), Bom=c(20,30), row.names = TRUE)
F0

##            Ruim Bom
## Jovem        30  20
## Experiente   20  30

Xiquad <- chisq.test(F0, correct= FALSE)
Xiquad$expected

##            Ruim Bom
## Jovem        25  25
## Experiente   25  25

Xiquad

## 
##  Pearson's Chi-squared test
## 
## data:  F0
## X-squared = 4, df = 1, p-value = 0.0455

#Ho: idade e opinião são independentes
#H1: idade e opinião são dependentes
#conclusão: Rejeitamos H0 para todo e qualquer valor de alpha maior do que p-valor=0.0455.

print("Rejeita H0 porque alpha é maior que pvalor.")

## [1] "Rejeita H0 porque alpha é maior que pvalor."

46) Para comparar duas marcas de pará-choques, montaram-se seis de cada marca em 12 carros compactos, fazendo-se cada carro colidir com um muro de concreto, a uma velocidade de 40 km Registraram-se os seguintes custos de reparo:

Pára-choque	Custo (R$)	Média	Variância
A	320 310 380 360 320 345	339,17	744,17
B	305 290 340 315 280 305	305,80	434,17

Teste ($\alpha=5\%$) a hipótese de igualdade entre os custos médios de reparo dos pará-choques.

pcA <- c(320,310,380,360,320,345)
pcB <- c(305,290,340,315,280,305)
sd(pcA)

## [1] 27.27942

sd(pcB)

## [1] 20.83667

nA <- length(pcA)
nB <- length(pcB)

#Teste-F
#H0:SigmaA^2=SigmaB^2
#H1:SigmaA^2!=SigmaB^2

var.test(pcA, pcB, alternative = "two.sided")

## 
##  F test to compare two variances
## 
## data:  pcA and pcB
## F = 1.714, num df = 5, denom df = 5, p-value = 0.5687
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##   0.2398433 12.2489808
## sample estimates:
## ratio of variances 
##           1.714012

print("Para alpha > p-valor rejeita-se H0. Para variâncias desiguais usa-se o teste t.")

## [1] "Para alpha > p-valor rejeita-se H0. Para variâncias desiguais usa-se o teste t."

t.test(pcA, pcB, alternative = "two.sided", var.equal = FALSE)

## 
##  Welch Two Sample t-test
## 
## data:  pcA and pcB
## t = 2.3786, df = 9.3527, p-value = 0.04033
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   1.813021 64.853645
## sample estimates:
## mean of x mean of y 
##  339.1667  305.8333

print("Para alpha< p-valor, não rejeita-se H0 porque os custos médios de reparo dos automóveis são desiguais.")

## [1] "Para alpha< p-valor, não rejeita-se H0 porque os custos médios de reparo dos automóveis são desiguais."

47) Se um dado não é viciado cada uma das seis faces ocorre com igual probabilidade. Um determinado dado foi lançado 720 vezes, obtendo-se:

Face	1	2	3	4	5	6	Total
Frequência observada	129	107	98	132	136	118	720

O dado será considerado viciado para qual nível de significância? Explique sua resposta.

#quiquadrado

#H0: dado é honesto
#H1: dado é desonesto

F0 <- c( 129, 107, 98, 132, 136, 118)
fe <- c(120, 120, 120, 120, 120, 120)
Xiquad <- chisq.test(F0)
Xiquad

## 
##  Chi-squared test for given probabilities
## 
## data:  F0
## X-squared = 9.4833, df = 5, p-value = 0.09127

print("Para rejeitarmos H0,ou seja, deve-se considerar que o dado é desonesto. Sendo assim, o valor de significância>pvalor (0.09).")

## [1] "Para rejeitarmos H0,ou seja, deve-se considerar que o dado é desonesto. Sendo assim, o valor de significância>pvalor (0.09)."

48) O tempo médio, por operário, para executar uma tarefa, tem sido 100 minutos. Introduziu-se uma modificação para diminuir esse tempo, e, após certo período, sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução de cada um. O tempo médio da amostra foi 85 minutos, e o desvio padrão foi 12 minutos. Estes resultados trazem evidências estatísticas da melhora desejada, considerando $\alpha=5\%$? Apresente as suposições teóricas usadas para resolver problema.

mu=100
alpha=0.05
n=16
xbarra= 85
dp = 12
#teste T (pois não se sabe o desvio padrão)
#H0:mu = 100
#Ha:mmu < 100
Tcal <- ((xbarra-mu)/(dp/sqrt(n)))
Tcal

## [1] -5

Ttab <- qt(0.05, n-1)
Ttab

## [1] -1.75305

ConclusaoT <- ifelse(abs(Tcal)>abs(Ttab),paste("Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de"
, alpha ,"de significância"), paste("Como |Tcal|<|Ttab| Não Rejeita-se H0 ao nível de", alpha
,"de significância"))
ConclusaoT

## [1] "Como |Tcal|>|Ttab| Rejeita-se H0 ao nível de 0.05 de significância"