Trabalho de Estatística II - Teste de Hipótese
Trabalho de Estatística II - Teste de Hipótese
- Teste de hipóteses
- Formulação da Hipótese Nula (\(H_{0}\)) e da Hipótese Alternativa (\(H_{a}\))
- Tipos de Erro e Nível de Significância
- Roteiro (Teste para proporção):
- Questões (Teste para Proporção)
- Roteiro (Teste para média):
- Questões (Teste para Média)
- Roteiro (Teste de para variância)
- Questões (Teste para Variância)
- Anexo:Tabelas de Distribuições
- Bibliografia
## This version of Shiny is designed to work with 'htmlwidgets' >= 1.5.
## Please upgrade via install.packages('htmlwidgets').
Teste de hipóteses
Quando estamos estudando a Inferência estatística uma habilidade que deve ser desemvolvida é a capacidade de testar uma hipótese. Isto é, feita determinada afirmação sobre uma população, usualmente sobre um parâmetro dessa, desejamos saber se os resultados experimentais provenientes de uma amostra fazem sentido, ou seja, se eles contrariam ou não tal afirmação.
Como a decisão para aceitar ou rejeitar a hipótese será tomada de acordo com elementos de uma amostra, fica evidente que a decisão estará sujeita a erros. Estaremos tomando decisões em condições de incerteza e, portanto, sujeitas a erro. Com base nos resultados obtidos em uma amostra, não é possível tomar decisões que sejam definitivamente corretas. Entretanto, como veremos adiante, podemos dimensionar a probabilidade (risco) da decisão de aceitar, ou rejeitar uma hipótese estatística.. O objetivo do teste estatístico de hipóteses é, então, fornecer uma metodologia que nos permita verificar se os dados amostrais trazem evidências que apóiem ou não uma hipótese (estatística) formulada.
Vale Lembrar: Hipótese estatística
Trata-se de uma suposição quanto ao valor de um parâmetro populacional, ou quanto à natureza da distribuição de probabilidade de uma variável populacional.
São exemplos de hipóteses estatísticas:
a altura média da população brasileira é de 1,65m;
a proporção de paulistas com certa doença é de 40%;
homens e mulheres realizam certa tarefa num mesmo intervalo de tempo.
O QUE SÃO TESTES DE HIPÓTESES?
É uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base nos elementos amostrais.
Para testar um parâmetro populacional, devemos afirmar, cuidadosamente, um par de hipóteses: uma que represente a afirmação e outra que represente o seu complemento. Quando uma dessas hipóteses for falsa, a outra deve ser verdadeira. Essas duas hipóteses são chamadas de hipótese nula e hipótese alternativa.
Formulação da Hipótese Nula (\(H_{0}\)) e da Hipótese Alternativa (\(H_{a}\))
A Hipótese Nula (\(H_{0}\)) é uma hipótese estatística que contém uma afirmação deigualdade, tal como ≤ , = ou ≥ . A Hipótese Alternativa (\(H_{a}\)) é, geralmente, o complemento da Hipótese Nula. É a afirmação que deve ser verdadeira se \(H_{0}\) for falsa e contém uma afirmação de desigualdade estrita, tal como <, ≠ ou >. Por exemplo, se o valor da afirmação for k e o parâmetro populacional for µ, as possíveis hipóteses a serem formuladas são:
Dizemos que a situação I corresponde a um teste bilateral ou bicaudal. As situações II, III, IV e V correspondem a testes unilaterais ou unicaudal.
Tipos de Erro e Nível de Significância
Em um teste de hipóteses, sempre partimos do pressuposto que a hipótese nula (\(H_{0}\)) é verdadeira. Daí, podemos tomar uma destas decisões:
Aceitar \(H_{0}\), rejeitando \(H_{a}\) ou
Rejeitar \(H_{0}\), aceitando \(H_{a}\).
Pelo fato da decisão ser baseada em uma amostra ao invés de ser baseada na população, há sempre a possibilidade de tomarmos a decisão errada.
Por exemplo, suponha que você afirme que certa moeda seja tendenciosa.
Para testar sua afirmação, você joga a moeda 100 vezes e obtém 49 caras e 51 coroas.Você provavelmente concordaria que não há evidência para apoiar sua afirmação. Mesmo assim, é possível que a moeda seja tendenciosa e você tenha um resultado incomum.
Mas, e se você joga a moeda 100 vezes e obtém 21 caras e 79 coroas? Seria uma ocorrência rara obter somente 21 caras de 100 jogadas com uma moeda imparcial.Então, você tem provavelmente evidências suficientes para apoiar sua afirmação de que a moeda é tendenciosa.
Entretanto, você não pode ter 100% de certeza. É possível que a moeda seja imparcial e que você tenha obtido um resultado incomum.
Se p representa a proporção de caras, a afirmação “a moeda é tendenciosa” pode ser escrita como a afirmação matemática p ≠ 0,5. O complemento “a moeda é imparcial” é escrita como p = 0,5. Então, nossas hipóteses nula e alternativa são:
(\(H_{0}\)):p = 0,5
(\(H_{a}\)):p ≠ 0,5 (Afirmação)
Erros Tipo I e Tipo II
Há dois possíveis tipos de erros, quando realizamos um teste estatístico para aceitar ou rejeitar \(H_{0}\). Podemos rejeitar a hipótese \(H_{0}\), quando ela é verdadeira, ou aceitar \(H_{0}\), quando ela é falsa.
O erro de rejeitar \(H_{0}\), sendo \(H_{0}\) verdadeira, é denominado Erro tipo I, e a probabilidade de se cometer o Erro tipo I é designada α.
O erro de aceitar \(H_{0}\), sendo \(H_{0}\) falsa, é denominado Erro tipo II, e a probabilidade decometer o Erro tipo II é designada β .
Os possíveis erros e acertos de uma decisão com base em um teste de hipótese estatístico estão sintetizados no quadro a seguir:
Quem toma a decisão, obviamente busca reduzir ao mínimo as probabilidades dos dois tipos de erros. A redução simultânea dos erros poderá ser alcançada pelo aumento do tamanho da amostra, evidentemente, com aumento dos custos. Para um mesmotamanho de amostra, a probabilidade de incorrer em um Erro tipo II aumenta à medida que diminui a probabilidade do Erro tipo I, e vice-versa.
O nível de significância de um teste é definido como sendo a probabilidade máxima permissível para cometer um Erro tipo I. Ou seja, o nível de significância é igual ao valor α.
A probabilidade de um Erro tipo II é o valor β . O valor 1– β é chamado de poder do teste. Ele representa a probabilidade de rejeitar a hipóteses nula quando a hipótese alternativa for verdadeira. O valor do poder é difícil (e às vezes impossível) de se encontrar na maioria dos casos.
Passos para um teste de hipótese
Escreva a hipótese nula \(H_{0}\)) e a hipótese alternativa (\(H_{a}\)). Lembre–se que, para \(H_{0}\) você deve utilizar um destes símbolos: ≤ , = ou ≥ . Para \(H_{a}\), use <, ≠ ou >.
Calcule o valor observado (\(z_{obs}\), \(t_{obs}\),…) utilizando a fórmula correspondente ao caso que está analisando.
Faça um gráfico da distribuição amostral. De acordo com a hipótese alternativa, marque a região crítica (RC) do teste:
Obtenha o valor crítico do teste (\(z_{crit}\), \(z_{crit}\),…) de acordo com o nível descritivo do teste (α) e com a região crítica (RC) utilizando a tabela da distribuição correspondente (Normal, t de Student,…). Marque esse valor no gráfico.
Marque o valor observado (\(z_{obs}\), \(t_{obs}\),…) no gráfico.
Conclua o teste:
– se o valor observado ∈ RC, então rejeite \(H_{0}\) (aceite \(H_{a}\));
– se o valor observado ∉ RC, então aceite \(H_{0}\) (rejeite \(H_{a}\)).
- Interprete, em palavras, a conclusão feita.
Teste para a Proporção Populacional
O teste Z para uma proporção é um teste estatístico para uma proporção populacional p.
Roteiro (Teste para proporção):
Estabelece-se a hipótese nula. \(H_{0}\) : p = \(p_{0}\)
Estabelece-se a hipótese alternativa.
2.1) \(H_{a}\): p ≠ \(p_{0}\) bilateral ou
2.2) \(H_{a}\) : p > \(p_{0}\) unilateral à direita ou
2.3) \(H_{a}\) : p< \(p_{0}\) unilateral à esquerda
Fixar o nível de significância α .
Determinar a região de rejeição.
Calcular a estatística \(z_{obs}\), sendo \[z_{obs}=\frac{\hat{p}-p}{\sqrt{\frac{pq}{n}}}\] onde: \(\hat{p}\) é a proporção amostral; p é a proporção populacional e q = 1-p n é o tamanho da amostra.
Conclusões:
Se |\(z_{obs}\)|>\(z_{\frac{α}{2}}\),rejeita \(H_{0}\), onde \(z_{\frac{α}{2}}\)=\(z_{crit}\)
Se \(z_{obs}\)>\(z_{crit}\),rejeita \(H_{0}\)
Se Se \(z_{obs}\)<-\(z_{crit}\),rejeita \(H_{0}\)
Questões (Teste para Proporção)
-Questão 1:Um fabricante de determinado medicamento alega que o mesmo acusou 90% de eficiência em aliviar a alergia. Em uma amostra de 200 indivíduos que sofriam de alergia, o remédio deu resultado positivo em 160. Teste se a alegação do fabricante é legítima ou não, ao nível de significância de 1%.
Primeiramente necessitamos de construir nossas hipóteses, da afirmação “90% dos equipamentos” temos:
\(H_{0}\): p = 0,90
\(H_{a}\): p < 0,90
Resolvendo:
[1] -4.714045
A partir da tabela da Normal padrão, buscamos o valor crítico correspondente ao nivel de confiança de 99% (dado 1% de significância )
zcrit: 2.33
A partir da hipótese alternativa, percebemos que o nosso teste é unilateral à esquerda (note que por esse motivo zcrit encontrado é negativo pois está a esquerda da media 0)
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq 2.33(zcrit)}\)
Como − 4.71 < − 2.33 (Note que \(z_{obs}\) \(\in\) RC), rejeita-se \(H_{0}\), ou seja, concluímos que a alegação do fabricante não é legítima, ao nível de significância de 1% .
-Questão 2:Um caçador de faisão afirma que ele acerta 80 % dos pássaros em que ele atira. Vocêconcorda com esta afirmação se num dia qualquer ele acerta 9 dos 15 pássaros em que ele atira? Use 5% como nível de significância.
Primeiramente necessitamos de construir nossas hipóteses, da afirmação “acerta 80 % dos pássaros” temos:
\(H_{0}\): p = 0,80
\(H_{a}\): p \(\neq\) 0,80
Resolvendo:
[1] -1.936492
A partir da hipótese alternativa, percebemos que o nosso teste é bilateral(note que por esse motivo usa-se \(z_{\frac{α}{2}}\)=\(z_{crit}\)
A partir da tabela da Normal padrão, buscamos o valor crítico correspondente ao nivel de confiança de 95% (dado 5% de significância )
zcrit: ±1.645
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -1.645 \ ou \ \bar{x}\geq1.645(zcrit)}\)
Como \(z_{obs}\) \(\notin\) RC , não rejeitamos \(H_{0}\) e concluímos que não há razão para duvidar da afirmação do caçador.
-Questão 3: Em 600 lançamentos de um dado obteve-se o ponto “seis” em 123 lançamentos. Ao nível de 5% de significância, há razão para se desconfiar que o dado seja viciado?
Primeiramente necessitamos de construir nossas hipóteses, da afirmação “ser ou não um dado viciado” temos:
\(H_{0}\): p = 1/6 = 0.167
\(H_{a}\): p \(\neq\) 0.167
Resolvendo:
[1] 2.49562
A partir da hipótese alternativa, percebemos que o nosso teste é bilateral(note que por esse motivo usa-se \(z_{\frac{α}{2}}\)=\(z_{crit}\))
A partir da tabela da Normal padrão, buscamos o valor crítico correspondente ao nivel de confiança de 95% (dado 5% de significância )
zcrit: ±1.645
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -1.645 \ ou \ \bar{x}\geq1.645(zcrit)}\)
Como \(z_{obs}\) \(\in\) RC , Rejeita-se \(H_{0}\): p = 0,167, ou seja, para o nível de significância de 5% o dado é viciado.
-Questão 4:Um industrial deseja certificar-se de que a fração do mercado que prefere seu produto ao de seu concorrente é superior a 70%. Para tanto, colheu uma amostra aleatória de 165 opiniões, das quais 122 lhe foram favoráveis. Pode o industrial ficar satisfeito com esse resultado, adotado o nível de 5% de significância?
Primeiramente necessitamos de construir nossas hipóteses, da afirmação “superior a 70%” temos:
\(H_{0}\): p \(\geq\) 0.7
\(H_{a}\): p < 0.7
Resolvendo:
[1] 1.104236
A partir da hipótese alternativa, percebemos que o nosso teste é bilateral(note que por esse motivo usa-se \(z_{\frac{α}{2}}\)=\(z_{crit}\))
A partir da tabela da Normal padrão, buscamos o valor crítico correspondente ao nivel de confiança de 95% (dado 5% de significância )
zcrit: ±1.645
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -1.645 \ ou \ \bar{x}\geq1.645(zcrit)}\)
Como \(z_{obs}\) \(\notin\) RC , Aceita-se \(H_{0}\):p = 0,7, logo o empresário pode ficar satisfeito.
Teste para a Média Populacional
Quando o desvio padrão σ for conhecido, a estatística do teste é:
\[z_{obs}=\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}\]
onde: \(\bar{x}\) é a média amostral; µ é a média populacional testada (sob \(H_{0}\)); σ é o desvio padrão populacional; n é o tamanho da amostra.
Quando o desvio padrão σ for desconhecido, optamos por trabalhar com o desvio padrão amostral s. A estatística do teste se baseará na distribuição t de Student com (n–1) graus de liberdade:
\(t_{obs} = \frac{\overline{X} - \mu}{\frac{s}{\sqrt{n}}}\)
Para grandes amostras (n> 30) pode-se utilizar o desvio padrão da amostra (s). Quando a amostra for pequena (n≤ 30) devemos utilizar a distribuição de t-student.
Roteiro (Teste para média):
Estabelece-se a hipótese nula. \(\mu\) : \(\mu\) = \(\mu_{0}\)
Estabelece-se a hipótese alternativa.
2.1) \(\mu_{a}\): \(\mu\) ≠ \(\mu_{0}\) bilateral ou
2.2) \(\mu_{a}\) : \(\mu\) > \(\mu_{0}\) unilateral à direita ou
2.3) \(\mu_{a}\) : \(\mu\) < \(\mu_{0}\) unilateral à esquerda
Fixar o nível de significância α .
Determinar a região de rejeição.
Calcular a estatística \(z_{obs}\), sendo \[z_{obs}=\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}\] ou \(t_{obs} = \frac{\overline{X} - \mu}{\frac{s}{\sqrt{n}}}\)
Conclusões:
Se |\(z_{obs}\)|>\(z_{\frac{α}{2}}\),rejeita \(H_{0}\), onde \(z_{\frac{α}{2}}\)=\(z_{crit}\)
Se \(z_{obs}\)>\(z_{crit}\),rejeita \(H_{0}\)
Se Se \(z_{obs}\)<-\(z_{crit}\),rejeita \(H_{0}\)
Questões (Teste para Média)
-Questão 1:: funcionários de uma grande firma de contabilidade afirmam que a média dos salários dos contadores é menor que a de seu concorrente, que é $ 45000. Uma amostra aleatória de 30 contadores da firma mostrou que a média dos salários é de $43500. Sabe–se, de estudos anteriores, que o desvio padrão dos salários é $5200. Teste a afirmação dos funcionários ao nível de 5% de significância.
Resolvendo:
\(H_{0}\) : µ ≥ 45000
\(H_{a}\) : µ < 45000 (afirmação).
[1] -1.579969
A partir da tabela da Normal padrão, buscamos o valor crítico correspondente ao nivel de confiança de 95% (dado 5% de significância )
zcrit:1.645
A partir da hipótese alternativa, percebemos que o nosso teste é unilateral à esquerda (note que por esse motivo zcrit encontrado é negativo pois está a esquerda da media 0)
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -1.645(zcrit)}\)
Note que \(z_{obs}\) ∉ RC. Logo, aceitamos H0, ou seja, ao nível de significância de 5%, não há evidências de que o salário seja inferior a $45000.
-Questão 2:Uma fábrica de baterias alega que as mesmas têm vida média de 50 meses. Sabe-se que o desvio padrão correspondente é de 4 meses. Se uma amostra de 36 baterias, obtida dessa população, tem vida média de 48 meses, podemos afirmar que a média dessa população é diferente de 50 meses, ao nível de significância de 5% ? Resolvendo:
\(H_{0}\) : µ = 50
\(H_{a}\) : µ \(\neq\) 50
[1] -3
A partir da tabela da Normal padrão, buscamos o valor crítico correspondente ao nivel de confiança de 95% (dado 5% de significância )
zcrit:1.645
A partir da hipótese alternativa, percebemos que o nosso teste é bilateral.
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -1.645(zcrit)}\)
Note que \(z_{obs}\) \(\in\) RC. Logo, rejeita-se \(H_{0}\), ou seja, o resultado amostral afirma que a média é diferente de 50 meses, ao nível de 95% de confiança.
-Questão 3::Uma amostra de 20 elementos de uma variável x normalmente distribuída deu x = 53,4 e s =7,5. Testar a hipótese de que µ = 50, no nível de significância 0,05.
Resolvendo:
\(H_{0}\) : µ = 50
\(H_{a}\) : µ \(\neq\) 50
como se trata de uma amostragem pequena (n=20<30), utilizaremos a estatística para t-student
[1] "Grau de liberdade,"
[1] 19
[1] 2.027368
A partir da tabela t-student com os parâmetros 19 e 0,025 referente ao nivel de confiança de 95% (dado 5% de significância )
tcrit:±2,093.
A partir da hipótese alternativa, percebemos que o nosso teste é bilateral
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -2,093 \ ou \ \bar{x}\geq2,093(tcrit)}\)
Como \(z_{obs}\) \(\notin\) RC , Aceita-se \(H_{0}\).
-Questão 4:Um fabricante de material desportivo desenvolve uma nova linha de pesca sintética sobre a qual ele afirma que tem resistência média à ruptura de 8 kg com desvio padrão de 0,5 kg. Teste a hipótese de que µ = 8 kg, contra a hipótese de que µ ≠ 8 kg, se uma amostra de 50 linhas foi testada e apresentou uma média de resistência a ruptura de 7,8 kg. Use um nível de 0,01 designificância.
Resolvendo:
\(H_{0}\) : µ = 8
\(H_{a}\) : µ \(\neq\) 8
como se trata de uma amostragem grande (n=50>30), utilizaremos a estatística para normal padrão
[1] -2.828427
A partir da tabela da Normal padrão, buscamos o valor crítico correspondente ao nivel de confiança de 99% (dado 1% de significância )
zcrit:±2,33
A partir da hipótese alternativa, percebemos que o nosso teste é unilateral à esquerda (note que por esse motivo zcrit encontrado é negativo pois está a esquerda da media 0)
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -2,093 \ ou \ \bar{x}\geq2,093(tcrit)}\)
Como \(z_{obs}\) \(\in\) RC , rejeitamos \(H_{0}\) e concluímos que a resistência média à ruptura é diferente de 8 kg (é menor que 8 kg).
-Questão 5:) Uma máquina para colocar vacinas nos frascos enche-os com uma distribuição X tal que X~N(500ml,\(\sigma^2\)). Cada dia toma-se uma amostra de 16 frascos para avaliar se a máquina está regulada. Em um dia obteve-se a amostra:
DADOS:
509,42 - 476,79 - 507,27 - 458,10 - 473,30 - 501,41 - 515,07 - 518,07 - 463,76 - 493,95 - 521,62 - 503,41 - 480,71 - 495,32 - 481,55 - 472,32
Observe que a média amostral é 492ml. Fazer um teste de hipóteses para testar se a média difere ou não de 500ml, com α=0,01.
Resolvendo:
\(H_{0}\) : µ = 500
\(H_{a}\) : µ \(\neq\) 500
como se trata de uma amostragem grande (n=16<30), utilizaremos a estatística para t-student
x<-c(509.42,476.79, 507.27, 458.10 , 473.30, 501.41, 515.07, 518.07, 463.76, 493.95, 521.62, 503.41, 480.71, 495.32, 481.55, 472.32 )
xbar<-mean(x)
Mi<-500
s<-sqrt(var(x))
n<-16
gl<-n-1
"Grau de liberdade,"[1] "Grau de liberdade,"
[1] 15
[1] -1.597646
A partir da tabela t-student com os parâmetros 15 e 0,005 referente ao nivel de confiança de 99% (dado 1% de significância )
tcrit:±2,947.
A partir da hipótese alternativa, percebemos que o nosso teste é bilateral.
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -2,947 \ ou \ \bar{x}\geq2,947(tcrit)}\)
Como \(z_{obs}\) \(\notin\) RC , Aceita-se \(H_{0}\).
-Questão 6:A quantidade de calorias X de um produto segue uma distribuição X~N(µ,\(\sigma^2\) ). O fabricante afirma que a quantidade de calorias é 30 cal. Um concorrente questiona e diz que é mais que 30. Toma-se uma amostra de tamanho 25 e os valores observados foram:
DADOS:
36.25, 30.69, 32.68, 30.43, 31.24, 32.73, 30.06, 32.71, 30.44, 31.48, 28.56, 29.29, 31.28, 33.3, 32.32, 30.63, 31.13, 32.72, 30.63, 31.37, 35.46, 25.15, 30.55, 36.57, 29.87
Observe que a média amostral é 31,5ml. Fazer um teste de hipóteses para testar se o fabricante ou o concorrente tinha razão (α=0,10)
Resolvendo:
\(H_{0}\) : µ \(\leq\) 30
\(H_{a}\) : µ > 30
como se trata de uma amostragem grande (n=25<30), utilizaremos a estatística para t-student
x<-c(36.25, 30.69, 32.68, 30.43, 31.24, 32.73, 30.06, 32.71, 30.44, 31.48, 28.56, 29.29, 31.28, 33.3, 32.32, 30.63, 31.13, 32.72, 30.63, 31.37, 35.46, 25.15, 30.55, 36.57, 29.87 )
xbar<-mean(x)
Mi<-30
s<-sqrt(var(x))
n<-25
gl<-n-1
"Grau de liberdade,"[1] "Grau de liberdade,"
[1] 24
[1] 3.132063
A partir da tabela t-student com os parâmetros 24 e 0,005 referente ao nivel de confiança de 90% (dado 10% de significância )
tcrit:1,315.
A partir da hipótese alternativa, percebemos que o nosso teste é unilateral a direita.
Definimos a região crítica \(RC={\bar{x}\in\Re| \bar{x}\geq1,315(tcrit)}\)
Como \(z_{obs}\) \(\in\) RC , Rejeita-se \(H_{0}\), ou seja, há motivos para duvidar do fabricante que afirma que a quantidade de calorias é 30 cal.
-Questão 7:O tempo para transmitir 10Mb em determinada rede de computadores varia segundo um modelo normal, com media de 7,4 segundos e variância 1,3\(seg^2\). Depois de algumas mudanças na rede, acredita-se numa redução no tempo de transmissão de dados, além de uma possível alteração na variabilidade, Foram realizados 10 ensaios independentes comum arquivo de 10Mb e foram anotados os tempos de transmissão em segundos. Existe evidência suficiente de que o tempo médio de transmissão foi reduzido? Use nível de significância de 1%.
DADOS:6.8, 7.1, 5.9, 7.5, 6.3, 6.9, 7.2, 7.6, 6.6, 6.3
Resolvendo:
\(H_{0}\) : µ \(\leq\) 7.4
\(H_{a}\) : µ > 7.4
como se trata de uma amostragem pequena (n=10<30), utilizaremos a estatística para t-student
x<-c(6.8, 7.1, 5.9, 7.5, 6.3, 6.9, 7.2, 7.6, 6.6, 6.3 )
xbar<-mean(x)
Mi<-7.4
s<-1.3
n<-10
gl<-n-1
"Grau de liberdade,"[1] "Grau de liberdade,"
[1] 9
[1] -1.410862
A partir da tabela t-student com os parâmetros 9 e 0,1 referente ao nivel de confiança de 99% (dado 1% de significância )
tcrit:2,821.
A partir da hipótese alternativa, percebemos que o nosso teste é unilateral a direita.
Definimos a região crítica \(RC={\bar{x}\in\Re| \bar{x}\geq2,821(tcrit)}\)
Como \(z_{obs}\) \(\notin\) RC , aceita-se \(H_{0}\), ou seja, há evidência suficiente de que o tempo médio de transmissão foi reduzido.
-Questão8:Seja X uma v.a. correspondente ao peso do animal. Sabe-se que X~N(µ,\(\sigma~2\) ) com µ=30g e \(\sigma^2\) =40. A média do peso pode variar se as condições de cultivo não são adequadas. Para verificar se as condições estão adequadas, obteve-se uma amostra (n=25), cujos valores foram:
DADOS: 30,26 39,62 21,29 31,35 26,12 29,83 26,31 39,97 28,01 37,54 25,28 33,51 39,57 41,42 23,69 40,53 25,88 23,11 34,38 35,15 40,16 29,51 26,09 24,96 26,47
Fazer um teste de hipóteses para testar H0: µ=30 (α=0,05).
Resolvendo:
\(H_{0}\) : µ = 30
\(H_{a}\) : µ \(\neq\) 30
como se trata de uma amostragem pequena (n=10<30), utilizaremos a estatística para t-student
x<-c(30.26, 39.62, 21.29, 31.35, 26.12, 29.83, 26.31, 39.97, 28.01, 37.54, 25.28, 33.51, 39.57, 41.42, 23.9, 40.53, 25.88, 23.11, 34.38, 35.15, 40.16, 29.51, 26.09, 24.96, 26.47)
xbar<-mean(x)
Mi<-30
s<-sqrt(40)
n<-25
gl<-n-1
"Grau de liberdade,"[1] "Grau de liberdade,"
[1] 24
[1] 0.9556403
A partir da tabela t-student com os parâmetros 24 e 0,025 referente ao nivel de confiança de 95% (dado 5% de significância )
tcrit:±2,064.
A partir da hipótese alternativa, percebemos que o nosso teste é bilateral.
Definimos a região crítica \(RC={\bar{x}\in\Re|\bar{x}\leq -2,064 \ ou \ \bar{x}\geq2,064(tcrit)}\)
Como \(z_{obs}\) \(\notin\) RC , Aceita-se \(H_{0}\).
Teste de Hipótese para variância
Roteiro (Teste de para variância)
Para testarmos a hipótese:
\(H_{0}:\sigma^2 =\sigma^2_{0}\)
com nível de significância α%, devemos:
Estabelece-se a hipótese nula.\(H_{0}:\sigma^2 =\sigma^2_{0}\)
Estabelece-se a hipótese alternativa.
2.1) \(H_{a}:\sigma^2\neq \sigma^2_{0}\) bilateral ou
2.2) \(H_{a}:\sigma^2 > \sigma^2_{0}\) unilateral à direita ou
2.3) \(H_{a}:\sigma^2 < \sigma^2_{0}\) unilateral à esquerda
Fixar o nível de significância α .
Determinar a região de rejeição.
Calcular a estatística \(\chi^2_{obs}\), sendo \(\chi^2_{obs}=\frac{S^2(n-1)}{\sigma^2}\)
Conclusões:
Se | \(\chi^2_{obs}\)|> \(\chi^2_{crit}\),rejeita \(H_{0}\), onde
Se \(\chi^2_{obs}\)>\(\chi^2_{crit}\),rejeita \(H_{0}\)
Se Se \(\chi^2_{obs}\)<-\(\chi^2_{crit}\),rejeita \(H_{0}\)
Questões (Teste para Variância)
-Questão 1: Tomou-se uma amostra de 15 estudantes de odontologia, os quais foram submetidos a um teste de habilidade manual. A variância das notas do teste foi igual a \(S^2\) = 1,2. Pode-se concluir, com base nesse estudo, que a variância da distribuição populacional das notas dos estudantes de odontologia é diferente de 2,5?
Resolvendo:
\(H_{0}\): \(\sigma^2\)= 2,5
\(H_{a}\): \(\sigma^2\) \(\neq\) 2,5
[1] 6.72
Para n – 1 = 14 graus de liberdade, o intervalo de valores de \(\chi^2\) dentro do qual estão 95% de todas os valores da distribuição está limitado entre \(\chi^2_{0,025}\)=5,629 e \(\chi^2_{0 975}\)=26,119
Definimos a região crítica \(RC={\chi_{obs}\in\Re| \chi^2_{1}\leq5,629\ ou\ \chi^2_{2}\geq26,119 }\)
Como \(\chi_{obs}\) \(\notin\) RC , Aceita-se \(H_{0}\). A variância das notas da população de estudantes de odontologia pode ser igual a 2,5.
-Questão 2:Um experimento, conduzido numa comunidade, para verificar a variação na qualidade da água fornecida para a população, incluiu uma amostra de 10 elementos e forneceu variância de 12,4. Este resultado é suficiente para concluir que a variância é inferior a 25 ao nível de 5% de significância?
Resolvendo:
\(H_{0}\): \(\sigma^2\geq\) 25
\(H_{a}\): \(\sigma^2\) < 25
[1] 4.464
Para n – 1 = 9 graus de liberdade, o intervalo de valores de \(\chi^2\) dentro do qual estão 95% de todas os valores da distribuição são os valores inferiores à \(\chi^2_{0,05}\)=3,325.
Definimos a região crítica \(RC={\chi\in\Re| \chi^2_{1}\leq3.325}\)
Como \(\chi_{obs}\) \(\notin\) RC , Aceita-se \(H_{0}\).