13 de Outubro de 2015
Um teste foi feito da seguinte maneira: 116 pessoas selecionadas aleatoriamente forneceram data, hora e local de nascimento.
Um astrólogo preparou um mapa astral para essas 116 pessoas, usando apenas os dados fornecidos acima.
Cada voluntário também preencheu um questionário: "California Personality Index".
Para um outro astrólogo, foram dados:
Teste de Hipótese: procedimento estatÃstico baseado na análise de uma amostra para avaliar se os dados obtidos podem validar ou não uma hipótese a respeito de um parâmetro populacional
Hipótese EstatÃstica: é uma afirmação ou conjectura sobre a natureza de uma população que será testada. É geralmente escrita em termos dos parâmetros populacionais
Por exemplo: o parâmetro pode ser uma proporção populacional.
Usando o mapa astral de uma pessoa, a probabilidade, \(p\), de um astrólogo predizer corretamente qual dos 3 questionários está associado àquele mapa astral é igual a \(1/3\). Ou seja, os astrólogos apenas selecionam ao acaso um dos questionários.
Nesse caso, para saber se os astrólogos têm a capacidade de predizer a personalidade usando o mapa astral, usarÃamos as seguintes hipóteses:
\[ \begin{cases} H_0: p = 1/3 & \mbox{(hipótese nula)} \\ H_a: p > 1/3 & \mbox{(hipótese alternativa)} \end{cases} \]
No experimento com os astrólogos, observar uma proporção alta de acertos pode ser uma evidência contra a hipótese de que \(p=1/3\).
O teste é válido sob algumas suposições. A mais importante assume que os dados do experimento foram produzidos através de um processo de aleatorização.
O teste de hipótese tem sempre duas hipóteses sobre o parâmetro populacional de interesse. As hipóteses devem ser definidas antes de se realizar o experimento e coletar dados.
No experimento com os astrólogos, \(H_0\): \(p=1/3\) representa a hipótese de que não há efeito, no sentido de que os astrólogos não têm uma capacidade maior de predizer a personalidade usando o mapa astral.
A hipótese alternativa, \(H_a\): \(p>1/3\), representa a hipótese de que há efeito, ou seja, os astrólogos têm uma capacidade de predizer a personalidade usando o mapa astral.
Em teste de hipóteses, mantém-se a favor de \(H_0\) a menos que os dados tragam grande evidência contra.
A hipótese nula é conservadora: "o réu é inocente até que se prove o contrário".
Vimos que podemos usar uma estatÃstica para estimar um parâmetro populacional. A estatÃstica do teste descreve quão longe do parâmetro populacional usado na \(H_0\) a estimativa está.
Por exemplo, se \(H_0:\) \(p=1/3\), e se \(\hat{p}=40/116=0.345\), queremos uma estatÃstica que quantifique quão longe está \(\hat{p}=0.345\) de \(p=1/3\).
Para interpretar uma estatÃstica do teste, vamos usar uma probabilidade para resumir a evidência contra \(H_0\). Esta probabilidade é chamada de valor-de-p.
Baseado no valor-de-p, decidir se rejeita ou não a hipótese nula. Note que a conclusão é sempre em termos da hipótese nula: rejeitar ou não \(H_0\).
Mas quão pequeno deve ser o valor-de-p para ser considerado forte evidência contra \(H_0\)?
Geralmente, fixamos o nÃvel de significância do teste (\(\alpha\)), e usamos a seguinte regra. É comum usarmos \(\alpha=0.05\).
Assumimos primeiro que \(H_0\) é verdadeira.
Consideramos então todos os valores possÃveis para a estatÃstica do teste, de acordo com sua distribuição amostral.
Calculamos a estatÃstica do teste observada para o experimento realizado e verificamos onde, na distribuição amostral, ela se posiciona.
Calculamos a probabilidade de um valor igual ou mais extremo ao da estatÃstica do teste observada (valor-de-p). Mais extremo: mais evidência contra \(H_0\).
Se o valor-de-p obtido é bem pequeno, por exemplo, \(0.01\), isto quer dizer que se \(H_0\) é verdadeira, então seria incomum obter uma amostra com os resultados como o observado. Um valor-de-p muito baixo traz fortes evidências contra \(H_0\).
Distribuição amostral da proporção amostral \(\hat{p}\) sob \(H_0\). A área em azul representa uma probabilidade, que chamamos de valor-de-p: probabilidade de proporção amostral assumir um valor igual ao observado, \(\hat{p}_{obs}\), ou mais extremo, sob \(H_0\).
Passo 1: suposições
Passo 2: hipóteses
Passo 3: estatÃstica do teste
Passo 3: estatÃstica do teste
\[Z=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} \overset{H_0}{\sim} N(0,1)\]
Passo 3: estatÃstica do teste
\[z_{obs}=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}}= \frac{0.345-1/3}{\sqrt{\frac{1/3(1-1/3)}{116}}}=0.27\]
Passo 4: valor-de-p
Distribuição amostral da estatÃstica do teste \(Z\) sob \(H_0\). A área em azul representa a probabilidade de valores mais extremos que \(z_{obs}\) ocorrerem, que chamamos de valor-de-p.
Passo 5: conclusão
Detalhes da pesquisa podem ser encontrados no artigo da revista Nature: A double-blind test of Astrology.
Suponha que temos uma população e uma hipótese sobre a proporção \(p\) de indÃviduos com certa caracterÃstica
Hipóteses:
\[ \begin{aligned} H_0: p = p_0 \quad \mbox{vs} \quad
H_a: & p \neq p_0 \mbox{ (bilateral)} \\
& p < p_0 \mbox{ (unilateral à esquerda)} \\
& p > p_0 \mbox{ (unilateral à direita)}
\end{aligned}
\]
EstatÃstica do teste: Baseada na distribuição amostral de \(\hat p\) \[Z=\frac{\hat{p}-p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} \overset{H_0}{\sim} N(0,1)\]
Condição: \(np_0 ≥ 10\) e \(n(1−p_0) ≥ 10\) para aproximação normal
valor-de-p
\(H_a: p \neq p_0\) (bilateral): valor-de-p=\(P(|Z| ≥|z_{obs}|)\)
\(H_a: p < p_0\) (unilateral à esquerda): valor-de-p=\(P(Z \leq z_{obs})\)
\(H_a: p > p_0\) (unilateral à direita): valor-de-p=\(P(Z \geq z_{obs})\)
Conclusão
Para um nÃvel de significância \(\alpha\):
Uma indústria farmacêutica diz que menos de 20% dos pacientes que estão usando um certo medicamento terão efeitos colaterais.
Realizou-se então um ensaio clÃnico com 400 pacientes e verificou-se que 68 pacientes apresentaram efeitos colaterais
Hipóteses: \(H_0: p = 0.20 \quad \mbox{vs} \quad H_a: p < 0.20\)
EstatÃstica do teste: Da amostra temos que \(\hat p = 68/400 = 0.17\) \[z_{obs} = \frac{\hat p - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} = \frac{0.17 - 0.20}{\sqrt{\frac{0.20(1-0.20)}{400}}} = -1.5\]
\[\mbox{valor-de-p} =P(Z \leq- 1.5) = 0.067\]
Conclusão: Para \(\alpha=0.05\), como o valor-de-p é maior que 0.05, não temos evidências nos dados para rejeitar a hipótese de que \(p=0.20\). Na verdade, a evidência está na direção que a indústria farmacêutica queria, mas não é o suficiente para rejeitar \(H_0\).
E se tivéssemos testando: \(H_0: p = 0.20 \quad \mbox{vs} \quad H_a: p \neq 0.20\)
\[\begin{aligned} \mbox{valor-de-p} &=P(|Z| \geq 1.5) = P(Z \leq -1.5) + P(Z \geq 1.5) \\ &= 2P(Z \leq -1.5) = 2 \times 0.067=0.134 \end{aligned} \]
Conclusão: Para \(\alpha=0.05\), como o valor-de-p é maior que 0.05, não temos evidências nos dados para rejeitar a hipótese de que \(p=0.20\).
Em sala de aula, vários alunos disseram que conseguem distinguir entre Coca-Cola normal e Coca-Cola Zero.
Fizemos então o teste para comprovar se a afirmação é verdadeira.
Um dos alunos experimentou, em ordem aleatória, 10 amostras de Coca-Cola normal e 10 amostras de Coca-Cola Zero e anotamos a quantidade de acertos.
Veja que \(X \sim Bin(20, p)\), onde \(X\) é o número de acertos.
Do total de 20 testes, o aluno acerto 18! Temos então uma proporção amostral de acertos \(\hat p = 18/20=0.9\). Isso mostra que o aluno realmente sabe a diferença?
Vamos testar o seguinte: \[H_0: p = 0.50 \quad \mbox{vs} \quad H_a: p > 0.50\]
Hipóteses: \(H_0: p = 0.50 \quad \mbox{vs} \quad H_a: p > 0.50\)
EstatÃstica do teste: \[z_{obs} = \frac{\hat p - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} = \frac{0.9 - 0.5}{\sqrt{\frac{(0.50)(0.50)}{20}}} = 3.57\]
valor-de-p = \(P(Z \geq 3.57) = 0.0001\)
Conclusão: Fixando \(\alpha=0.05\), rejeitamos a hipótese de que \(p=0.5\) e, portanto, acreditamos que a probabilidade de acertos é maior que 50%.