Revisão - Testes de Hipóteses

EST212 - Bioestatística

Helgem de Souza

O que é um teste de hipóteses?

  • Em muitas situações, sobretudo científicas, gostaríamos de testar uma suposição.

  • Vamos relembrar algumas suposições dos artigos apresentados na aula anterior:

    • A creatina é eficiente no crescimento muscular de ratos?

    • Todas as aves apresentam o mesmo nível de preferência pelo percevejo castanho?

    • O uso de miRNA aumentam a produtividade volumétrica?

    • O uso de biosólidos industriais impacta na produtividade do milho?

    • A remoção de ervas daninhas de pavimentos impacta em sua riqueza vegetal?

    • Ambientes de florestas nativas, replantadas e sem florestas apresentam a mesma riqueza de comunidades cladoceras?

    • A herbivoria aumenta a produção de cristais de oxalato de cálcio?

O que é um teste de hipóteses?

  • Por mais que conheçamos o problema e tenhamos indícios da resposta, é importante determinar um método de decisão estatísticamente válido.

  • Para esse tipo de problema, foram desenvolvidos os testes de hipóteses.

  • Um teste de hipóteses é uma regra de decisão baseada em uma amostra.

Hipóteses

  • A premissa básica para um teste de hipóteses é a definição das hipóteses.

  • Uma hipótese é uma afirmação sobre os parâmetros de um problema, que se espera confirmar ou negar.

  • A hipótese geralmente é definida em termos do problema e convertida para uma hipótese estatística.

  • Vejamos o exemplo a seguir

Hipóteses

  • Um medicamento para hipertensão está em fase de testes em humanos. Quais seriam as hipóteses?

    • Hipótese 1 - O medicamento reduz a pressão arterial em humanos.

    • Hipótese 2 - O medicamento não reduz a pressão arterial em humanos.

  • Note que as hipóteses se contradizem, ou seja, uma complementa a outra.

  • O que o teste de hipótese tenta fazer é definir qual das hipóteses corresponde à realidade, com algum nível de segurança.

Hipóteses

  • De modo geral, trabalhamos com duas hipóteses:

    • Hipótese nula (\(H_0\))

    • Hipótese alternativa (\(H_1\))

  • A hipótese nula é a base para a realização do teste. O teste é realizado considerando que ela é verdadeira.

  • A hipótese alternativa representa a negação da hipótese nula.

  • As hipóteses são definidas com base no parâmetro de interesse. Por exemplo, média, variância, proporção, etc.

  • Queremos decidir, com base nos elementos amostrais, se rejeitamos ou não \(H_0\).

  • A regra de decisão pela rejeição ou não da hipótese nula define um teste de hipóteses.

Exemplo de hipóteses

Voltemos ao exemplo inicial.

  • Um medicamento para hipertensão está em fase de testes em humanos. Quais seriam as hipóteses?

    • Hipótese 1 - O medicamento reduz a pressão arterial em humanos.

    • Hipótese 2 - O medicamento não reduz a pressão arterial em humanos.

  • A pressão disatólica padrão em humanos é 120mmHg. O medicamento foi aplicado em pessoas hipertensas.

  • Logo, podemos afirmar que o medicamento funciona se a pressão média dos pacientes tratados for menor ou igual a 120mmHg.

  • Por outro lado, se a pressão média se a pressão média dos pacientes medicados seguir maior que 120mmHg, há indícios de que o medicamento não funciona.

Exemplo de hipóteses

Ou seja, estamos testando as seguintes hipóteses:

\[ H_0: \mu \leq 120~~~~vs~~~~H_1: \mu>120 \]

Em que \(\mu\) representa a pressão média dos pacientes tratados.

  • Note que não aceitar que \(H_0\) é verdadeira implica em concluir que o medicamento não funciona.

  • Já ao aceitar \(H_0\) estamos afirmando que a pressão média de fato diminuiu.

  • A igualdade quase sempre está associada à hipótese nula.

Hipóteses

Existem alguns tipos de hipóteses, a depender da natureza do teste.

  • Hipótese bilateral (diferença): \(H_0: \mu = \mu_0~~vs~~ H_1:\mu\neq\mu_0\)

  • Hipótese unilateral à direita (maior que): \(H_0: \mu \leq \mu_0~~vs~~ H_1:\mu>\mu_0\)

  • Hipótese unilateral à esquerda (menor que): \(H_0: \mu \geq \mu_0~~vs~~ H_1:\mu<\mu_0\)

  • Independência: \(H_0\): Os dados não são independentes vs \(H_1\): Os dados são independentes

  • Aderência: \(H_0\): Os dados seguem determinada distribuição vs \(H_1\): Os dados não seguem determinada distribuição.

Erros em Testes de Hipóteses

Em um teste de hipóteses, existem quatro possibilidades de conclusão:

  • Se \(H_0\) é verdadeira:

    • Aceitar \(H_0\) - Decisão correta

    • Não aceitar \(H_0\) - Erro tipo I - \(P(\text{Erro Tipo I}) = \alpha\)

  • Se \(H_0\) não é verdadeira:

    • Aceitar \(H_0\) - Erro tipo - \(P(\text{Erro Tipo I}) = \beta\)

    • Não aceitar \(H_0\) - Decisão correta

A probabilidade do erro do tipo I, \(\alpha\), é comumente conhecida como nível de significância estatística. Os testes de hipóteses são construídos ao se fixar o valor de \(\alpha\) e maximizar o poder do teste, dado por \(\pi = 1 - \beta\).

Definição de Teste de Hipóteses

  • Um teste de hipóteses consiste na probabilidade de uma estatística de teste não pertencer a uma determinada distribuição de probabilidades, ao se considerar \(H_0\) verdadeira (dizemos sob \(H_0\)).

  • Ou seja, se o valor indicado pela estatística de teste for extremo o suficiente para sua probabilidade de pertencer à distribuição presumida ser suficientemente pequena, rejeitamos a hipótese nula.

  • A primeira forma de construir um teste de hipóteses é por meio da construção de regiões críticas.

  • Sua construção se baseia em pressupostos, como a distribuição dos dados e o valor dos parâmetros em \(H_0\).

Exemplo

  • Vamos retornar ao nosso exemplo inicial. Suponha que um grupo de 30 indivíduos hipertensos utilizou o novo medicamento por 30 dias. Após esse prazo, as pressões arteriais foram medidas.

  • Suponha que as pressões arteriais apresentem distribuição normal, com desvio padrão populacional conhecido e igual a 25.

  • Foram observadas as seguintes aferições: 128, 127, 111, 178, 141, 114, 110, 61, 57, 126, 134, 155, 113, 123, 132, 157, 142, 100, 132, 153, 101, 125, 168, 109, 131, 78, 113, 131, 113, 115

  • Vamos verificar a pressão média da amostra (\(\bar{X}\)) :

#Registro dos valores 
pressao <- c(128, 127, 111, 178, 141, 114, 110, 61, 57, 126, 134, 155, 113, 123, 132, 157, 142, 100, 132, 153, 101, 125, 168, 109, 131, 78, 113, 131, 113, 115)

#Média
mean(pressao)
[1] 122.6

Exemplo

  • Queremos testar as seguintes hipóteses: \(H_0: \mu \leq 120~~vs~~H_1: \mu>120\)

  • O valor da média amostral foi \(\bar{X} = 122,6\), que é maior que \(120\).

  • Essa evidência é suficiente para rejeitarmos a hipótese nula?

  • Suponha que queiramos uma probabilidade de cometer erro do tipo I de no máximo \(5\%\), ou seja, \(\alpha = 0,05\).

Note que, se considerarmos que \(H_0\) é verdadeira, junto aos fatos descritos no slide anterior, temos, sob \(H_0\) que a pressão arterial dos medicados é uma variável aleatória que segue uma distribuição normal com média 120 e desvio padrão 25, ou seja:

\[Pressão\sim N(120, 25^2)\]

Exemplo

  • Sabemos que se \(X\) é uma variável aleatória qualquer, com média \(\mu\) e variância \(\sigma^2\), sua média amostral \(\bar{X}\) segue uma distribuição normal, com a mesma média \(\mu\) e variância \(\dfrac{\sigma^2}{n}\).

  • Logo, no nosso exemplo, podemos afirmar, sob \(H_0\) que a média amostral segue a seguinte distribuição:

\[ \bar{X}\sim N\left(120, \frac{25^2}{30}\right) \]

  • Com essa informação, podemos calcular a partir de qual valor estão as pressões arteriais que representam as 5% maiores.

Exemplo

Queremos descobrir a partir de qual valor estão as pressões arteriais que representam as 5% maiores.

Esse valor definirá, sob \(H_0\), o valor cuja probabilidade de rejeitar a hipótese nula, dado que ela é verdadeira é exatamente 0,05, ou seja, o valor para o qual \(\alpha = 0,05\). Ele definirá nossa Região de Rejeição.

Exemplo

  • Queremos calcular o valor de \(x\) tal que \(P(X >x) = 0,05\), dado que \(H_0\) é verdadeira.

  • Seja X a variável aleatória pressão arterial. Sob \(H_0\), vimos que \(\bar{X}\sim N\left(120, \frac{25^2}{30}\right)\)

  • Podemos calcular essa probabilidade com o uso da tabela Z e a normalização \(Z = \dfrac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}}\)

  • Fazendo o cálculo, verificamos que o valor é dado por \(\bar{X} = 127,5\), ou seja, nossa região crítica é dada por: \(RC = \{\bar{X}\in \mathbb{R}: \bar{X} > 127,5\}\) .

  • Logo, não aceitamos \(H_0\) se a pressão média dos pacientes for maior que \(127,5\). Como a pressão média observada foi \(\bar{x} = 122,6\), ao nível de 5% de significância, podemos afirmar que a verdadeira pressão média dos pacientes é \(120\), ou seja, o medicamento funcionou.

Exemplo

Entretanto, de modo geral, realizamos o teste em termos de uma estatística de teste Z, dada por:

\[ Z_{calc} = \dfrac{\bar{X} - \mu_0}{\frac{\sigma}{\sqrt{n}}} \]

E comparamos com uma região crítica construída com base em uma distribuição padronizada. Nesse caso, a distribuição \(Z \sim N(0,1)\), que é uma distribuição normal padrão.

Esse teste é denominado Teste Z.

O teste Z é utilizado para testar médias quando os dados seguem distribuição normal, com variância conhecida.

Exemplo

No nosso exemplo, a região crítica ficaria dada por

\[RC = \{Z_{calc}\in \mathbb{R}: Z_{calc} > 1,64\}\]

e a estatística de teste dada por

\[ Z_{calc} = \dfrac{122,6 - 120}{\dfrac{25}{\sqrt{30}}} = 0,57 \]

Como o valor da estatística de teste não pertence à região crítica, não temos evidências que suficientes para rejeitar a hipótese nula, logo, podemos afirmar ao nível de 5% de significância que o medicamento é sim eficiente para controlar a pressão arterial.

P-valor

  • Conforme mencionado, uma das formas de realizar um teste de hipóteses é por meio da região crítica.
  • Entretanto, o processo de construção de regiões críticas, alem de trabalhoso, necessita de um conhecimento teórico maior.
  • Para tornar a tomada decisão em testes de hipóteses mais simples, utiliza-se o p-valor.
  • Definição: O P-valor (ou valor-p) é a probabilidade de um valor ser tão ou mais extremo que a estatística de teste observada em um teste de hipóteses, sob \(H_0\).

Utilização do P-valor

Com o p-valor, não é mais necessário construir a região crítica. Basta verificar se \(p<\alpha\) ou \(p>\alpha\):

  • Se \(p<\alpha\), rejeitamos \(H_0\)

  • Se \(p\geq\alpha\), não rejeitamos \(H_0\)

Para entender melhor a ideia, voltemos ao nosso exemplo.

Exemplo - P-valor

Em nosso teste, construímos a região crítica dada por

\[RC = \{Z_{calc}\in \mathbb{R}: Z_{calc} > 1,64\}\]

E obtivemos a estatística de teste \(Z_{calc} = 0,57\). Vamos verificar a região crítica e a estatística de teste:

  • \(p = P(Z > 0,57)\) é maior ou menor que \(\alpha = 0,05\)?

  • Se calcularmos a probabilidade, verificaremos que \(p = P(Z > 0,57) = 0,284\).

  • Como \(p>\alpha\), ao nível de 5% de significância, não temos evidências suficientes para rejeitar \(H_0\).

P-valor

  • Note que a conclusão foi a mesma, mas dessa vez, utilizamos apenas o p-valor e o nível de significância para concluir.

  • Essa abordagem é extremamente útil, pois os testes de hipóteses realizados em softwares, apresentam o p-valor como métrica de decisão.

  • Vamos resolver o nosso exemplo, agora no R, para verificar como é simples.

Exemplo - P-valor no R

  • Vamos lembrar de nossas hipóteses: \(H_0: \mu \leq 120~~vs~~H_1: \mu>120\)

  • Como queremos testar se a pressão é maior que 120, trata-se de um teste unilateral à direita.

  • Para realizar o teste Z utilizamos a função z.test, do pacote BSDA. Nas próximas aulas práticas falaremos sobre o que são pacotes.

  • Precisamos informar à função z.test alguns dados para que ele possa realizar o teste. Esses dados são chamados parâmetros.

  • Para verificar os detalhes de uma função, basta digitar ?função no R, em que função é o nome da função. Vejamos os parâmetros da função z.test, digitando ?z.test no R

Exemplo - P-valor no R

Vimos que pra usar o teste Z precisamos informar os seguintes parâmetros:

  • Dados - x

  • Tipo de hipótese alternativa - alternative, que deve ser:

    • "two.sided": teste bilateral;

    • "greater": teste unilateral à esquerda;

    • "less": teste unilateral à esquerda;

  • mu: valor da média sob \(H;_0\)

  • sigma.x: valor do desvio padrão conhecido.

Exemplo - P-valor no R

Logo, nosso teste será calculado da seguinte forma:

#Nossos dados já foram carregados no R
pressao
 [1] 128 127 111 178 141 114 110  61  57 126 134 155 113 123 132 157 142 100 132
[20] 153 101 125 168 109 131  78 113 131 113 115
#Execução do teste
z.test(x = pressao, alternative = "greater", mu = 120, sigma.x = 25)

    One-sample z-Test

data:  pressao
z = 0.56963, p-value = 0.2845
alternative hypothesis: true mean is greater than 120
95 percent confidence interval:
 115.0923       NA
sample estimates:
mean of x 
    122.6 

Note que o p-valor (p-value) é maior que \(\alpha = 0,05\), nosso nível de significância. Logo, temos evidências suficientes, ao nível de 0,05 de significância, para não rejeitar a hipótese nula e concluir que o medicamento de fato funciona.

Testes de hipóteses no R

  • Assim como o teste Z, basicamente todos os testes estatísticos estão implementados no R.

  • O procedimento de utilização será sempre o mesmo:

    1. Definição da hipótese.

    2. Execução do teste.

    3. Análise do p-valor.

  • Logo, quando estudarmos um teste, temos que ter em mente principalmente suas hipóteses e o nível de significância.

  • Vamos fazer mais alguns exemplos para entendermos o processo.

Exemplo

Suponha que a variância do nosso problema inicial seja desconhecida. Nesse caso, conforme visto em Bioestatística, precisamos utilizar um teste t.

O Teste t é mais utilizado, pois dificilmente se conhece a variância de uma população.

A função para realizar o Teste t no R é a t.test. Os parâmetros são muito parecidos com os da a função z.test:

  • Dados - x

  • Tipo de hipótese alternativa - alternative, que deve ser:

    • "two.sided": teste bilateral;
    • "greater": teste unilateral à esquerda;
    • "less": teste unilateral à esquerda;
  • mu: valor da média sob \(H_0\);

Note que nesse caso não informamos o desvio padrão. Ele será estimado.

Exemplo

Vejamos a execução do teste, considerando um nível de significância \(\alpha = 5\%\).

#Utilizaremos os mesmos dados do exemplo anterior
pressao
 [1] 128 127 111 178 141 114 110  61  57 126 134 155 113 123 132 157 142 100 132
[20] 153 101 125 168 109 131  78 113 131 113 115
#Execução do teste
t.test(x = pressao, alternative = "greater", mu = 120)

    One Sample t-test

data:  pressao
t = 0.52341, df = 29, p-value = 0.3023
alternative hypothesis: true mean is greater than 120
95 percent confidence interval:
 114.1598      Inf
sample estimates:
mean of x 
    122.6 

Como \(p>0,05\), não temos evidencias suficientes pra rejeitar \(H_0\), logo, a pressão média dos tratados é menor ou igual a 120, ao nível de 5% de significância.

Exemplo - Peso médio de jogadoras

Foram avaliadas 12 jogadoras de basquete convocadas para disputa de jogos da seleção brasileira. Nessa avaliação, foram medidos peso e altura. Os dados de peso são apresentados a seguir. O técnico suspeita que, em média, as jogadoras disponíveis para essa seleção pesam mais do que os 66 kg apresentados pelas jogadoras de seleções anteriores. Teste, ao nível de \(\alpha = 1\%\) de significância, a hipótese de que o peso médio das jogadoras é 66 kg.

Pesos das jogadoras: 66, 72, 69, 68, 68, 68, 67, 67, 68, 70, 70, 69

Hipóteses:

  • As jogadoras pesam, em média, 66kg: \(H_0: \mu = 66\)

  • As jogadoras não pesam, em média, 66kg: \(H_1: \mu \neq 66\)

Esste teste é bilateral!

Exemplo - Peso médio de jogadoras

Vamos resolver no R:

#Entrada dos dados de peso das atletas
peso_atletas <- c(66, 72, 69, 68, 68, 68, 67, 67, 68, 70, 70, 69)

#Teste T para verificar se o peso é igual ou diferente de 66kg
t.test(x = peso_atletas, alternative = "two.sided", mu = 66)

    One Sample t-test

data:  peso_atletas
t = 5.3337, df = 11, p-value = 0.0002397
alternative hypothesis: true mean is not equal to 66
95 percent confidence interval:
 67.46836 69.53164
sample estimates:
mean of x 
     68.5 

Observe que o p-valor é \(p = 0,0002397\). Como \(p<\alpha\), temos evidências que nos levam a rejeitar a hipótese nula ao nível de 0,01 de significância. Portanto, o peso médio das jogadoras é diferente de 66kg.

Exemplo - Peso de ratos Wistar

Um pesquisador requisitou ao biotério da universidade em que trabalha oito ratos machos da raça Wistar com 30 dias, que, segundo o bioterista, pesam em média 70 g. Recebe, então, ratos machos da raça indicada, escolhidos aleatoriamente, com os seguintes pesos em gramas: 76, 81, 50, 47, 63, 65, 63, 64. Por simples inspeção, o pesquisador, acostumado a treinar ratos de laboratório, suspeita que os ratos que recebeu tenham, em média, peso menor do que o especificado pelo bioterista. Aplicando um teste estatístico, você diria que o peso médio dos ratos é menor que o especificado, no nível de significância α = 5%?

Hipóteses:

  • Os ratos pesam, em média, 70g: \(H_0: \mu \geq 70\)

  • Os ratos pesam, em média, menos de 66kg: \(H_1: \mu < 70\)

Esste teste é unilateral à esquerda!

Exemplo - Peso de ratos Wistar

Solução no R:

#Entrada dos dados de peso dos ratos
peso_ratos <- c(76, 81, 50, 47, 63, 65, 63, 64)

#Teste T para verificar se o peso é igual menor que 70kg
t.test(x = peso_ratos, alternative = "less", mu = 70)

    One Sample t-test

data:  peso_ratos
t = -1.5729, df = 7, p-value = 0.07987
alternative hypothesis: true mean is less than 70
95 percent confidence interval:
     -Inf 71.30362
sample estimates:
mean of x 
   63.625 

Observe que o p-valor é \(p = 0,07987\). Como \(p>\alpha\), temos evidências que nos levam a não rejeitar a hipótese nula ao nível de 0,05 de significância. Ou seja, não se pode afirmar que o peso médio de ratos do biotério seja significativamente menor do que o valor especificado.

Conclusão

  • Nessa revisão, revisitamos os conceitos básicos de testes de hipóteses.

  • O procedimento utilizado nos exemplos será o adotado daqui para frente para todos os testes.

  • Pontos que impedem erros na interpretação:

    1. Defina bem as hipóteses;

    2. Escolha o teste adequado;

    3. Defina o nível de significância;

    4. Esteja atento ao p-valor.