#Registro dos valores
pressao <- c(128, 127, 111, 178, 141, 114, 110, 61, 57, 126, 134, 155, 113, 123, 132, 157, 142, 100, 132, 153, 101, 125, 168, 109, 131, 78, 113, 131, 113, 115)
#Média
mean(pressao)
[1] 122.6
EST212 - Bioestatística
Em muitas situações, sobretudo científicas, gostaríamos de testar uma suposição.
Vamos relembrar algumas suposições dos artigos apresentados na aula anterior:
A creatina é eficiente no crescimento muscular de ratos?
Todas as aves apresentam o mesmo nível de preferência pelo percevejo castanho?
O uso de miRNA aumentam a produtividade volumétrica?
O uso de biosólidos industriais impacta na produtividade do milho?
A remoção de ervas daninhas de pavimentos impacta em sua riqueza vegetal?
Ambientes de florestas nativas, replantadas e sem florestas apresentam a mesma riqueza de comunidades cladoceras?
A herbivoria aumenta a produção de cristais de oxalato de cálcio?
Por mais que conheçamos o problema e tenhamos indícios da resposta, é importante determinar um método de decisão estatísticamente válido.
Para esse tipo de problema, foram desenvolvidos os testes de hipóteses.
Um teste de hipóteses é uma regra de decisão baseada em uma amostra.
A premissa básica para um teste de hipóteses é a definição das hipóteses.
Uma hipótese é uma afirmação sobre os parâmetros de um problema, que se espera confirmar ou negar.
A hipótese geralmente é definida em termos do problema e convertida para uma hipótese estatística.
Vejamos o exemplo a seguir
Um medicamento para hipertensão está em fase de testes em humanos. Quais seriam as hipóteses?
Hipótese 1 - O medicamento reduz a pressão arterial em humanos.
Hipótese 2 - O medicamento não reduz a pressão arterial em humanos.
Note que as hipóteses se contradizem, ou seja, uma complementa a outra.
O que o teste de hipótese tenta fazer é definir qual das hipóteses corresponde à realidade, com algum nível de segurança.
De modo geral, trabalhamos com duas hipóteses:
Hipótese nula (\(H_0\))
Hipótese alternativa (\(H_1\))
A hipótese nula é a base para a realização do teste. O teste é realizado considerando que ela é verdadeira.
A hipótese alternativa representa a negação da hipótese nula.
As hipóteses são definidas com base no parâmetro de interesse. Por exemplo, média, variância, proporção, etc.
Queremos decidir, com base nos elementos amostrais, se rejeitamos ou não \(H_0\).
A regra de decisão pela rejeição ou não da hipótese nula define um teste de hipóteses.
Voltemos ao exemplo inicial.
Um medicamento para hipertensão está em fase de testes em humanos. Quais seriam as hipóteses?
Hipótese 1 - O medicamento reduz a pressão arterial em humanos.
Hipótese 2 - O medicamento não reduz a pressão arterial em humanos.
A pressão disatólica padrão em humanos é 120mmHg. O medicamento foi aplicado em pessoas hipertensas.
Logo, podemos afirmar que o medicamento funciona se a pressão média dos pacientes tratados for menor ou igual a 120mmHg.
Por outro lado, se a pressão média se a pressão média dos pacientes medicados seguir maior que 120mmHg, há indícios de que o medicamento não funciona.
Ou seja, estamos testando as seguintes hipóteses:
\[ H_0: \mu \leq 120~~~~vs~~~~H_1: \mu>120 \]
Em que \(\mu\) representa a pressão média dos pacientes tratados.
Note que não aceitar que \(H_0\) é verdadeira implica em concluir que o medicamento não funciona.
Já ao aceitar \(H_0\) estamos afirmando que a pressão média de fato diminuiu.
A igualdade quase sempre está associada à hipótese nula.
Existem alguns tipos de hipóteses, a depender da natureza do teste.
Hipótese bilateral (diferença): \(H_0: \mu = \mu_0~~vs~~ H_1:\mu\neq\mu_0\)
Hipótese unilateral à direita (maior que): \(H_0: \mu \leq \mu_0~~vs~~ H_1:\mu>\mu_0\)
Hipótese unilateral à esquerda (menor que): \(H_0: \mu \geq \mu_0~~vs~~ H_1:\mu<\mu_0\)
Independência: \(H_0\): Os dados não são independentes vs \(H_1\): Os dados são independentes
Aderência: \(H_0\): Os dados seguem determinada distribuição vs \(H_1\): Os dados não seguem determinada distribuição.
Em um teste de hipóteses, existem quatro possibilidades de conclusão:
Se \(H_0\) é verdadeira:
Aceitar \(H_0\) - Decisão correta
Não aceitar \(H_0\) - Erro tipo I - \(P(\text{Erro Tipo I}) = \alpha\)
Se \(H_0\) não é verdadeira:
Aceitar \(H_0\) - Erro tipo - \(P(\text{Erro Tipo I}) = \beta\)
Não aceitar \(H_0\) - Decisão correta
A probabilidade do erro do tipo I, \(\alpha\), é comumente conhecida como nível de significância estatística. Os testes de hipóteses são construídos ao se fixar o valor de \(\alpha\) e maximizar o poder do teste, dado por \(\pi = 1 - \beta\).
Um teste de hipóteses consiste na probabilidade de uma estatística de teste não pertencer a uma determinada distribuição de probabilidades, ao se considerar \(H_0\) verdadeira (dizemos sob \(H_0\)).
Ou seja, se o valor indicado pela estatística de teste for extremo o suficiente para sua probabilidade de pertencer à distribuição presumida ser suficientemente pequena, rejeitamos a hipótese nula.
A primeira forma de construir um teste de hipóteses é por meio da construção de regiões críticas.
Sua construção se baseia em pressupostos, como a distribuição dos dados e o valor dos parâmetros em \(H_0\).
Vamos retornar ao nosso exemplo inicial. Suponha que um grupo de 30 indivíduos hipertensos utilizou o novo medicamento por 30 dias. Após esse prazo, as pressões arteriais foram medidas.
Suponha que as pressões arteriais apresentem distribuição normal, com desvio padrão populacional conhecido e igual a 25.
Foram observadas as seguintes aferições: 128, 127, 111, 178, 141, 114, 110, 61, 57, 126, 134, 155, 113, 123, 132, 157, 142, 100, 132, 153, 101, 125, 168, 109, 131, 78, 113, 131, 113, 115
Vamos verificar a pressão média da amostra (\(\bar{X}\)) :
Queremos testar as seguintes hipóteses: \(H_0: \mu \leq 120~~vs~~H_1: \mu>120\)
O valor da média amostral foi \(\bar{X} = 122,6\), que é maior que \(120\).
Essa evidência é suficiente para rejeitarmos a hipótese nula?
Suponha que queiramos uma probabilidade de cometer erro do tipo I de no máximo \(5\%\), ou seja, \(\alpha = 0,05\).
Note que, se considerarmos que \(H_0\) é verdadeira, junto aos fatos descritos no slide anterior, temos, sob \(H_0\) que a pressão arterial dos medicados é uma variável aleatória que segue uma distribuição normal com média 120 e desvio padrão 25, ou seja:
\[Pressão\sim N(120, 25^2)\]
Sabemos que se \(X\) é uma variável aleatória qualquer, com média \(\mu\) e variância \(\sigma^2\), sua média amostral \(\bar{X}\) segue uma distribuição normal, com a mesma média \(\mu\) e variância \(\dfrac{\sigma^2}{n}\).
Logo, no nosso exemplo, podemos afirmar, sob \(H_0\) que a média amostral segue a seguinte distribuição:
\[ \bar{X}\sim N\left(120, \frac{25^2}{30}\right) \]
Queremos descobrir a partir de qual valor estão as pressões arteriais que representam as 5% maiores.
Esse valor definirá, sob \(H_0\), o valor cuja probabilidade de rejeitar a hipótese nula, dado que ela é verdadeira é exatamente 0,05, ou seja, o valor para o qual \(\alpha = 0,05\). Ele definirá nossa Região de Rejeição.
Queremos calcular o valor de \(x\) tal que \(P(X >x) = 0,05\), dado que \(H_0\) é verdadeira.
Seja X a variável aleatória pressão arterial. Sob \(H_0\), vimos que \(\bar{X}\sim N\left(120, \frac{25^2}{30}\right)\)
Podemos calcular essa probabilidade com o uso da tabela Z e a normalização \(Z = \dfrac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}}\)
Fazendo o cálculo, verificamos que o valor é dado por \(\bar{X} = 127,5\), ou seja, nossa região crítica é dada por: \(RC = \{\bar{X}\in \mathbb{R}: \bar{X} > 127,5\}\) .
Logo, não aceitamos \(H_0\) se a pressão média dos pacientes for maior que \(127,5\). Como a pressão média observada foi \(\bar{x} = 122,6\), ao nível de 5% de significância, podemos afirmar que a verdadeira pressão média dos pacientes é \(120\), ou seja, o medicamento funcionou.
Entretanto, de modo geral, realizamos o teste em termos de uma estatística de teste Z, dada por:
\[ Z_{calc} = \dfrac{\bar{X} - \mu_0}{\frac{\sigma}{\sqrt{n}}} \]
E comparamos com uma região crítica construída com base em uma distribuição padronizada. Nesse caso, a distribuição \(Z \sim N(0,1)\), que é uma distribuição normal padrão.
Esse teste é denominado Teste Z.
O teste Z é utilizado para testar médias quando os dados seguem distribuição normal, com variância conhecida.
No nosso exemplo, a região crítica ficaria dada por
\[RC = \{Z_{calc}\in \mathbb{R}: Z_{calc} > 1,64\}\]
e a estatística de teste dada por
\[ Z_{calc} = \dfrac{122,6 - 120}{\dfrac{25}{\sqrt{30}}} = 0,57 \]
Como o valor da estatística de teste não pertence à região crítica, não temos evidências que suficientes para rejeitar a hipótese nula, logo, podemos afirmar ao nível de 5% de significância que o medicamento é sim eficiente para controlar a pressão arterial.
Com o p-valor, não é mais necessário construir a região crítica. Basta verificar se \(p<\alpha\) ou \(p>\alpha\):
Se \(p<\alpha\), rejeitamos \(H_0\)
Se \(p\geq\alpha\), não rejeitamos \(H_0\)
Para entender melhor a ideia, voltemos ao nosso exemplo.
Em nosso teste, construímos a região crítica dada por
\[RC = \{Z_{calc}\in \mathbb{R}: Z_{calc} > 1,64\}\]
E obtivemos a estatística de teste \(Z_{calc} = 0,57\). Vamos verificar a região crítica e a estatística de teste:
\(p = P(Z > 0,57)\) é maior ou menor que \(\alpha = 0,05\)?
Se calcularmos a probabilidade, verificaremos que \(p = P(Z > 0,57) = 0,284\).
Note que a conclusão foi a mesma, mas dessa vez, utilizamos apenas o p-valor e o nível de significância para concluir.
Essa abordagem é extremamente útil, pois os testes de hipóteses realizados em softwares, apresentam o p-valor como métrica de decisão.
Vamos resolver o nosso exemplo, agora no R, para verificar como é simples.
Vamos lembrar de nossas hipóteses: \(H_0: \mu \leq 120~~vs~~H_1: \mu>120\)
Como queremos testar se a pressão é maior que 120, trata-se de um teste unilateral à direita.
Para realizar o teste Z utilizamos a função z.test
, do pacote BSDA
. Nas próximas aulas práticas falaremos sobre o que são pacotes.
Precisamos informar à função z.test
alguns dados para que ele possa realizar o teste. Esses dados são chamados parâmetros.
Para verificar os detalhes de uma função, basta digitar ?função
no R, em que função
é o nome da função. Vejamos os parâmetros da função z.test
, digitando ?z.test
no R
Vimos que pra usar o teste Z precisamos informar os seguintes parâmetros:
Dados - x
Tipo de hipótese alternativa - alternative
, que deve ser:
"two.sided"
: teste bilateral;
"greater"
: teste unilateral à esquerda;
"less"
: teste unilateral à esquerda;
mu
: valor da média sob \(H;_0\)
sigma.x
: valor do desvio padrão conhecido.
Logo, nosso teste será calculado da seguinte forma:
[1] 128 127 111 178 141 114 110 61 57 126 134 155 113 123 132 157 142 100 132
[20] 153 101 125 168 109 131 78 113 131 113 115
One-sample z-Test
data: pressao
z = 0.56963, p-value = 0.2845
alternative hypothesis: true mean is greater than 120
95 percent confidence interval:
115.0923 NA
sample estimates:
mean of x
122.6
Note que o p-valor (p-value) é maior que \(\alpha = 0,05\), nosso nível de significância. Logo, temos evidências suficientes, ao nível de 0,05 de significância, para não rejeitar a hipótese nula e concluir que o medicamento de fato funciona.
Assim como o teste Z, basicamente todos os testes estatísticos estão implementados no R.
O procedimento de utilização será sempre o mesmo:
Definição da hipótese.
Execução do teste.
Análise do p-valor.
Logo, quando estudarmos um teste, temos que ter em mente principalmente suas hipóteses e o nível de significância.
Vamos fazer mais alguns exemplos para entendermos o processo.
Suponha que a variância do nosso problema inicial seja desconhecida. Nesse caso, conforme visto em Bioestatística, precisamos utilizar um teste t.
O Teste t é mais utilizado, pois dificilmente se conhece a variância de uma população.
A função para realizar o Teste t no R é a t.test
. Os parâmetros são muito parecidos com os da a função z.test
:
Dados - x
Tipo de hipótese alternativa - alternative
, que deve ser:
"two.sided"
: teste bilateral;"greater"
: teste unilateral à esquerda;"less"
: teste unilateral à esquerda;mu
: valor da média sob \(H_0\);
Note que nesse caso não informamos o desvio padrão. Ele será estimado.
Vejamos a execução do teste, considerando um nível de significância \(\alpha = 5\%\).
[1] 128 127 111 178 141 114 110 61 57 126 134 155 113 123 132 157 142 100 132
[20] 153 101 125 168 109 131 78 113 131 113 115
One Sample t-test
data: pressao
t = 0.52341, df = 29, p-value = 0.3023
alternative hypothesis: true mean is greater than 120
95 percent confidence interval:
114.1598 Inf
sample estimates:
mean of x
122.6
Como \(p>0,05\), não temos evidencias suficientes pra rejeitar \(H_0\), logo, a pressão média dos tratados é menor ou igual a 120, ao nível de 5% de significância.
Foram avaliadas 12 jogadoras de basquete convocadas para disputa de jogos da seleção brasileira. Nessa avaliação, foram medidos peso e altura. Os dados de peso são apresentados a seguir. O técnico suspeita que, em média, as jogadoras disponíveis para essa seleção pesam mais do que os 66 kg apresentados pelas jogadoras de seleções anteriores. Teste, ao nível de \(\alpha = 1\%\) de significância, a hipótese de que o peso médio das jogadoras é 66 kg.
Pesos das jogadoras: 66, 72, 69, 68, 68, 68, 67, 67, 68, 70, 70, 69
Hipóteses:
As jogadoras pesam, em média, 66kg: \(H_0: \mu = 66\)
As jogadoras não pesam, em média, 66kg: \(H_1: \mu \neq 66\)
Esste teste é bilateral!
Vamos resolver no R:
#Entrada dos dados de peso das atletas
peso_atletas <- c(66, 72, 69, 68, 68, 68, 67, 67, 68, 70, 70, 69)
#Teste T para verificar se o peso é igual ou diferente de 66kg
t.test(x = peso_atletas, alternative = "two.sided", mu = 66)
One Sample t-test
data: peso_atletas
t = 5.3337, df = 11, p-value = 0.0002397
alternative hypothesis: true mean is not equal to 66
95 percent confidence interval:
67.46836 69.53164
sample estimates:
mean of x
68.5
Observe que o p-valor é \(p = 0,0002397\). Como \(p<\alpha\), temos evidências que nos levam a rejeitar a hipótese nula ao nível de 0,01 de significância. Portanto, o peso médio das jogadoras é diferente de 66kg.
Um pesquisador requisitou ao biotério da universidade em que trabalha oito ratos machos da raça Wistar com 30 dias, que, segundo o bioterista, pesam em média 70 g. Recebe, então, ratos machos da raça indicada, escolhidos aleatoriamente, com os seguintes pesos em gramas: 76, 81, 50, 47, 63, 65, 63, 64. Por simples inspeção, o pesquisador, acostumado a treinar ratos de laboratório, suspeita que os ratos que recebeu tenham, em média, peso menor do que o especificado pelo bioterista. Aplicando um teste estatístico, você diria que o peso médio dos ratos é menor que o especificado, no nível de significância α = 5%?
Hipóteses:
Os ratos pesam, em média, 70g: \(H_0: \mu \geq 70\)
Os ratos pesam, em média, menos de 66kg: \(H_1: \mu < 70\)
Esste teste é unilateral à esquerda!
Solução no R:
#Entrada dos dados de peso dos ratos
peso_ratos <- c(76, 81, 50, 47, 63, 65, 63, 64)
#Teste T para verificar se o peso é igual menor que 70kg
t.test(x = peso_ratos, alternative = "less", mu = 70)
One Sample t-test
data: peso_ratos
t = -1.5729, df = 7, p-value = 0.07987
alternative hypothesis: true mean is less than 70
95 percent confidence interval:
-Inf 71.30362
sample estimates:
mean of x
63.625
Observe que o p-valor é \(p = 0,07987\). Como \(p>\alpha\), temos evidências que nos levam a não rejeitar a hipótese nula ao nível de 0,05 de significância. Ou seja, não se pode afirmar que o peso médio de ratos do biotério seja significativamente menor do que o valor especificado.
Nessa revisão, revisitamos os conceitos básicos de testes de hipóteses.
O procedimento utilizado nos exemplos será o adotado daqui para frente para todos os testes.
Pontos que impedem erros na interpretação:
Defina bem as hipóteses;
Escolha o teste adequado;
Defina o nível de significância;
Esteja atento ao p-valor.