O objetivo de um teste de hipóteses é determinar se uma hipótese ou conjectura que fazemos acerca de um parâmetro de uma população é plausível.
Hipótese nula: Corresponde à situação que não há mudança da afirmação. Hipótese alternativa: Corresponde à mudança na afirmação do estudo.
Ao tomar uma decisão sobre H0 pode-se ocorrer dois erros distintos. O primeiro, classificado como erro tipo I, consiste em rejeitar a hipótese nula quando ela é verdadeira. O segundo, dito erro tipo II, consiste em não rejeitar H0 quando ela é falsa. Aos erros estão associados as probalidades: α e β
| H0 Verdadeira | H0 falsa | |
|---|---|---|
| Não Rejeitar | Correto | Erro tipo II (β) |
| Rejeitar | Erro tipo I (α) | Correto |
Em relação à probabilidade, α corresponde ao nível de significância do teste. Geralmente, os valores de alpha estão dispostos na tabela abaixo com seus respectivos níveis de confiança:
| α | 0,01 | 0,05 | 0,10 |
|---|---|---|---|
| confiança | 99% | 95% | 90% |
A potência do teste é dada por (1 - β), sendo β a probabilidade de cometer um erro do tipo II, ou seja, a probabilidade de não rejeição de H0 quando falsa. Quanto menor a probabilidade de β, maior é a potência do teste,
é uma faixa ou conjunto de valores em uma distribuição estatística em que, se a estatística de teste cair dentro dessa faixa, a hipótese nula é rejeitada em favor da hipótese alternativa. A região crítica é determinada com base no nível de significância (alpha) escolhido para o teste.
é o critério utilizado para tomar uma decisão sobre a hipótese nula com base nos resultados do teste. A regra de decisão é definida de acordo com a região crítica e o valor-p obtidos.
A regra de decisão comum em testes de hipóteses é a seguinte:
Se o valor-p for menor que o nível de significância (alpha), rejeitamos a hipótese nula em favor da hipótese alternativa. Isso significa que os dados fornecem evidências estatísticas para suportar a hipótese alternativa.
| Valor-p <= α |
Se o valor-p for maior ou igual ao nível de significância (alpha), não temos evidências estatísticas para rejeitar a hipótese nula. Nesse caso, não podemos concluir que há diferença significativa ou suporte para a hipótese alternativa.
| Valor-p >= α |
A região crítica e a regra de decisão são usadas para controlar o erro do tipo I (rejeitar erroneamente a hipótese nula quando ela é verdadeira). O nível de significância (alpha) é escolhido com base no equilíbrio desejado entre o controle desse erro e o poder estatístico do teste.
1.Formular a hipótese nula (H0 ) e a hipótese alternativa H1;
Estabelecer o nível de significância;
Escolher a estatıstica de teste a usar e encontrar qual a sua distribuição de probabilidade supondo que H0 é verdadeira;
Determinar a região de rejeição;
Calcular o valor observado da estatıstica de teste;
Decidir rejeitar H0 ou não rejeitar H0;
Apresentar a conclusão de acordo com o problema.
Os testes paramétricos assumem que os dados seguem uma distribuição específica, geralmente a distribuição normal (ou gaussiana). Além disso, eles também assumem homogeneidade das variâncias entre os grupos e a presença de uma relação linear entre as variáveis.
Os testes paramétricos estimam parâmetros específicos da distribuição, como a média ou o desvio padrão, para realizar inferências estatísticas.
Sob as suposições corretas, os testes paramétricos têm maior poder estatístico e eficiência, o que significa que eles podem detectar diferenças menores com uma amostra menor.
Os testes não paramétricos não fazem suposições específicas sobre a distribuição dos dados. Eles são mais flexíveis e podem ser aplicados em uma ampla variedade de distribuições, incluindo aquelas que não seguem uma distribuição normal. Contínuas, distribuição distorcida, amostra aleatória
Os testes não paramétricos são baseados em estatísticas de ordem, como a classificação dos dados em ordem crescente.
Em geral, os testes não paramétricos são menos eficientes do que os testes paramétricos quando as suposições paramétricas são atendidas. No entanto, eles são mais robustos e podem fornecer resultados válidos mesmo quando as suposições são violadas.
#lendo o dataset
dados <- read_csv("teste_wilcoxon - Cópia de Banco de Dados 4.csv 1.csv",
col_types = cols(Convulsões_PT = col_integer(),
Convulsões_S1 = col_integer(), Convulsões_S6 = col_integer()))
O objetivo do teste de Wilcoxon, também conhecido como teste de Wilcoxon de amostras pareadas ou Wilcoxon signed rank test, é verificar se existe diferença significativa entre as medianas de duas amostras relacionadas ou pareadas.
Esse teste é aplicado quando as observações são coletadas em pares, ou seja, cada elemento em uma amostra está relacionado diretamente a um elemento correspondente na outra amostra. O teste de Wilcoxon é uma alternativa ao teste t de Student para amostras pareadas, mas não requer a suposição de normalidade nos dados.
O teste de Wilcoxon avalia a hipótese nula de que não há diferença significativa entre as medianas das duas amostras. A hipótese alternativa é que existe uma diferença significativa.
Ao aplicar o teste de Wilcoxon, o valor p é calculado para determinar se há evidências suficientes para rejeitar a hipótese nula. Se o valor p for menor que o nível de significância pré-definido (geralmente 0,05), então a hipótese nula é rejeitada, indicando que há diferença significativa entre as medianas das amostras. Caso contrário, se o valor p for maior que o nível de significância, não há evidências para rejeitar a hipótese nula, sugerindo que não há diferença significativa entre as medianas.
| ID_Paciente | ID_Médico | Gênero | Convulsões_PT | Convulsões_S1 | Convulsões_S6 |
|---|---|---|---|---|---|
| 382 | HQQS | Masculino | 3 | 3 | 3 |
| 06YO | IKGU | Masculino | 4 | 5 | 4 |
| 07GL | VLDP | Masculino | 3 | 1 | 2 |
| 07IT | SRKQ | Masculino | 7 | 7 | 4 |
| 827 | WGSX | Feminino | 1 | 3 | 3 |
| 885 | QYJV | Masculino | 4 | 1 | 1 |
| 968 | RCGB | Feminino | 3 | 6 | 5 |
| 0GTC | SRKQ | Masculino | 1 | 1 | 2 |
| 0GY6 | HIGT | Masculino | 6 | 4 | 2 |
| 0J99 | KRYG | Masculino | 1 | 0 | 0 |
H0(Hipótese nula) = Os dados possuem uma distribuição normal.
H1(Hipótese alternativa) = Os dados não possuem a distribuição normal.
se p-valor for menor que o alpha rejeita-se a hipótese nula, ou seja, os dados não possuem distribuição normal, então aplica-se os testes não paramétricos
| W | P-valor | |
|---|---|---|
| Convulsões_PT | 0.66572 | p-valor < 2.2e-16 |
| Convulsões_S1 | 0.72572 | p-valor < 2.2e-16 |
| $Convulsões_S6 | 0.72502 | p-valor < 2.2e-16 |
os resultados dos testes de normalidade de Shapiro-Wilk para cada variável (Convulsões_PT, Convulsões_S1 e Convulsões_S6). Cada teste fornece uma estatística W e um valor-p associado. No caso, todos os valores-p são muito pequenos, indicando evidências fortes contra a hipótese nula de que os dados seguem uma distribuição normal.
| Valor da estatística de teste F. | Valor p associado ao teste de hipótese | |
|---|---|---|
| Convulsões_PT | 1.1297 | 0.2888 |
| Convulsões_S1 | 0.2376 | 0.6263 |
| $Convulsões_S6 | 0.1033 | 0.7482 |
resultado do teste de Levene para verificar a homogeneidade de variâncias entre os grupos. O valor-p associado ao teste é 0.2888, o que indica que não há evidências significativas para rejeitar a hipótese nula de que as variâncias são iguais entre os grupos.
Portanto, com base nos resultados dos testes de normalidade e do teste de Levene, podemos concluir que as variáveis não seguem uma distribuição normal, mas as variâncias são aproximadamente homogêneas entre os grupos.
dados <- read_csv("teste_wilcoxon - Cópia de Banco de Dados 4.csv 1.csv",
col_types = cols(Convulsões_PT = col_integer(),
Convulsões_S1 = col_integer(), Convulsões_S6 = col_integer()))
resultado <- wilcox.test(dados$Convulsões_PT, dados$Convulsões_S1, paired = TRUE)
# Extrair as estatísticas do resultado do teste de Wilcoxon
p_valor <- resultado$p.value
estatisticas <- c(Estatística = resultado$statistic, p_valor = p_valor)
# Criar uma tabela com as estatísticas
tabela_resultado <- as.data.frame(estatisticas)
# Imprimir a tabela
knitr::kable(tabela_resultado, caption = "Resultado do Teste de Wilcoxon")
| estatisticas | |
|---|---|
| Estatística.V | 1.46255e+04 |
| p_valor | 1.31000e-05 |
Estatística.V: Refere-se à estatística do teste de Wilcoxon. Nesse caso específico, a estatística do teste é 1.46255e+04.
p_valor: Refere-se ao valor-p, que é a probabilidade de obter uma estatística do teste igual ou mais extrema do que a observada, assumindo que a hipótese nula é verdadeira. Nesse caso, o valor-p é 1.31000e-05, o que indica que é extremamente improvável (muito pequeno) obter uma estatística de teste tão ou mais extrema do que a observada se a hipótese nula fosse verdadeira.
Com base nesses resultados, geralmente com um valor-p tão baixo, menor que o nível de significância escolhido (geralmente 0,05), rejeitaríamos a hipótese nula e concluiríamos que há evidências suficientes para suportar a hipótese alternativa.
dados$dif <- dados$Convulsões_PT - dados$Convulsões_S1
dados3 <- kable(head(dados, n = 10, col.names = c("ID_Paciente",
"ID_Médico",
"Gênero",
"Convulsões_PT",
"Convulsões_S1",
"Convulsões_S6")))
#exibindo em tabela responsiva
kable_styling(dados3, full_width = F, bootstrap_options =
c("striped", "hover", "condensed", "responsive"))
| ID_Paciente | ID_Médico | Gênero | Convulsões_PT | Convulsões_S1 | Convulsões_S6 | dif |
|---|---|---|---|---|---|---|
| 382 | HQQS | Masculino | 3 | 3 | 3 | 0 |
| 06YO | IKGU | Masculino | 4 | 5 | 4 | -1 |
| 07GL | VLDP | Masculino | 3 | 1 | 2 | 2 |
| 07IT | SRKQ | Masculino | 7 | 7 | 4 | 0 |
| 827 | WGSX | Feminino | 1 | 3 | 3 | -2 |
| 885 | QYJV | Masculino | 4 | 1 | 1 | 3 |
| 968 | RCGB | Feminino | 3 | 6 | 5 | -3 |
| 0GTC | SRKQ | Masculino | 1 | 1 | 2 | 0 |
| 0GY6 | HIGT | Masculino | 6 | 4 | 2 | 2 |
| 0J99 | KRYG | Masculino | 1 | 0 | 0 | 1 |
dados$Dif <- dados$Convulsões_PT - dados$Convulsões_S1
resultado <- dados %>% get_summary_stats(Convulsões_PT,Convulsões_S1,Dif, type = "median_iqr")
dados4 <- kable(head(resultado, n = 10, col.names = c("Convulsões_PT",
"Convulsões_S1",
"Dif")))
#exibindo em tabela responsiva
kable_styling(dados4, full_width = F, bootstrap_options =
c("striped", "hover", "condensed", "responsive"))
| variable | n | median | iqr |
|---|---|---|---|
| Convulsões_PT | 275 | 3 | 5 |
| Convulsões_S1 | 275 | 3 | 3 |
| Dif | 275 | 1 | 3 |
Os dados analisados incluem três variáveis: ‘Convulsões_PT’, ‘Convulsões_S1’ e ‘Dif’. Para cada variável, foram calculadas medidas de resumo com base nas observações disponíveis. O número total de observações para cada variável foi de 275.
Para a variável ‘Convulsões_PT’, a mediana foi de 3 e o intervalo interquartil (IQR) foi de 5. Isso indica que metade das observações ficou abaixo de 3 e a faixa que abrange 50% dos dados se estende de -2 a 3, aproximadamente.
No caso da variável ‘Convulsões_S1’, a mediana foi de 3 e o IQR foi de 3. Isso significa que metade das observações ficou abaixo de 3 e a faixa que abrange 50% dos dados se estende de 1,5 a 4,5, aproximadamente.
Por fim, para a variável ‘Dif’, a mediana foi de 1 e o IQR foi de 3. Isso indica que metade das observações apresentou diferença positiva de até 1 e a faixa que abrange 50% dos dados se estende de -2 a 2, aproximadamente.
Essas medidas de resumo fornecem uma visão geral das características das distribuições das variáveis analisadas.
FIRMINO, Maria José de Almeida Caetano de Sousa. Testes de hipóteses: Uma abordagem não paramétrica. 2015. Tese de Doutorado. Disponível em: https://repositorio.ul.pt/handle/10451/18146 Acesso: 07 JUL 2023
https://www.statstest.com/single-sample-wilcoxon-signed-rank-test/