INTRODUÇÃO

Teste de hipótese

O objetivo de um teste de hipóteses é determinar se uma hipótese ou conjectura que fazemos acerca de um parâmetro de uma população é plausível.

Hipótese nula: Corresponde à situação que não há mudança da afirmação. Hipótese alternativa: Corresponde à mudança na afirmação do estudo.

Ao tomar uma decisão sobre H0 pode-se ocorrer dois erros distintos. O primeiro, classificado como erro tipo I, consiste em rejeitar a hipótese nula quando ela é verdadeira. O segundo, dito erro tipo II, consiste em não rejeitar H0 quando ela é falsa. Aos erros estão associados as probalidades: α e β

H0 Verdadeira H0 falsa
Não Rejeitar Correto Erro tipo II (β)
Rejeitar Erro tipo I (α) Correto

Em relação à probabilidade, α corresponde ao nível de significância do teste. Geralmente, os valores de alpha estão dispostos na tabela abaixo com seus respectivos níveis de confiança:

α 0,01 0,05 0,10
confiança 99% 95% 90%

A potência do teste é dada por (1 - β), sendo β a probabilidade de cometer um erro do tipo II, ou seja, a probabilidade de não rejeição de H0 quando falsa. Quanto menor a probabilidade de β, maior é a potência do teste,

Região crítica

é uma faixa ou conjunto de valores em uma distribuição estatística em que, se a estatística de teste cair dentro dessa faixa, a hipótese nula é rejeitada em favor da hipótese alternativa. A região crítica é determinada com base no nível de significância (alpha) escolhido para o teste.

Regra de decisão

é o critério utilizado para tomar uma decisão sobre a hipótese nula com base nos resultados do teste. A regra de decisão é definida de acordo com a região crítica e o valor-p obtidos.

A regra de decisão comum em testes de hipóteses é a seguinte:

Se o valor-p for menor que o nível de significância (alpha), rejeitamos a hipótese nula em favor da hipótese alternativa. Isso significa que os dados fornecem evidências estatísticas para suportar a hipótese alternativa.

Valor-p <= α

Se o valor-p for maior ou igual ao nível de significância (alpha), não temos evidências estatísticas para rejeitar a hipótese nula. Nesse caso, não podemos concluir que há diferença significativa ou suporte para a hipótese alternativa.

Valor-p >= α

A região crítica e a regra de decisão são usadas para controlar o erro do tipo I (rejeitar erroneamente a hipótese nula quando ela é verdadeira). O nível de significância (alpha) é escolhido com base no equilíbrio desejado entre o controle desse erro e o poder estatístico do teste.

Passo a passo

1.Formular a hipótese nula (H0 ) e a hipótese alternativa H1;

  1. Estabelecer o nível de significância;

  2. Escolher a estatıstica de teste a usar e encontrar qual a sua distribuição de probabilidade supondo que H0 é verdadeira;

  3. Determinar a região de rejeição;

  4. Calcular o valor observado da estatıstica de teste;

  5. Decidir rejeitar H0 ou não rejeitar H0;

  6. Apresentar a conclusão de acordo com o problema.

Testes Paramétricos

Suposições:

Os testes paramétricos assumem que os dados seguem uma distribuição específica, geralmente a distribuição normal (ou gaussiana). Além disso, eles também assumem homogeneidade das variâncias entre os grupos e a presença de uma relação linear entre as variáveis.

Estimação de parâmetros:

Os testes paramétricos estimam parâmetros específicos da distribuição, como a média ou o desvio padrão, para realizar inferências estatísticas.

Eficiência estatística:

Sob as suposições corretas, os testes paramétricos têm maior poder estatístico e eficiência, o que significa que eles podem detectar diferenças menores com uma amostra menor.

Testes Não Paramétricos:

Suposições:

Os testes não paramétricos não fazem suposições específicas sobre a distribuição dos dados. Eles são mais flexíveis e podem ser aplicados em uma ampla variedade de distribuições, incluindo aquelas que não seguem uma distribuição normal. Contínuas, distribuição distorcida, amostra aleatória

Estatísticas de ordem:

Os testes não paramétricos são baseados em estatísticas de ordem, como a classificação dos dados em ordem crescente.

Eficiência estatística:

Em geral, os testes não paramétricos são menos eficientes do que os testes paramétricos quando as suposições paramétricas são atendidas. No entanto, eles são mais robustos e podem fornecer resultados válidos mesmo quando as suposições são violadas.

#lendo o dataset
dados <- read_csv("teste_wilcoxon - Cópia de Banco de Dados 4.csv 1.csv", 
    col_types = cols(Convulsões_PT = col_integer(), 
        Convulsões_S1 = col_integer(), Convulsões_S6 = col_integer()))

O que é o teste de Wilcoxon ou Wilcoxon signed rank test

Sobre o teste de Wilcoxon

O objetivo do teste de Wilcoxon, também conhecido como teste de Wilcoxon de amostras pareadas ou Wilcoxon signed rank test, é verificar se existe diferença significativa entre as medianas de duas amostras relacionadas ou pareadas.

Esse teste é aplicado quando as observações são coletadas em pares, ou seja, cada elemento em uma amostra está relacionado diretamente a um elemento correspondente na outra amostra. O teste de Wilcoxon é uma alternativa ao teste t de Student para amostras pareadas, mas não requer a suposição de normalidade nos dados.

O teste de Wilcoxon avalia a hipótese nula de que não há diferença significativa entre as medianas das duas amostras. A hipótese alternativa é que existe uma diferença significativa.

Ao aplicar o teste de Wilcoxon, o valor p é calculado para determinar se há evidências suficientes para rejeitar a hipótese nula. Se o valor p for menor que o nível de significância pré-definido (geralmente 0,05), então a hipótese nula é rejeitada, indicando que há diferença significativa entre as medianas das amostras. Caso contrário, se o valor p for maior que o nível de significância, não há evidências para rejeitar a hipótese nula, sugerindo que não há diferença significativa entre as medianas.

ID_Paciente ID_Médico Gênero Convulsões_PT Convulsões_S1 Convulsões_S6
382 HQQS Masculino 3 3 3
06YO IKGU Masculino 4 5 4
07GL VLDP Masculino 3 1 2
07IT SRKQ Masculino 7 7 4
827 WGSX Feminino 1 3 3
885 QYJV Masculino 4 1 1
968 RCGB Feminino 3 6 5
0GTC SRKQ Masculino 1 1 2
0GY6 HIGT Masculino 6 4 2
0J99 KRYG Masculino 1 0 0

Para exemplificar

H0(Hipótese nula) = Os dados possuem uma distribuição normal.

H1(Hipótese alternativa) = Os dados não possuem a distribuição normal.

se p-valor for menor que o alpha rejeita-se a hipótese nula, ou seja, os dados não possuem distribuição normal, então aplica-se os testes não paramétricos

Testes de Shapiro-Wilk para normalidade

W P-valor
Convulsões_PT 0.66572 p-valor < 2.2e-16
Convulsões_S1 0.72572 p-valor < 2.2e-16
$Convulsões_S6 0.72502 p-valor < 2.2e-16

os resultados dos testes de normalidade de Shapiro-Wilk para cada variável (Convulsões_PT, Convulsões_S1 e Convulsões_S6). Cada teste fornece uma estatística W e um valor-p associado. No caso, todos os valores-p são muito pequenos, indicando evidências fortes contra a hipótese nula de que os dados seguem uma distribuição normal.

Valor da estatística de teste F. Valor p associado ao teste de hipótese
Convulsões_PT 1.1297 0.2888
Convulsões_S1 0.2376 0.6263
$Convulsões_S6 0.1033 0.7482

resultado do teste de Levene para verificar a homogeneidade de variâncias entre os grupos. O valor-p associado ao teste é 0.2888, o que indica que não há evidências significativas para rejeitar a hipótese nula de que as variâncias são iguais entre os grupos.

Portanto, com base nos resultados dos testes de normalidade e do teste de Levene, podemos concluir que as variáveis não seguem uma distribuição normal, mas as variâncias são aproximadamente homogêneas entre os grupos.

O resultado do teste de Wilcoxon inclui a estatística do teste e o valor-p associado.

dados <- read_csv("teste_wilcoxon - Cópia de Banco de Dados 4.csv 1.csv", 
    col_types = cols(Convulsões_PT = col_integer(), 
        Convulsões_S1 = col_integer(), Convulsões_S6 = col_integer()))

resultado <- wilcox.test(dados$Convulsões_PT, dados$Convulsões_S1, paired = TRUE)

# Extrair as estatísticas do resultado do teste de Wilcoxon
p_valor <- resultado$p.value
estatisticas <- c(Estatística = resultado$statistic, p_valor = p_valor)

# Criar uma tabela com as estatísticas
tabela_resultado <- as.data.frame(estatisticas)

# Imprimir a tabela
knitr::kable(tabela_resultado, caption = "Resultado do Teste de Wilcoxon")
Resultado do Teste de Wilcoxon
estatisticas
Estatística.V 1.46255e+04
p_valor 1.31000e-05
  • Estatística.V: Refere-se à estatística do teste de Wilcoxon. Nesse caso específico, a estatística do teste é 1.46255e+04.

  • p_valor: Refere-se ao valor-p, que é a probabilidade de obter uma estatística do teste igual ou mais extrema do que a observada, assumindo que a hipótese nula é verdadeira. Nesse caso, o valor-p é 1.31000e-05, o que indica que é extremamente improvável (muito pequeno) obter uma estatística de teste tão ou mais extrema do que a observada se a hipótese nula fosse verdadeira.

Com base nesses resultados, geralmente com um valor-p tão baixo, menor que o nível de significância escolhido (geralmente 0,05), rejeitaríamos a hipótese nula e concluiríamos que há evidências suficientes para suportar a hipótese alternativa.

dados$dif <- dados$Convulsões_PT - dados$Convulsões_S1


dados3 <- kable(head(dados, n = 10, col.names = c("ID_Paciente",
                                                "ID_Médico",
                                                "Gênero",
                                                "Convulsões_PT",
                                                "Convulsões_S1",
                                                "Convulsões_S6")))
#exibindo em tabela responsiva 

kable_styling(dados3, full_width = F, bootstrap_options = 
                c("striped", "hover", "condensed", "responsive"))
ID_Paciente ID_Médico Gênero Convulsões_PT Convulsões_S1 Convulsões_S6 dif
382 HQQS Masculino 3 3 3 0
06YO IKGU Masculino 4 5 4 -1
07GL VLDP Masculino 3 1 2 2
07IT SRKQ Masculino 7 7 4 0
827 WGSX Feminino 1 3 3 -2
885 QYJV Masculino 4 1 1 3
968 RCGB Feminino 3 6 5 -3
0GTC SRKQ Masculino 1 1 2 0
0GY6 HIGT Masculino 6 4 2 2
0J99 KRYG Masculino 1 0 0 1
dados$Dif <- dados$Convulsões_PT - dados$Convulsões_S1

resultado <- dados %>% get_summary_stats(Convulsões_PT,Convulsões_S1,Dif, type = "median_iqr")

dados4 <- kable(head(resultado, n = 10, col.names = c("Convulsões_PT",
                                                "Convulsões_S1",
                                                "Dif")))
#exibindo em tabela responsiva 

kable_styling(dados4, full_width = F, bootstrap_options = 
                c("striped", "hover", "condensed", "responsive"))
variable n median iqr
Convulsões_PT 275 3 5
Convulsões_S1 275 3 3
Dif 275 1 3

Os dados analisados incluem três variáveis: ‘Convulsões_PT’, ‘Convulsões_S1’ e ‘Dif’. Para cada variável, foram calculadas medidas de resumo com base nas observações disponíveis. O número total de observações para cada variável foi de 275.

Para a variável ‘Convulsões_PT’, a mediana foi de 3 e o intervalo interquartil (IQR) foi de 5. Isso indica que metade das observações ficou abaixo de 3 e a faixa que abrange 50% dos dados se estende de -2 a 3, aproximadamente.

No caso da variável ‘Convulsões_S1’, a mediana foi de 3 e o IQR foi de 3. Isso significa que metade das observações ficou abaixo de 3 e a faixa que abrange 50% dos dados se estende de 1,5 a 4,5, aproximadamente.

Por fim, para a variável ‘Dif’, a mediana foi de 1 e o IQR foi de 3. Isso indica que metade das observações apresentou diferença positiva de até 1 e a faixa que abrange 50% dos dados se estende de -2 a 2, aproximadamente.

Essas medidas de resumo fornecem uma visão geral das características das distribuições das variáveis analisadas.

Referências

FIRMINO, Maria José de Almeida Caetano de Sousa. Testes de hipóteses: Uma abordagem não paramétrica. 2015. Tese de Doutorado. Disponível em: https://repositorio.ul.pt/handle/10451/18146 Acesso: 07 JUL 2023

https://www.statstest.com/single-sample-wilcoxon-signed-rank-test/

https://www.statstest.com/wilcoxon-signed-rank-test/