Diferenças entre Três ou Mais Grupos

Prof. Letícia Raposo

UNIRIO

🎯 Objetivo da aula

  • Aprender os testes paramétricos e não paramétricos para avaliar diferenças entre três ou mais grupos.

🙇🏻 Vamos imaginar a seguinte situação…


Obtivemos a nota da avaliação de Estatística de 150 estudantes: 50 do curso de Biologia (grupo A), 50 do curso de Biomedicina (grupo B) e 50 do grupo de Medicina (grupo C).
Será que algum grupo difere quanto à média das notas? Quem difere de quem?

Introdução

Agora falaremos dos testes utilizados para avaliar se três ou mais condições ou grupos diferem entre si em uma ou mais variáveis.

Uma variável quantitativa e uma variável qualitativa com três ou mais categorias.

Grupos Independentes

  • Análise de variância one-way/de um fator (ANOVA) (paramétrico)
  • Teste de Kruskal-Wallis (não paramétrico)

ANOVA

  • A ANOVA é uma extensão do teste t independente de duas amostras para comparar médias em uma situação em que existem mais de dois grupos.
  • Na ANOVA de um fator, os dados são organizados em vários grupos, com base em uma única variável qualitativa.

Pressupostos da ANOVA

  • Variável dependente é intervalar/razão e contínua;
  • Variável independente é qualitativa com dois ou mais níveis;
  • As observações são obtidas de forma independente e aleatória;
  • Os resíduos são normalmente distribuídos;
  • Os grupos têm a mesma variância, ou seja, homocedasticidade - se tivermos heterocedasticidade, usaremos ANOVA com Welch.

Hipóteses da ANOVA

H0: as médias dos diferentes grupos são as mesmas.

HA (teste bilateral*): pelo menos uma das médias não é igual às outras.

Como a ANOVA funciona?

Suponha que temos 3 grupos (A, B, C) para comparar.

  1. Calcule a variância comum, chamada de variância dentro dos grupos (\(S^{2}_{within}\)) ou variância residual.
  • Essa variância é decorrente de alguma variação que existe dentro de cada um dos grupos e que não pode ser explicada pelo fator.

Como a ANOVA funciona?

  1. Calcule a variância entre as médias dos grupos da seguinte maneira:
  • Calcule a média de cada grupo;
  • Calcule a variância entre as médias dos grupos (\(S^{2}_{between}\)). Essa variação é devido ao fator.

Como a ANOVA funciona?

  1. Calcule a estatística F como a razão de (\(S^{2}_{between}/S^{2}_{within}\)).
  • Observe que uma razão F mais baixa (razão \(<1\)) indica que não há diferença significativa entre as médias dos grupos que estão sendo comparados.
  • Uma proporção mais alta implica que a variação entre as médias dos grupos é significativa.

Como interpretar os resultados da ANOVA?

Após realizarmos o teste, se encontrarmos um valor-p abaixo do nível de significância, podemos dizer que “diferenças significativas foram encontradas entre as médias dos grupos”.


Mas qual grupo difere? Todos diferem entre si?

Teste post-hoc

A forma de averiguar quais grupos diferem entre si é aplicar um teste post-hoc à ANOVA, por meio da utilização do teste de comparação múltipla, como por exemplo, o teste de Tukey.

Teste de Kruskal-Wallis

  • Teste baseado em ranqueamento, sendo uma alternativa não paramétrica à ANOVA de um fator, semelhante ao teste U de Mann-Whitney.
  • O teste não apresenta suposições sobre a distribuição dos dados e não aborda hipóteses sobre as medianas dos grupos.
  • Em vez disso, o teste aborda se é provável que uma observação em um grupo seja maior que uma observação no outro.

Pressupostos do teste de Kruskal-Wallis

  • Variável independente é intervalar/razão e contínua;
  • Variável dependente é qualitativa com dois ou mais níveis.

Hipóteses do teste de Kruskal-Wallis

H0: os grupos são amostrados de populações com distribuições idênticas.

HA (teste bilateral): os grupos são amostrados de populações com diferentes distribuições.

Como o teste de Kruskal-Wallis

  • O teste atribui um ranqueamento no conjunto de dados geral para cada valor de medição.
  • O menor valor obtém um ranqueamento igual a 1, o segundo menor obtém um ranqueamento igual a 2, etc. As observações com mesmos valores obtêm ranqueamentos médios.
  • Calcula-se a soma dos ranqueamentos para cada grupo e, em seguida, a estatística de teste, H.

Como interpretar os resultados do teste de Kruskal-Wallis?

Se \(p \leq 0,05\), podemos rejeitar H0 e ficarmos com H1. Em outras palavras, podemos dizer que “houve uma diferença significativa nos valores entre os grupos”.


Mas novamente caímos na situação: qual ou quais grupos diferem?

Teste post-hoc

A forma de averiguar quais grupos diferem entre si é aplicar um teste post-hoc ao Kruskal-Wallis, por meio da utilização do teste de comparação múltipla, como por exemplo, o teste de Dunn.

📚 Referências bibliográficas

  • BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Ed. UFSC, 2008.

  • DANCEY, Christine P.; REIDY, John G.; ROWE, Richard. Estatística Sem Matemática para as Ciências da Saúde. Penso Editora, 2017.

  • HAIR, J. F. et al. Multivariate data analysis. Cengage. Hampshire, United Kingdom, 2019.