Diferenças entre Grupos

Prof. Letícia Raposo

UNIRIO

🙇🏻 Vamos imaginar a seguinte situação…


Medimos a altura de 100 indivíduos: 50 mulheres (grupo A) e 50 homens (grupo B).
Será que a altura média das mulheres (\(m_{A}\)) é significativamente diferente da altura média dos homens (\(m_{B}\))?

Introdução

  • Observaremos estatísticas que nos dizem se duas condições (ou grupos) diferem entre si em uma ou mais variáveis. As duas condições podem ser:
    • O mesmo grupo de pessoas/elementos testado em duas condições (tradicionalmente chamadas de A e B) - grupos pareados;
    • Dois grupos diferentes de pessoas/elementos que foram submetidos à condição A ou à condição B - grupos independentes.

Uma variável quantitativa e uma variável qualitativa com duas categorias.

Grupos Independentes

  • Teste t de Student (paramétrico)
  • Teste U de Mann-Whitney (não paramétrico)

Teste t de Student

  • O teste t de duas amostras não pareadas é usado para comparar a média de dois grupos independentes.
  • Desenvolvido por William Sealy Gosset, em 1908, como forma de controlar a qualidade das cervejas escuras.

William Gosset (1876 - 1937)

Pressupostos do teste t

  • Variável dependente: intervalar/razão e contínua;
  • Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
  • Dados de cada grupo normalmente distribuídos;
  • Os dois grupos precisam ter a mesma variância - caso não assumam variâncias iguais, usaremos teste t de Welch;
  • As observações entre grupos são independentes, ou seja, dados não pareados;
  • A assimetria moderada é permitida se a distribuição de dados for unimodal sem outliers.

Hipóteses do teste t

H0: as médias das populações das quais os dados foram amostrados para cada grupo são iguais.

HA (bilateral)*: as médias das populações das quais os dados foram amostrados para cada grupo não são iguais.

Como o teste t funciona?

  • A estatística do teste (\(t\)) é calculada usando uma fórmula que tem a diferença entre as médias no numerador \(m_{A} - m_{B}\); isso faz com que \(t\) fique maior à medida que as médias se afastam.
  • O denominador é o erro padrão da diferença das médias \(\sqrt{\frac{S^{2}}{n_{A}}+\frac{S^{2}}{n_{B}}}\), que diminui à medida que as variâncias das amostras diminuem ou os tamanhos das amostras aumentam.
  • Assim, \(t\) aumenta à medida que as médias se afastam, as variâncias diminuem ou o tamanho da amostra aumenta.

Como interpretar os resultados do teste t?

Se \(p \leq 0,05\), podemos rejeitar H0 e ficarmos com H1. Em outras palavras, podemos concluir que os valores médios dos grupos A e B são significativamente diferentes.

Teste U de Mann-Whitney

Henry Mann (1905 - 2000)

Donald Whitney (1915 - 2007)

Teste U de Mann-Whitney

  • Também conhecido por teste da soma dos postos de Wilcoxon, teste de Wilcoxon-Mann-Whitney ou teste de Mann-Whitney.
  • Alternativa não-paramétrica ao teste t de duas amostras independentes.
  • É usado quando seus dados não são normalmente distribuídos.
  • Não aborda hipóteses sobre as medianas dos grupos. O teste avalia se é provável que uma observação em um grupo seja maior do que uma observação no outro.

Pressupostos do teste U de Mann-Whitney

  • Variável dependente: intervalar/razão;
  • Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
  • As observações entre grupos são independentes, ou seja, dados não pareados.

Hipóteses do teste U de Mann-Whitney

H0: os dois grupos são amostrados de populações com distribuições idênticas.

HA: os dois grupos são amostrados de populações com distribuições diferentes.

Como o teste U de Mann-Whitney funciona?

  • Usa-se os postos (posições) para se calcular a estatística do teste.
  • Os escores são postos atribuídos aos grupos em conjunto.
  • Isso é feito ordenando-se esses valores, do menor para o maior, independentemente do fato de qual população cada valor provém.
  • A partir deles, é encontrado um posto médio para cada grupo. Se não existem diferenças significativas entre os grupos A e B, então os postos devem ser igualmente distribuídos nas duas condições.

Como interpretar os resultados do teste U de Mann-Whitney?

Se \(p \leq 0,05\), podemos rejeitar H0 e ficarmos com H1. Em outras palavras, podemos concluir que os valores médios dos postos dos grupos A e B são significativamente diferentes.

🙇🏻 Vamos imaginar outra seguinte situação…


Imagine que 30 pessoas receberam um plano de emagrecimento durante três meses. Medimos o peso antes do início do plano e três meses depois do plano.
Será que o peso médio depois do plano de emagrecimento (\(m_{D}\)) é significativamente diferente do peso médio antes do plano de emagrecimento (\(m_{A}\))?

Grupos Pareados

  • Teste t pareado (paramétrico)
  • Teste de Wilcoxon (não paramétrico)

Teste t pareado

  • Usado para comparar as médias entre dois grupos de amostras relacionadas.
  • Nesse caso, você tem dois valores (ou seja, par de valores) para as mesmas amostras.

Pressupostos do teste t pareado

  • Variável dependente: intervalar/razão e contínua;
  • Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
  • A distribuição da diferença das medições pareadas é normalmente distribuída;
  • As observações entre grupos são pareadas;
  • A assimetria moderada é permitida se a distribuição de dados for unimodal sem outliers.

Pressupostos do teste t pareado

  • O teste t pareado não assume que as observações dentro de cada grupo sejam normais, apenas que as diferenças são normais.
  • E não assume que os grupos sejam homoscedásticos, ou seja, você não precisa aplicar o teste de Levene para realizar um teste t pareado.

Hipóteses do teste t pareado

H0: a média populacional das diferenças entre as observações pareadas é igual a zero.

HA (bilateral)*: a média populacional das diferenças entre as observações pareadas não é igual a zero.

Como o teste t pareado funciona?

  • Primeiramente, calculamos a diferença (\(d\)) entre cada par de valores.
  • Em seguida, a média (\(m\)) e o desvio-padrão de \(d\) são obtidos.
  • Usa-se um teste t para comparar a média das diferenças a 0.

Como interpretar os resultados do teste t pareado?

Se o valor-p for inferior ou igual a 0,05, podemos concluir que a diferença entre as duas amostras pareadas é significativamente diferente.

Teste dos postos sinalizados de Wilcoxon

Frank Wilcoxon (1892 - 1965)

Teste dos postos sinalizados de Wilcoxon

  • Alternativa não-paramétrica ao teste t pareado.
  • É usado quando os dados não são normalmente distribuídos.
  • Ele se baseia nos postos das diferenças intrapares.

Pressupostos do teste de Wilcoxon

  • Variável dependente: intervalar/razão;
  • Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
  • As observações entre grupos são pareadas.

Hipóteses do teste de Wilcoxon

H0: a população das diferenças de valores pareados é simétrica em torno de zero.

HA (bilateral): a população das diferenças de valores pareados não é simétrica em torno de zero.

Como o teste de Wilcoxon funciona?

  • O teste compara os valores de cada par de observações no sentido de verificar se existem diferenças significativas entre os seus resultados nas duas situações.
  • A princípio são calculados os valores numéricos da diferença entre cada par, sendo possível três condições: aumento (+), diminuição (-) ou igualdade (=).
  • Uma vez calculadas todas as diferenças entre os valores obtidos para cada par de dados, ranqueia-se, de forma crescente, os valores absolutos das diferenças entre as observações, da menor para a maior.
  • Em caso de empate, calcula-se a média das duas posições seguintes e a mesma é atribuída aos valores de empate.
  • O ordenamento é depois apresentado separadamente para os resultados positivos e negativos.
  • A menor dessas duas somas é a estatística do teste, W.

Como interpretar os resultados do teste de Wilcoxon?

  • Se o valor-p for inferior ou igual ao nível de significância de 0,05, podemos rejeitar a H0.
  • Resultados significativos podem ser relatados como: “Os valores para o grupo A foram significativamente diferentes daqueles do grupo B.”

🙇🏻 Vamos imaginar a seguinte situação…


Obtivemos a nota da avaliação de Estatística de 150 estudantes: 50 do curso de Biologia (grupo A), 50 do curso de Biomedicina (grupo B) e 50 do grupo de Medicina (grupo C).
Será que algum grupo difere quanto à média das notas? Quem difere de quem?

Introdução

Agora falaremos dos testes utilizados para avaliar se três ou mais condições ou grupos diferem entre si em uma ou mais variáveis.

Uma variável quantitativa e uma variável qualitativa com três ou mais categorias.

Grupos Independentes

  • Análise de variância one-way/de um fator (ANOVA) (paramétrico)
  • Teste de Kruskal-Wallis (não paramétrico)

ANOVA

Ronald Fisher (1890 - 1962)

ANOVA

  • A ANOVA é uma extensão do teste t independente de duas amostras para comparar médias em uma situação em que existem mais de dois grupos.
  • Na ANOVA de um fator, os dados são organizados em vários grupos, com base em uma única variável qualitativa.

Pressupostos da ANOVA

  • Variável dependente é intervalar/razão e contínua;
  • Variável independente é qualitativa com dois ou mais níveis;
  • As observações são obtidas de forma independente e aleatória;
  • Os resíduos são normalmente distribuídos;
  • Os grupos têm a mesma variância, ou seja, homocedasticidade - se tivermos heterocedasticidade, usaremos ANOVA com Welch.

Hipóteses da ANOVA

H0: as médias dos diferentes grupos são as mesmas.

HA (teste bilateral*): pelo menos uma das médias não é igual às outras.

Como a ANOVA funciona?

Suponha que temos 3 grupos (A, B, C) para comparar.

  1. Calcule a variância comum, chamada de variância dentro dos grupos (\(S^{2}_{within}\)) ou variância residual.
  • Essa variância é decorrente de alguma variação que existe dentro de cada um dos grupos e que não pode ser explicada pelo fator.

Como a ANOVA funciona?

  1. Calcule a variância entre as médias dos grupos da seguinte maneira:
  • Calcule a média de cada grupo;
  • Calcule a variância entre as médias dos grupos (\(S^{2}_{between}\)). Essa variação é devido ao fator.

Como a ANOVA funciona?

  1. Calcule a estatística F como a razão de (\(S^{2}_{between}/S^{2}_{within}\)).
  • Observe que uma razão F mais baixa (razão \(<1\)) indica que não há diferença significativa entre as médias dos grupos que estão sendo comparados.
  • Uma proporção mais alta implica que a variação entre as médias dos grupos é significativa.

Como interpretar os resultados da ANOVA?

Após realizarmos o teste, se encontrarmos um valor-p abaixo do nível de significância, podemos dizer que “diferenças significativas foram encontradas entre as médias dos grupos”.


Mas qual grupo difere? Todos diferem entre si?

Teste post-hoc

A forma de averiguar quais grupos diferem entre si é aplicar um teste post-hoc à ANOVA, por meio da utilização do teste de comparação múltipla, como por exemplo, o teste de Tukey.

John Tukey (1915 - 2000)

Teste de Kruskal-Wallis

Willian Kruskal (1919 - 2005)

Wilson Wallis (1912 - 1998)

Teste de Kruskal-Wallis

  • Teste baseado em ranqueamento, sendo uma alternativa não paramétrica à ANOVA de um fator, semelhante ao teste U de Mann-Whitney.
  • O teste não apresenta suposições sobre a distribuição dos dados e não aborda hipóteses sobre as medianas dos grupos.
  • Em vez disso, o teste aborda se é provável que uma observação em um grupo seja maior que uma observação no outro.

Pressupostos do teste de Kruskal-Wallis

  • Variável independente é intervalar/razão e contínua;
  • Variável dependente é qualitativa com dois ou mais níveis.

Hipóteses do teste de Kruskal-Wallis

H0: os grupos são amostrados de populações com distribuições idênticas.

HA (teste bilateral): os grupos são amostrados de populações com diferentes distribuições.

Como o teste de Kruskal-Wallis

  • O teste atribui um ranqueamento no conjunto de dados geral para cada valor de medição.
  • O menor valor obtém um ranqueamento igual a 1, o segundo menor obtém um ranqueamento igual a 2, etc. As observações com mesmos valores obtêm ranqueamentos médios.
  • Calcula-se a soma dos ranqueamentos para cada grupo e, em seguida, a estatística de teste, H.

Como interpretar os resultados do teste de Kruskal-Wallis?

Se \(p \leq 0,05\), podemos rejeitar H0 e ficarmos com H1. Em outras palavras, podemos dizer que “houve uma diferença significativa nos valores entre os grupos”.


Mas novamente caímos na situação: qual ou quais grupos diferem?

Teste post-hoc

A forma de averiguar quais grupos diferem entre si é aplicar um teste post-hoc ao Kruskal-Wallis, por meio da utilização do teste de comparação múltipla, como por exemplo, o teste de Dunn.

Olive Dunn (1915 - 2008)

📚 Referências bibliográficas

  • BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Ed. UFSC, 2008.

  • DANCEY, Christine P.; REIDY, John G.; ROWE, Richard. Estatística Sem Matemática para as Ciências da Saúde. Penso Editora, 2017.

  • HAIR, J. F. et al. Multivariate data analysis. Cengage. Hampshire, United Kingdom, 2019.