Diferenças entre Dois Grupos

Prof. Letícia Raposo

UNIRIO

🎯 Objetivo da aula

  • Aprender os testes paramétricos e não paramétricos para avaliar diferenças entre dois grupos.

🙇🏻 Vamos imaginar a seguinte situação…


Medimos a altura de 100 indivíduos: 50 mulheres (grupo A) e 50 homens (grupo B).
Será que a altura média das mulheres (\(m_{A}\)) é significativamente diferente da altura média dos homens (\(m_{B}\))?

Introdução

  • Observaremos estatísticas que nos dizem se duas condições (ou grupos) diferem entre si em uma ou mais variáveis. As duas condições podem ser:
    • O mesmo grupo de pessoas/elementos testado em duas condições (tradicionalmente chamadas de A e B) - grupos pareados;
    • Dois grupos diferentes de pessoas/elementos que foram submetidos à condição A ou à condição B - grupos independentes.

Uma variável quantitativa e uma variável qualitativa com duas categorias.

Grupos Independentes

  • Teste t de Student (paramétrico)
  • Teste U de Mann-Whitney (não paramétrico)

Teste t de Student

  • O teste t de duas amostras não pareadas é usado para comparar a média de dois grupos independentes.
  • Desenvolvido por William Sealy Gosset, em 1908, como forma de controlar a qualidade das cervejas escuras.

Pressupostos do teste t

  • Variável dependente: intervalar/razão e contínua;
  • Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
  • Dados de cada grupo normalmente distribuídos;
  • Os dois grupos precisam ter a mesma variância - caso não assumam variâncias iguais, usaremos teste t de Welch;
  • As observações entre grupos são independentes, ou seja, dados não pareados;
  • A assimetria moderada é permitida se a distribuição de dados for unimodal sem outliers.

Hipóteses do teste t

H0: as médias das populações das quais os dados foram amostrados para cada grupo são iguais.

HA (bilateral)*: as médias das populações das quais os dados foram amostrados para cada grupo não são iguais.

Como o teste t funciona?

  • A estatística do teste (\(t\)) é calculada usando uma fórmula que tem a diferença entre as médias no numerador \(m_{A} - m_{B}\); isso faz com que \(t\) fique maior à medida que as médias se afastam.
  • O denominador é o erro padrão da diferença das médias \(\sqrt{\frac{S^{2}}{n_{A}}+\frac{S^{2}}{n_{B}}}\), que diminui à medida que as variâncias das amostras diminuem ou os tamanhos das amostras aumentam.
  • Assim, \(t\) aumenta à medida que as médias se afastam, as variâncias diminuem ou o tamanho da amostra aumenta.

Como interpretar os resultados do teste t?

Se \(p \leq 0,05\), podemos rejeitar H0 e ficarmos com H1. Em outras palavras, podemos concluir que os valores médios dos grupos A e B são significativamente diferentes.

Teste U de Mann-Whitney

  • Também conhecido por teste da soma dos postos de Wilcoxon, teste de Wilcoxon-Mann-Whitney ou teste de Mann-Whitney.
  • Alternativa não-paramétrica ao teste t de duas amostras independentes.
  • É usado quando seus dados não são normalmente distribuídos.
  • Não aborda hipóteses sobre as medianas dos grupos. O teste avalia se é provável que uma observação em um grupo seja maior do que uma observação no outro.

Pressupostos do teste U de Mann-Whitney

  • Variável dependente: intervalar/razão;
  • Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
  • As observações entre grupos são independentes, ou seja, dados não pareados.

Hipóteses do teste U de Mann-Whitney

H0: os dois grupos são amostrados de populações com distribuições idênticas.

HA: os dois grupos são amostrados de populações com distribuições diferentes.

Como o teste U de Mann-Whitney funciona?

  • Usa-se os postos (posições) para se calcular a estatística do teste.
  • Os escores são postos atribuídos aos grupos em conjunto.
  • Isso é feito ordenando-se esses valores, do menor para o maior, independentemente do fato de qual população cada valor provém.
  • A partir deles, é encontrado um posto médio para cada grupo. Se não existem diferenças significativas entre os grupos A e B, então os postos devem ser igualmente distribuídos nas duas condições.

Como interpretar os resultados do teste U de Mann-Whitney?

Se \(p \leq 0,05\), podemos rejeitar H0 e ficarmos com H1. Em outras palavras, podemos concluir que os valores médios dos postos dos grupos A e B são significativamente diferentes.

🙇🏻 Vamos imaginar outra seguinte situação…


Imagine que 30 pessoas receberam um plano de emagrecimento durante três meses. Medimos o peso antes do início do plano e três meses depois do plano.
Será que o peso médio depois do plano de emagrecimento (\(m_{D}\)) é significativamente diferente do peso médio antes do plano de emagrecimento (\(m_{A}\))?

Grupos Pareados

  • Teste t pareado (paramétrico)
  • Teste de Wilcoxon (não paramétrico)

Teste t pareado

  • Usado para comparar as médias entre dois grupos de amostras relacionadas.
  • Nesse caso, você tem dois valores (ou seja, par de valores) para as mesmas amostras.

Pressupostos do teste t pareado

  • Variável dependente: intervalar/razão e contínua;
  • Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
  • A distribuição da diferença das medições pareadas é normalmente distribuída;
  • As observações entre grupos são pareadas;
  • A assimetria moderada é permitida se a distribuição de dados for unimodal sem outliers.

Pressupostos do teste t pareado

  • O teste t pareado não assume que as observações dentro de cada grupo sejam normais, apenas que as diferenças são normais.
  • E não assume que os grupos sejam homoscedásticos, ou seja, você não precisa aplicar o teste de Levene para realizar um teste t pareado.

Hipóteses do teste t pareado

H0: a média populacional das diferenças entre as observações pareadas é igual a zero.

HA (bilateral)*: a média populacional das diferenças entre as observações pareadas não é igual a zero.

Como o teste t pareado funciona?

  • Primeiramente, calculamos a diferença (\(d\)) entre cada par de valores.
  • Em seguida, a média (\(m\)) e o desvio-padrão de \(d\) são obtidos.
  • Usa-se um teste t para comparar a média das diferenças a 0.

Como interpretar os resultados do teste t pareado?

Se o valor-p for inferior ou igual a 0,05, podemos concluir que a diferença entre as duas amostras pareadas é significativamente diferente.

Teste dos postos sinalizados de Wilcoxon

  • Alternativa não-paramétrica ao teste t pareado.
  • É usado quando os dados não são normalmente distribuídos.
  • Ele se baseia nos postos das diferenças intrapares.

Pressupostos do teste de Wilcoxon

  • Variável dependente: intervalar/razão;
  • Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
  • As observações entre grupos são pareadas.

Hipóteses do teste de Wilcoxon

H0: a população das diferenças de valores pareados é simétrica em torno de zero.

HA (bilateral): a população das diferenças de valores pareados não é simétrica em torno de zero.

Como o teste de Wilcoxon funciona?

  • O teste compara os valores de cada par de observações no sentido de verificar se existem diferenças significativas entre os seus resultados nas duas situações.
  • A princípio são calculados os valores numéricos da diferença entre cada par, sendo possível três condições: aumento (+), diminuição (-) ou igualdade (=).
  • Uma vez calculadas todas as diferenças entre os valores obtidos para cada par de dados, ranqueia-se, de forma crescente, os valores absolutos das diferenças entre as observações, da menor para a maior.
  • Em caso de empate, calcula-se a média das duas posições seguintes e a mesma é atribuída aos valores de empate.
  • O ordenamento é depois apresentado separadamente para os resultados positivos e negativos.
  • A menor dessas duas somas é a estatística do teste, W.

Como interpretar os resultados do teste de Wilcoxon?

  • Se o valor-p for inferior ou igual ao nível de significância de 0,05, podemos rejeitar a H0.
  • Resultados significativos podem ser relatados como: “Os valores para o grupo A foram significativamente diferentes daqueles do grupo B.”

📚 Referências bibliográficas

  • BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Ed. UFSC, 2008.

  • DANCEY, Christine P.; REIDY, John G.; ROWE, Richard. Estatística Sem Matemática para as Ciências da Saúde. Penso Editora, 2017.

  • HAIR, J. F. et al. Multivariate data analysis. Cengage. Hampshire, United Kingdom, 2019.