🎯 Objetivo da aula
- Aprender os testes paramétricos e não paramétricos para avaliar diferenças entre dois grupos.
🙇🏻 Vamos imaginar a seguinte situação…
Medimos a altura de 100 indivíduos: 50 mulheres (grupo A) e 50 homens (grupo B).
Será que a altura média das mulheres (\(m_{A}\)) é significativamente diferente da altura média dos homens (\(m_{B}\))?
Introdução
- Observaremos estatísticas que nos dizem se duas condições (ou grupos) diferem entre si em uma ou mais variáveis. As duas condições podem ser:
- O mesmo grupo de pessoas/elementos testado em duas condições (tradicionalmente chamadas de A e B) - grupos pareados;
- Dois grupos diferentes de pessoas/elementos que foram submetidos à condição A ou à condição B - grupos independentes.
Uma variável quantitativa e uma variável qualitativa com duas categorias.
Grupos Independentes
- Teste t de Student (paramétrico)
- Teste U de Mann-Whitney (não paramétrico)
Teste t de Student
- O teste t de duas amostras não pareadas é usado para comparar a média de dois grupos independentes.
- Desenvolvido por William Sealy Gosset, em 1908, como forma de controlar a qualidade das cervejas escuras.
Pressupostos do teste t
- Variável dependente: intervalar/razão e contínua;
- Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
- Dados de cada grupo normalmente distribuídos;
- Os dois grupos precisam ter a mesma variância - caso não assumam variâncias iguais, usaremos teste t de Welch;
- As observações entre grupos são independentes, ou seja, dados não pareados;
- A assimetria moderada é permitida se a distribuição de dados for unimodal sem outliers.
Hipóteses do teste t
H0: as médias das populações das quais os dados foram amostrados para cada grupo são iguais.
HA (bilateral)*: as médias das populações das quais os dados foram amostrados para cada grupo não são iguais.
Como o teste t funciona?
- A estatística do teste (\(t\)) é calculada usando uma fórmula que tem a diferença entre as médias no numerador \(m_{A} - m_{B}\); isso faz com que \(t\) fique maior à medida que as médias se afastam.
- O denominador é o erro padrão da diferença das médias \(\sqrt{\frac{S^{2}}{n_{A}}+\frac{S^{2}}{n_{B}}}\), que diminui à medida que as variâncias das amostras diminuem ou os tamanhos das amostras aumentam.
- Assim, \(t\) aumenta à medida que as médias se afastam, as variâncias diminuem ou o tamanho da amostra aumenta.
Como interpretar os resultados do teste t?
Se \(p \leq 0,05\), podemos rejeitar H0 e ficarmos com H1. Em outras palavras, podemos concluir que os valores médios dos grupos A e B são significativamente diferentes.
Teste U de Mann-Whitney
- Também conhecido por teste da soma dos postos de Wilcoxon, teste de Wilcoxon-Mann-Whitney ou teste de Mann-Whitney.
- Alternativa não-paramétrica ao teste t de duas amostras independentes.
- É usado quando seus dados não são normalmente distribuídos.
- Não aborda hipóteses sobre as medianas dos grupos. O teste avalia se é provável que uma observação em um grupo seja maior do que uma observação no outro.
Pressupostos do teste U de Mann-Whitney
- Variável dependente: intervalar/razão;
- Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
- As observações entre grupos são independentes, ou seja, dados não pareados.
Hipóteses do teste U de Mann-Whitney
H0: os dois grupos são amostrados de populações com distribuições idênticas.
HA: os dois grupos são amostrados de populações com distribuições diferentes.
Como o teste U de Mann-Whitney funciona?
- Usa-se os postos (posições) para se calcular a estatística do teste.
- Os escores são postos atribuídos aos grupos em conjunto.
- Isso é feito ordenando-se esses valores, do menor para o maior, independentemente do fato de qual população cada valor provém.
- A partir deles, é encontrado um posto médio para cada grupo. Se não existem diferenças significativas entre os grupos A e B, então os postos devem ser igualmente distribuídos nas duas condições.
Como interpretar os resultados do teste U de Mann-Whitney?
Se \(p \leq 0,05\), podemos rejeitar H0 e ficarmos com H1. Em outras palavras, podemos concluir que os valores médios dos postos dos grupos A e B são significativamente diferentes.
🙇🏻 Vamos imaginar outra seguinte situação…
Imagine que 30 pessoas receberam um plano de emagrecimento durante três meses. Medimos o peso antes do início do plano e três meses depois do plano.
Será que o peso médio depois do plano de emagrecimento (\(m_{D}\)) é significativamente diferente do peso médio antes do plano de emagrecimento (\(m_{A}\))?
Grupos Pareados
- Teste t pareado (paramétrico)
- Teste de Wilcoxon (não paramétrico)
Teste t pareado
- Usado para comparar as médias entre dois grupos de amostras relacionadas.
- Nesse caso, você tem dois valores (ou seja, par de valores) para as mesmas amostras.
Pressupostos do teste t pareado
- Variável dependente: intervalar/razão e contínua;
- Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
- A distribuição da diferença das medições pareadas é normalmente distribuída;
- As observações entre grupos são pareadas;
- A assimetria moderada é permitida se a distribuição de dados for unimodal sem outliers.
Pressupostos do teste t pareado
- O teste t pareado não assume que as observações dentro de cada grupo sejam normais, apenas que as diferenças são normais.
- E não assume que os grupos sejam homoscedásticos, ou seja, você não precisa aplicar o teste de Levene para realizar um teste t pareado.
Hipóteses do teste t pareado
H0: a média populacional das diferenças entre as observações pareadas é igual a zero.
HA (bilateral)*: a média populacional das diferenças entre as observações pareadas não é igual a zero.
Como o teste t pareado funciona?
- Primeiramente, calculamos a diferença (\(d\)) entre cada par de valores.
- Em seguida, a média (\(m\)) e o desvio-padrão de \(d\) são obtidos.
- Usa-se um teste t para comparar a média das diferenças a 0.
Como interpretar os resultados do teste t pareado?
Se o valor-p for inferior ou igual a 0,05, podemos concluir que a diferença entre as duas amostras pareadas é significativamente diferente.
Teste dos postos sinalizados de Wilcoxon
- Alternativa não-paramétrica ao teste t pareado.
- É usado quando os dados não são normalmente distribuídos.
- Ele se baseia nos postos das diferenças intrapares.
Pressupostos do teste de Wilcoxon
- Variável dependente: intervalar/razão;
- Variável independente: qualitativa com dois níveis, ou seja, dois grupos;
- As observações entre grupos são pareadas.
Hipóteses do teste de Wilcoxon
H0: a população das diferenças de valores pareados é simétrica em torno de zero.
HA (bilateral): a população das diferenças de valores pareados não é simétrica em torno de zero.
Como o teste de Wilcoxon funciona?
- O teste compara os valores de cada par de observações no sentido de verificar se existem diferenças significativas entre os seus resultados nas duas situações.
- A princípio são calculados os valores numéricos da diferença entre cada par, sendo possível três condições: aumento (+), diminuição (-) ou igualdade (=).
- Uma vez calculadas todas as diferenças entre os valores obtidos para cada par de dados, ranqueia-se, de forma crescente, os valores absolutos das diferenças entre as observações, da menor para a maior.
- Em caso de empate, calcula-se a média das duas posições seguintes e a mesma é atribuída aos valores de empate.
- O ordenamento é depois apresentado separadamente para os resultados positivos e negativos.
- A menor dessas duas somas é a estatística do teste, W.
Como interpretar os resultados do teste de Wilcoxon?
- Se o valor-p for inferior ou igual ao nível de significância de 0,05, podemos rejeitar a H0.
- Resultados significativos podem ser relatados como: “Os valores para o grupo A foram significativamente diferentes daqueles do grupo B.”
📚 Referências bibliográficas
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Ed. UFSC, 2008.
DANCEY, Christine P.; REIDY, John G.; ROWE, Richard. Estatística Sem Matemática para as Ciências da Saúde. Penso Editora, 2017.
HAIR, J. F. et al. Multivariate data analysis. Cengage. Hampshire, United Kingdom, 2019.