Tipos de Testes

Paramétricos e Não Paramétricos

Prof. Letícia Raposo

UNIRIO

🎯 Objetivos da aula

  • Aprender os tipos de testes: paramétricos e não paramétricos.
  • Conhecer os pressupostos dos testes paramétricos.
  • Avaliar os pressupostos de normalidade e homocedasticidade.

Testes paramétricos

Testes paramétricos

  • Fazem suposições sobre os parâmetros da população subjacente.
  • São geralmente os mais sensíveis que podemos usar.
  • Usados quando a variável dependente é intervalar/razão.

Suposições dos testes paramétricos

As suposições variam entre os testes, mas seguem uma discussão geral.

  • Amostragem aleatória
  • Distribuição normal dos dados ou resíduos
  • Homogeneidade da variância (homocedasticidade)

Testes não paramétricos

Testes não paramétricos

  • Não têm suposições rígidas sobre as distribuições da população.
  • Geralmente, contêm resultados estatísticos provenientes de suas ordenações, o que os torna mais fáceis de entender.
  • Tendem a ter uma menor probabilidade para detectar um efeito que existe na população de interesse, sendo menos poderosos.

Testes não paramétricos

  • Não fornecem intervalos de confiança (já que para o cálculo desses intervalos, precisamos conhecer a distribuição dos dados).
  • Determinam se há uma diferença sistemática entre os grupos.
    • Isso pode ser devido a uma diferença na localização (por exemplo, mediana) ou na forma ou dispersão da distribuição dos dados.

E como avaliar as suposições de normalidade e homocedasticidade?

Normalidade dos dados

Inspeção visual

Gráfico de densidades: permitirá observarmos se a distribuição da variável quantitativa se assemelha a um sino.

Código em R
library(palmerpenguins)
library(dplyr)
library(ggplot2)
penguins %>%
  ggplot(aes(x = flipper_length_mm)) +
  geom_density(
    position = "identity",
    fill = "purple",
    color = "black",
  ) +
  labs(fill = "Ilhas",
       y = "Densidade",
       x = "Comprimento das nadadeiras dos pinguins (milímetros)",
       title = "Distribuição dos comprimentos das nadadeiras dos pinguins (milímetros)") +
  theme_minimal() 

Inspeção visual

Gráfico Quantil-Quantil (Q-Q) Normal: desenha a relação entre uma determinada amostra e a distribuição normal. Uma linha de referência de 45 graus também é plotada. Se os pontos ficarem muito próximos da linha, temos indícios de que a distribuição segue a normalidade.

Código em R
library(palmerpenguins)
library(car)

qqPlot(penguins$flipper_length_mm)
[1] 216 154

Inspeção visual

Gráfico Quantil-Quantil (Q-Q) Normal: é apenas uma verificação visual, não uma prova, por isso é um tanto subjetivo. Mas nos permite ver rapidamente se nossa suposição é plausível e, se não, como a suposição é violada e quais pontos de dados contribuem para a violação.

Testes de significância

  • Existem vários testes para avaliar normalidade, como o teste de normalidade Kolmogorov-Smirnov (K-S) e o teste de Shapiro-Wilk.
  • São sensíveis ao tamanho da amostra. Amostras pequenas geralmente passam nos testes de normalidade.
    • Importante combinar inspeção visual e teste de significância para tomar a decisão certa.

Teste de Shapiro-Wilk

Para o teste de Shapiro-Wilk, temos:

H0: os dados vêm de uma distribuição normal.

HA: os dados não vêm de uma distribuição normal.

Se o valor-p do teste é menor que o \(\alpha\), temos que os dados não seguem a normalidade. Se valor-p > \(\alpha\), temos dados normais.

Homogeneidade das variâncias

Homogeneidade das variâncias

Outra suposição que muitos testes paramétricos apresentam é a homogeneidade das variâncias entre os grupos (homocedasticidade).

  • Teste F: compara as variâncias de duas amostras. Os dados devem ser normalmente distribuídos.
  • Teste de Bartlett: compara as variâncias de k amostras, em que \(k \geq 2\). Os dados devem ser normalmente distribuídos.
  • Teste de Levene: compara as variâncias de k amostras, em que \(k \geq 2\). É uma alternativa ao teste de Bartlett, sendo menos sensível a desvios da normalidade.

Teste de Levene

Para o teste de Levene, temos:

H0: todas as variâncias populacionais são iguais.

HA: pelo menos uma das variâncias é diferente.

Se o valor-p do teste é menor que o \(\alpha\), temos dados heterocedásticos. Se valor-p > \(\alpha\), temos homocedasticidade.

📚 Referências bibliográficas

  • BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. Ed. UFSC, 2008.

  • DANCEY, Christine P.; REIDY, John G.; ROWE, Richard. Estatística Sem Matemática para as Ciências da Saúde. Penso Editora, 2017.

  • HAIR, J. F. et al. Multivariate data analysis. Cengage. Hampshire, United Kingdom, 2019.