Estatística Não Paramétrica

Filipe Costa

Universidade Federal do Piauí

Introdução

  • “… pode ser definida como uma coleção de métodos estatísticos aplicada a conjuntos de dados onde as suposições distribucionais necessárias para aplicação de uma técnica clássica (Intervalo de Confiança, Teste de Hipótese) não são satisfatoriamente atendidas.”

Por que usar testes não paramétricos?

Vantagens e Desvantagens dos Testes Não Paramétricos
Vantagens Desvantagens
Dispensam normalidade dos dados Desperdício de informações, pois não consideram a magnitude dos dados
O p-valor é exato (no caso paramétrico o cálculo se baseia na distribuição Normal) Menor eficiência quando as suposições do modelo são atendidas
São testes mais simples Utilização das tabelas dos testes é mais complicada
São úteis quando é difícil estabelecer uma escala quantitativa para os dados
São mais eficientes que os paramétricos quando não existe normalidade

Use r

Escolha do Teste Estátistico

  • Poder do Teste: \((1 - \beta)\):
    • Escolher o teste que apresentar a maior probabilidade de rejeitar \(H_{0}\) quando falsa.
  • Plano exprimental (Como a mostra foi captada).
  • Natureza e características da população.
  • Nível de Mensuração.
    • Nominal
    • Ordinal
    • Intervalar

Escolha do Teste Estátistico

Testes para duas Amostras Independentes

Teste de Qui-Quadrado

  • É utilizado para descobrir se a frequência de determinados eventos na sua amostra é puramente obra do acaso ou se existe um padrão/relação real acontecendo.

Abordagens para o teste de Qui-Quadrado:

  • Teste de Independência: Verificar se existe uma associação entre duas variáveis categóricas (ex: gênero e preferência por um produto).
  • Teste de Aderência (Goodness of Fit): Verificar se a distribuição observada de uma variável categórica se encaixa em uma distribuição teórica esperada (ex: distribuição de cores de carros em uma cidade).

Teste de Qui-Quadrado

Formula

\[\chi^2 = \sum \frac{(o - e)^2}{e}\]

  • \(o\): valor observado (\(o\))
  • \(e\): valor esperado (\(e\))

Hipóteses

  • \(H_0\): Não existe associação entre as variáveis (as frequências observadas são próximas às esperadas).
  • \(H_1\): Existe associação entre as variáveis (as frequências observadas diferem significativamente das esperadas).

Teste de Qui-Quadrado

Aplicação: Otimização de página de e-commerce ou app

Uma empresa de tecnologia (como uma plataforma de e-commerce, fintech ou rede social) quer testar se uma nova versão de uma página (ex: botão de “Comprar”, layout de checkout ou página de promoções) aumenta a taxa de conversão.

Cenário:

  • Versão A (controle): Design antigo.
  • Versão B (variante): Novo design.

Hipóteses:

  • \(H_0\) (nula): Não há diferença significativa entre as duas versões. (design não influencia)
  • \(H_1\) (alternativa): Há diferença significativa (o novo design afeta a taxa de conversão).

Teste de Qui-Quadrado

Aplicação: Otimização de página de e-commerce ou app

Conversão (Sucesso) Não Conversão Total
A 120 880 1000
B 180 820 1000
Total 300 1700 2000

\[\chi^2 = \frac{(120 - 150)^2}{150} + \frac{(180 - 150)^2}{150} + \frac{(880 - 850)^2}{850} + \frac{(820 - 850)^2}{850} = 12.94\]

  • Com um valor de \(\chi^2\) de 12.94 e 1 grau de liberdade, o p-valor é menor que 0.001, indicando que rejeitamos a hipótese nula (\(H_0\)), ou seja, existe uma associação significativa entre o design da página e a taxa de conversão.

Teste Exato de Fisher

Teste de hipótese estatística usado para determinar se existe uma associação significativa entre duas variáveis categóricas.
Alternativa ao teste do Qui-Quadrado.
  • Seus dados estão divididos em categorias (ex: Sim/Não, Sucesso/Falha).
  • O tamanho da sua amostra é pequeno.
  • Imp.: Se uma das células tiver uma frequência esperada menor que 5, o Qui-Quadrado perde a eficiência. Usa-se Teste Exato de Fisher.

Hipóteses

  • \(H_0\): Não existe associação entre as variáveis.
  • \(H_1\): Existe associação entre as variáveis.

Teste Exato de Fisher

Teve melhora Não teve melhora Total Linha
Medicamento a b a+b
Placebo c d c+d
Total Coluna a+c b+d n
  • Fisher calcula a probabilidade exata de obter aquela configuração de dados específica assumindo que a hipótese nula (\(H_0\)) seja verdadeira

Fórmula

\[P = \frac{ \binom{a+b}{a} \binom{b+d}{b} }{ \binom{n}{a+b} } = \frac{(a+b)! (c+d)! (a+c)! (b+d)!}{a! b! c! d! n!} \]

Teste Exato de Fisher

Aplicação: : Teste A/B com amostra pequena

Uma equipe de produto está testando uma nova funcionalidade em um app. Como é o início do teste, o tráfego é baixo. Eles querem saber se a nova versão aumenta a taxa de ativação da funcionalidade.

Ativou a funcionalidade Não Ativou Total
A 4 46 50
B 12 38 50
Total 16 84 100
  • \(H_0\): A nova funcionalidade não tem impacto na taxa de ativação.
  • \(H_1\): A nova funcionalidade tem um impacto significativo na taxa de ativação.

Teste Exato de Fisher

Aplicação: : Teste A/B com amostra pequena

\[P = \frac{ \binom{16}{4} \binom{84}{46} }{ \binom{100}{50} } = 0.002\]

  • O p-valor de 0.002 é menor que o nível de significância comum (0.05), indicando que rejeitamos a hipótese nula (\(H_0\)) e concluímos que a nova funcionalidade tem um impacto significativo na taxa de ativação.

Teste U de Mann-Whitney

  • Alternativa ao Teste t de Student para amostras independentes quando os pressupostos de normalidade dos dados são violados.

Hipóteses Estatísticas

  • \(H_0\): As distribuições das duas amostras são iguais (ou seja, as medianas são iguais).
  • \(H_1\): As distribuições das duas amostras são diferentes (ou seja, as medianas são diferentes).

Procedimento

  • As observações de ambos os grupos são combinadas e classificadas em ordem crescente.
  • O teste calcula a soma dos postos (ranks) para cada grupo e compara essas somas para determinar se há uma diferença significativa entre os grupos.

Teste U de Mann-Whitney

A estatística \(U\) é calculada para cada um dos grupos por meio das seguintes equações:

\[U_1 = n_1 n_2 + \frac{n_1(n_1 + 1)}{2} - R_1 \text{ | } U_2 = n_1 n_2 + \frac{n_2(n_2 + 1)}{2} - R_2\]

Onde:

  • \(n_1\) e \(n_2\) são os tamanhos amostrais dos respectivos grupos.
  • \(R_1\) e \(R_2\) são as somas dos postos obtidos por cada grupo.

A estatística final do Teste U de Mann-Whitney será o menor valor computado entre as duas equações

\[U = \min(U_1, U_2)\]

Teste U de Mann-Whitney

  • Pequenas Amostras (\(n_1\) e \(n_2 \leq 20\)):

    • O valor crítico de \(U\) é determinado a partir de tabelas específicas para o Teste U de Mann-Whitney, que levam em consideração os tamanhos amostrais dos grupos.
  • Grandes Amostras (\(n_1\) e \(n_2 > 20\)):

    • A distribuição de \(U\) pode ser aproximada por uma distribuição normal, e o valor de \(U\) é convertido em um escore z para determinar o p-valor.

Teste U de Mann-Whitney

Aplicação:

  • Um dos indicadores mais importantes de bem-estar, conforto térmico e saúde é o tempo diário de ruminação (em minutos/dia). Pesquisadores avaliaram a eficácia de um novo sistema de resfriamento onde o objetivo foi verificar se há melhora o bem-estar das vacas em comparação ao sistema convencional.

    • Grupo 1 (Controle): Vacas em free-stall com apenas ventilação mecânica contínua.

    • Grupo 2 (Tratamento): Vacas no mesmo galpão, mas com sistema automatizado que ativa aspersão + ventilação quando o Índice de Temperatura e Umidade (ITU/THI) ultrapassa o limiar crítico.

Teste U de Mann-Whitney

Tempo de Ruminação Diária
Animal 1 Animal 2 Animal 3 Animal 4 Animal 5 Animal 6
Grupo Controle 410 425 430 445 470
Grupo Tratamento 480 495 510 520 530 550

\[U_1 = (6 \times 5) + \frac{5(5 + 1)}{2} - 15 = 30 \text{ | } U_2 = (6 \times 5) + \frac{6(6 + 1)}{2} - 51 = 0\]

Portanto, a estatística final do teste é:

\[U = \min(36, 0) = 0\]

  • Existe uma diferença significativa entre as distribuições do tempo de ruminação dos dois grupos

Teste de Kruskal-Wallis

  • Usado comparação de k tratamentos independentes

Método

  • Ordene-se os valores obtendo os postos.

  • Calcula-se a estatística H:

\[H = \frac{12}{N(N+1)} \sum^{k}_{j = 1} \frac{R^{2}_j}{n_{j}} - 3(N+1)\]

  • \(R_{i}\) : Número da Soma dos Postos (ou Ranks) de um grupo específico.

Teste de Kruskal-Wallis

Aplicação

  • Testar três tipos de materiais compósitos diferentes (Material A, Material B e Material C) para fabricar isoladores de alta tensão.

    • Material A: 120h, 150h, 145h, 30h, 160h, 80h
    • Material B: 210h, 230h, 225h, 190h, 340h, 240h
    • Material C: 180h, 175h, 190h, 165h, 170h, 200h

Hipóteses

  • Hipótese Nula (\(H_0\)): Os três materiais têm a mesma resistência à degradação.
  • Hipótese Alternativa (\(H_1\)): Pelo menos um dos materiais tem uma resistência significativamente diferente dos outros.

Teste de Kruskal-Wallis

Aplicação

\[H = \frac{12}{18 \times 19} \left( \frac{21^2}{6} + \frac{91.5^2}{6} + \frac{58.5^2}{6} \right) - 3(19)\]

\[H = 14,55\]

\[p-valor = 0,0007\]

  • Existe evidência estatística significativa de que pelo menos um dos materiais possui resistência à degradação diferente dos outros

Testes para Amostras Relacionadas

Teste de Wilcoxon

Teste de Friedman

Obrigado