Estatística Não Paramétrica

Filipe Costa

Universidade Federal do Piauí

Introdução

“… pode ser definida como uma coleção de métodos estatísticos aplicada a conjuntos de dados onde as suposições distribucionais necessárias para aplicação de uma técnica clássica (Intervalo de Confiança, Teste de Hipótese) não são satisfatoriamente atendidas.”

Por que usar testes não paramétricos?

Vantagens	Desvantagens
Vantagens e Desvantagens dos Testes Não Paramétricos
Dispensam normalidade dos dados	Desperdício de informações, pois não consideram a magnitude dos dados
O p-valor é exato (no caso paramétrico o cálculo se baseia na distribuição Normal)	Menor eficiência quando as suposições do modelo são atendidas
São testes mais simples	Utilização das tabelas dos testes é mais complicada
São úteis quando é difícil estabelecer uma escala quantitativa para os dados
São mais eficientes que os paramétricos quando não existe normalidade

Use `r`

Escolha do Teste Estátistico

Poder do Teste: \((1 - \beta)\):
- Escolher o teste que apresentar a maior probabilidade de rejeitar \(H_{0}\) quando falsa.
Plano exprimental (Como a mostra foi captada).
Natureza e características da população.
Nível de Mensuração.
- Nominal
- Ordinal
- Intervalar

Escolha do Teste Estátistico

Testes para duas Amostras Independentes

Teste de Qui-Quadrado

É utilizado para descobrir se a frequência de determinados eventos na sua amostra é puramente obra do acaso ou se existe um padrão/relação real acontecendo.

Abordagens para o teste de Qui-Quadrado:

Teste de Independência: Verificar se existe uma associação entre duas variáveis categóricas (ex: gênero e preferência por um produto).
Teste de Aderência (Goodness of Fit): Verificar se a distribuição observada de uma variável categórica se encaixa em uma distribuição teórica esperada (ex: distribuição de cores de carros em uma cidade).

Teste de Qui-Quadrado

Formula

\[\chi^2 = \sum \frac{(o - e)^2}{e}\]

\(o\): valor observado (\(o\))
\(e\): valor esperado (\(e\))

Hipóteses

\(H_0\): Não existe associação entre as variáveis (as frequências observadas são próximas às esperadas).
\(H_1\): Existe associação entre as variáveis (as frequências observadas diferem significativamente das esperadas).

Teste de Qui-Quadrado

Aplicação: Otimização de página de e-commerce ou app

Uma empresa de tecnologia (como uma plataforma de e-commerce, fintech ou rede social) quer testar se uma nova versão de uma página (ex: botão de “Comprar”, layout de checkout ou página de promoções) aumenta a taxa de conversão.

Cenário:

Versão A (controle): Design antigo.
Versão B (variante): Novo design.

Hipóteses:

\(H_0\) (nula): Não há diferença significativa entre as duas versões. (design não influencia)
\(H_1\) (alternativa): Há diferença significativa (o novo design afeta a taxa de conversão).

Teste de Qui-Quadrado

Aplicação: Otimização de página de e-commerce ou app

	Conversão (Sucesso)	Não Conversão	Total
A	120	880	1000
B	180	820	1000
Total	300	1700	2000

\[\chi^2 = \frac{(120 - 150)^2}{150} + \frac{(180 - 150)^2}{150} + \frac{(880 - 850)^2}{850} + \frac{(820 - 850)^2}{850} = 12.94\]

Com um valor de \(\chi^2\) de 12.94 e 1 grau de liberdade, o p-valor é menor que 0.001, indicando que rejeitamos a hipótese nula (\(H_0\)), ou seja, existe uma associação significativa entre o design da página e a taxa de conversão.

Teste Exato de Fisher

Teste de hipótese estatística usado para determinar se existe uma associação significativa entre duas variáveis categóricas.

Alternativa ao teste do Qui-Quadrado.

Seus dados estão divididos em categorias (ex: Sim/Não, Sucesso/Falha).
O tamanho da sua amostra é pequeno.
Imp.: Se uma das células tiver uma frequência esperada menor que 5, o Qui-Quadrado perde a eficiência. Usa-se Teste Exato de Fisher.

Hipóteses

\(H_0\): Não existe associação entre as variáveis.
\(H_1\): Existe associação entre as variáveis.

Teste Exato de Fisher

	Teve melhora	Não teve melhora	Total Linha
Medicamento	a	b	a+b
Placebo	c	d	c+d
Total Coluna	a+c	b+d	n

Fisher calcula a probabilidade exata de obter aquela configuração de dados específica assumindo que a hipótese nula (\(H_0\)) seja verdadeira

Fórmula

\[P = \frac{ \binom{a+b}{a} \binom{b+d}{b} }{ \binom{n}{a+b} } = \frac{(a+b)! (c+d)! (a+c)! (b+d)!}{a! b! c! d! n!} \]

Teste Exato de Fisher

Aplicação: : Teste A/B com amostra pequena

Uma equipe de produto está testando uma nova funcionalidade em um app. Como é o início do teste, o tráfego é baixo. Eles querem saber se a nova versão aumenta a taxa de ativação da funcionalidade.

	Ativou a funcionalidade	Não Ativou	Total
A	4	46	50
B	12	38	50
Total	16	84	100

\(H_0\): A nova funcionalidade não tem impacto na taxa de ativação.
\(H_1\): A nova funcionalidade tem um impacto significativo na taxa de ativação.

Teste Exato de Fisher

Aplicação: : Teste A/B com amostra pequena

\[P = \frac{ \binom{16}{4} \binom{84}{46} }{ \binom{100}{50} } = 0.002\]

O p-valor de 0.002 é menor que o nível de significância comum (0.05), indicando que rejeitamos a hipótese nula (\(H_0\)) e concluímos que a nova funcionalidade tem um impacto significativo na taxa de ativação.

Teste U de Mann-Whitney

Alternativa ao Teste t de Student para amostras independentes quando os pressupostos de normalidade dos dados são violados.

Hipóteses Estatísticas

\(H_0\): As distribuições das duas amostras são iguais (ou seja, as medianas são iguais).
\(H_1\): As distribuições das duas amostras são diferentes (ou seja, as medianas são diferentes).

Procedimento

As observações de ambos os grupos são combinadas e classificadas em ordem crescente.
O teste calcula a soma dos postos (ranks) para cada grupo e compara essas somas para determinar se há uma diferença significativa entre os grupos.

Teste U de Mann-Whitney

A estatística \(U\) é calculada para cada um dos grupos por meio das seguintes equações:

\[U_1 = n_1 n_2 + \frac{n_1(n_1 + 1)}{2} - R_1 \text{ | } U_2 = n_1 n_2 + \frac{n_2(n_2 + 1)}{2} - R_2\]

Onde:

\(n_1\) e \(n_2\) são os tamanhos amostrais dos respectivos grupos.
\(R_1\) e \(R_2\) são as somas dos postos obtidos por cada grupo.

A estatística final do Teste U de Mann-Whitney será o menor valor computado entre as duas equações

\[U = \min(U_1, U_2)\]

Teste U de Mann-Whitney

Pequenas Amostras (\(n_1\) e \(n_2 \leq 20\)):
- O valor crítico de \(U\) é determinado a partir de tabelas específicas para o Teste U de Mann-Whitney, que levam em consideração os tamanhos amostrais dos grupos.
Grandes Amostras (\(n_1\) e \(n_2 > 20\)):
- A distribuição de \(U\) pode ser aproximada por uma distribuição normal, e o valor de \(U\) é convertido em um escore z para determinar o p-valor.

Teste U de Mann-Whitney

Aplicação:

Um dos indicadores mais importantes de bem-estar, conforto térmico e saúde é o tempo diário de ruminação (em minutos/dia). Pesquisadores avaliaram a eficácia de um novo sistema de resfriamento onde o objetivo foi verificar se há melhora o bem-estar das vacas em comparação ao sistema convencional.
- Grupo 1 (Controle): Vacas em free-stall com apenas ventilação mecânica contínua.
- Grupo 2 (Tratamento): Vacas no mesmo galpão, mas com sistema automatizado que ativa aspersão + ventilação quando o Índice de Temperatura e Umidade (ITU/THI) ultrapassa o limiar crítico.

Teste U de Mann-Whitney

	Animal 1	Animal 2	Animal 3	Animal 4	Animal 5	Animal 6
Tempo de Ruminação Diária
Grupo Controle	410	425	430	445	470	—
Grupo Tratamento	480	495	510	520	530	550

\[U_1 = (6 \times 5) + \frac{5(5 + 1)}{2} - 15 = 30 \text{ | } U_2 = (6 \times 5) + \frac{6(6 + 1)}{2} - 51 = 0\]

Portanto, a estatística final do teste é:

\[U = \min(36, 0) = 0\]

Existe uma diferença significativa entre as distribuições do tempo de ruminação dos dois grupos

Teste de Kruskal-Wallis

Usado comparação de k tratamentos independentes

Método

Ordene-se os valores obtendo os postos.
Calcula-se a estatística H:

\[H = \frac{12}{N(N+1)} \sum^{k}_{j = 1} \frac{R^{2}_j}{n_{j}} - 3(N+1)\]

\(R_{i}\) : Número da Soma dos Postos (ou Ranks) de um grupo específico.

Teste de Kruskal-Wallis

Aplicação

Testar três tipos de materiais compósitos diferentes (Material A, Material B e Material C) para fabricar isoladores de alta tensão.
- Material A: 120h, 150h, 145h, 30h, 160h, 80h
- Material B: 210h, 230h, 225h, 190h, 340h, 240h
- Material C: 180h, 175h, 190h, 165h, 170h, 200h

Hipóteses

Hipótese Nula (\(H_0\)): Os três materiais têm a mesma resistência à degradação.
Hipótese Alternativa (\(H_1\)): Pelo menos um dos materiais tem uma resistência significativamente diferente dos outros.

Teste de Kruskal-Wallis

Aplicação

\[H = \frac{12}{18 \times 19} \left( \frac{21^2}{6} + \frac{91.5^2}{6} + \frac{58.5^2}{6} \right) - 3(19)\]

\[H = 14,55\]

\[p-valor = 0,0007\]

Existe evidência estatística significativa de que pelo menos um dos materiais possui resistência à degradação diferente dos outros

Testes para Amostras Relacionadas

Estatística Não Paramétrica

Introdução

Por que usar testes não paramétricos?

Use r

Escolha do Teste Estátistico

Escolha do Teste Estátistico

Testes para duas Amostras Independentes

Teste de Qui-Quadrado

Abordagens para o teste de Qui-Quadrado:

Teste de Qui-Quadrado

Formula

Hipóteses

Teste de Qui-Quadrado

Aplicação: Otimização de página de e-commerce ou app

Teste de Qui-Quadrado

Aplicação: Otimização de página de e-commerce ou app

Teste Exato de Fisher

Teste de hipótese estatística usado para determinar se existe uma associação significativa entre duas variáveis categóricas.

Alternativa ao teste do Qui-Quadrado.

Hipóteses

Teste Exato de Fisher

Fórmula

Teste Exato de Fisher

Aplicação: : Teste A/B com amostra pequena

Teste Exato de Fisher

Aplicação: : Teste A/B com amostra pequena

Teste U de Mann-Whitney

Hipóteses Estatísticas

Procedimento

Teste U de Mann-Whitney

Teste U de Mann-Whitney

Teste U de Mann-Whitney

Aplicação:

Teste U de Mann-Whitney

Teste de Kruskal-Wallis

Método

Teste de Kruskal-Wallis

Aplicação

Hipóteses

Teste de Kruskal-Wallis

Aplicação

Testes para Amostras Relacionadas

Teste de Wilcoxon

Teste de Friedman

Obrigado

Use `r`