Razão de chances (odds ratio) e o Teste de Fisher

Qual a diferença entre probabilidade e chance?

Risco, chance e probabilidade são conceitos frequentemente usados de forma intercambiável no cotidiano, mas, em análises científicas, suas distinções são cruciais. A chance, por outro lado, é a razão entre a ocorrência de um evento e a de outro, geralmente comparando eventos favoráveis e desfavoráveis. Já a probabilidade é uma medida mais ampla, quantificando o valor matemático de que um evento ocorra, variando entre 0 e 1.

Existe diferença entre uma probabilidade e uma chance!

Entender essas diferenças é essencial tanto para quem reporta dados quanto para quem interpreta artigos científicos, pois a imprecisão no uso desses termos pode levar a interpretações equivocadas dos resultados. Existem diferenças na formula:

\[ Chance = \frac{Num\_casos\_ de\_A}{Num\_casos\_ de\_NÃO\_A}\] \[ P(A)= \frac{Num\_casos\_ de\_A}{Num\_casos\_Totais} \]

Um exemplo com o R

Supondo que temos a base de dados abaixo. Qual a chance de ser um estudante de mérito acadêmico? e qual a probabilidade de ser um estudante de mérito acadêmico?

dados = data.frame(merito = c(rep("Aluno normal",151),rep("Aluno Mérito Acadêmico",49)),
sexo = c(rep("Masculino",74),rep("Feminino",77),rep("Masculino",17),rep("Feminino",32)))

table(dados$merito)


Aluno Mérito Acadêmico           Aluno normal 
                    49                    151

Utilizando a equação acima teríamos:

\[ Chance_1 = \frac{49}{151} = 0,3245\] \[ Chance_2 = \frac{151}{49} = 3,081\] E as probabilidades seriam:

\[ P(1)= \frac{49}{49+151}=\frac{49}{200} =0,245 \] \[ P(2)= \frac{151}{49+151}=\frac{151}{200} = 0,755 \]

Como devemos interpretar esses dois resultados?

Enquanto a probabilidade deve sempre estar entre 0 e 1 (ou entre 0% e 100%), a chance não possui essa limitação e pode assumir valores maiores. A probabilidade mede a proporção de casos favoráveis em relação ao total de possíveis, enquanto a chance compara diretamente os casos favoráveis com os desfavoráveis.

No exemplo citado, a chance de ser um “aluno comum” é três vezes maior, o que significa que, para cada evento de não ser um aluno comum, há três eventos de ser um aluno comum. Já a probabilidade de ser um aluno comum é de 75,5%, o que indica que, em cada 100 tentativas, espera-se que aproximadamente 75 resultem em alunos comuns.

Apesar de ambas as medidas terem o objetivo de quantificar a chance de um evento ocorrer, elas fazem isso de maneiras diferentes. A probabilidade fornece uma fração do total, enquanto a chance compara diretamente as ocorrências de um evento favorável contra as desfavoráveis, podendo oferecer uma visão mais intuitiva sobre a comparação direta entre dois cenários.

Exemplo

A partir dessa tabela, quais são as chances de um homem receber um Prêmio Mérito Acadêmico e quais são as chances de uma mulher receber um Prêmio Mérito Acadêmico? E quais são as chances de uma mulher receber um Prêmio Mérito Acadêmico quando comparado com o homem?

Podemos calcular manualmente essas chances a partir da tabela. Para os homens, as chances de receber um Prêmio Mérito Acadêmico é:

table(dados$merito,dados$sexo)

                        
                         Feminino Masculino
  Aluno Mérito Acadêmico       32        17
  Aluno normal                 77        74

\[ Chance_H = \frac{17}{74} = 0,2297297\] Para as mulheres, as chances de receber um Prêmio Mérito Acadêmico são:

\[ Chance_M = \frac{32}{77} = 0,4155844\]

A razão de chance das mulheres em comparação as chances dos homens é:

\[ Razao\_Chances = \frac{\frac{32}{77}}{\frac{17}{74}} = \frac{32}{77}*\frac{74}{17} = 1,81\] Logo, as chances para os homens são de 17 a 74, as chances para as mulheres são de 32 a 77 e as chances para as mulheres são cerca de 81% maiores do que as chances dos homens.

Agora podemos relacionar as chances para homens e mulheres e o resultado do teste de fFisher.

fisher.test(table(dados$merito,dados$sexo))


    Fisher's Exact Test for Count Data

data:  table(dados$merito, dados$sexo)
p-value = 0.09898
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
 0.8851558 3.7780919
sample estimates:
odds ratio 
  1.803697

Podemos comparar também com o resultado da regressão logística. A equação:

\[ logit(p) = β0 + β1*sexo\] Descreve a relação entre o sexo dos estudantes e o logaritmo da chance receber um Prêmio Mérito Acadêmico.

dados$merito2 = ifelse(dados$merito=="Aluno Mérito Acadêmico",1,0)
dados$sexo2 = ifelse(dados$sexo=="Feminino",1,0)

modelo = glm(merito2 ~ sexo2, binomial(link = "logit"), data = dados )
summary(modelo)


Call:
glm(formula = merito2 ~ sexo2, family = binomial(link = "logit"), 
    data = dados)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  -1.4709     0.2690  -5.469 4.53e-08 ***
sexo2         0.5928     0.3414   1.736   0.0825 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 222.71  on 199  degrees of freedom
Residual deviance: 219.61  on 198  degrees of freedom
AIC: 223.61

Number of Fisher Scoring iterations: 4

O intercepto de -1,471 é o log das chances para homens, uma vez que homens são o grupo de referência (a variável sexo2 = 0). Usando as chances que calculamos acima para os homens, podemos confirmar isso: log(0,23) = -1,47. O coeficiente para mulheres é o log da razão de chances entre o grupo feminino e o grupo masculino: log(1,809) = 0,593. Portanto, podemos obter a razão de chances encontrando o exponencial do coeficiente para mulheres.

# exp(coefficients(modelo)[2])

exp(0.5928)

[1] 1.809047

Nesse caso, o coeficiente estimado para o sexo2 é o log das chances de uma mulher receber um Prêmio Mérito Acadêmico quando comparado com os homens.