Qual a diferença entre probabilidade e chance?
Risco, chance e probabilidade são conceitos frequentemente usados de forma intercambiável no cotidiano, mas, em análises científicas, suas distinções são cruciais. A chance, por outro lado, é a razão entre a ocorrência de um evento e a de outro, geralmente comparando eventos favoráveis e desfavoráveis. Já a probabilidade é uma medida mais ampla, quantificando o valor matemático de que um evento ocorra, variando entre 0 e 1.
Existe diferença entre uma probabilidade e uma chance!
Entender essas diferenças é essencial tanto para quem reporta dados quanto para quem interpreta artigos científicos, pois a imprecisão no uso desses termos pode levar a interpretações equivocadas dos resultados. Existem diferenças na formula:
\[ Chance = \frac{Num\_casos\_ de\_A}{Num\_casos\_ de\_NÃO\_A}\] \[ P(A)= \frac{Num\_casos\_ de\_A}{Num\_casos\_Totais} \]
Um exemplo com o R
Supondo que temos a base de dados abaixo. Qual a chance de ser um estudante de mérito acadêmico? e qual a probabilidade de ser um estudante de mérito acadêmico?
= data.frame(merito = c(rep("Aluno normal",151),rep("Aluno Mérito Acadêmico",49)),
dados sexo = c(rep("Masculino",74),rep("Feminino",77),rep("Masculino",17),rep("Feminino",32)))
table(dados$merito)
Aluno Mérito Acadêmico Aluno normal
49 151
Utilizando a equação acima teríamos:
\[ Chance_1 = \frac{49}{151} = 0,3245\] \[ Chance_2 = \frac{151}{49} = 3,081\] E as probabilidades seriam:
\[ P(1)= \frac{49}{49+151}=\frac{49}{200} =0,245 \] \[ P(2)= \frac{151}{49+151}=\frac{151}{200} = 0,755 \]
Como devemos interpretar esses dois resultados?
Enquanto a probabilidade deve sempre estar entre 0 e 1 (ou entre 0% e 100%), a chance não possui essa limitação e pode assumir valores maiores. A probabilidade mede a proporção de casos favoráveis em relação ao total de possíveis, enquanto a chance compara diretamente os casos favoráveis com os desfavoráveis.
No exemplo citado, a chance de ser um “aluno comum” é três vezes maior, o que significa que, para cada evento de não ser um aluno comum, há três eventos de ser um aluno comum. Já a probabilidade de ser um aluno comum é de 75,5%, o que indica que, em cada 100 tentativas, espera-se que aproximadamente 75 resultem em alunos comuns.
Apesar de ambas as medidas terem o objetivo de quantificar a chance de um evento ocorrer, elas fazem isso de maneiras diferentes. A probabilidade fornece uma fração do total, enquanto a chance compara diretamente as ocorrências de um evento favorável contra as desfavoráveis, podendo oferecer uma visão mais intuitiva sobre a comparação direta entre dois cenários.
Exemplo
A partir dessa tabela, quais são as chances de um homem receber um Prêmio Mérito Acadêmico e quais são as chances de uma mulher receber um Prêmio Mérito Acadêmico? E quais são as chances de uma mulher receber um Prêmio Mérito Acadêmico quando comparado com o homem?
Podemos calcular manualmente essas chances a partir da tabela. Para os homens, as chances de receber um Prêmio Mérito Acadêmico é:
table(dados$merito,dados$sexo)
Feminino Masculino
Aluno Mérito Acadêmico 32 17
Aluno normal 77 74
\[ Chance_H = \frac{17}{74} = 0,2297297\] Para as mulheres, as chances de receber um Prêmio Mérito Acadêmico são:
\[ Chance_M = \frac{32}{77} = 0,4155844\]
A razão de chance das mulheres em comparação as chances dos homens é:
\[ Razao\_Chances = \frac{\frac{32}{77}}{\frac{17}{74}} = \frac{32}{77}*\frac{74}{17} = 1,81\] Logo, as chances para os homens são de 17 a 74, as chances para as mulheres são de 32 a 77 e as chances para as mulheres são cerca de 81% maiores do que as chances dos homens.
Agora podemos relacionar as chances para homens e mulheres e o resultado do teste de fFisher.
fisher.test(table(dados$merito,dados$sexo))
Fisher's Exact Test for Count Data
data: table(dados$merito, dados$sexo)
p-value = 0.09898
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
0.8851558 3.7780919
sample estimates:
odds ratio
1.803697
Podemos comparar também com o resultado da regressão logística. A equação:
\[ logit(p) = β0 + β1*sexo\] Descreve a relação entre o sexo dos estudantes e o logaritmo da chance receber um Prêmio Mérito Acadêmico.
$merito2 = ifelse(dados$merito=="Aluno Mérito Acadêmico",1,0)
dados$sexo2 = ifelse(dados$sexo=="Feminino",1,0)
dados
= glm(merito2 ~ sexo2, binomial(link = "logit"), data = dados )
modelo summary(modelo)
Call:
glm(formula = merito2 ~ sexo2, family = binomial(link = "logit"),
data = dados)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.4709 0.2690 -5.469 4.53e-08 ***
sexo2 0.5928 0.3414 1.736 0.0825 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 222.71 on 199 degrees of freedom
Residual deviance: 219.61 on 198 degrees of freedom
AIC: 223.61
Number of Fisher Scoring iterations: 4
O intercepto de -1,471 é o log das chances para homens, uma vez que homens são o grupo de referência (a variável sexo2 = 0). Usando as chances que calculamos acima para os homens, podemos confirmar isso: log(0,23) = -1,47. O coeficiente para mulheres é o log da razão de chances entre o grupo feminino e o grupo masculino: log(1,809) = 0,593. Portanto, podemos obter a razão de chances encontrando o exponencial do coeficiente para mulheres.
# exp(coefficients(modelo)[2])
exp(0.5928)
[1] 1.809047
Nesse caso, o coeficiente estimado para o sexo2 é o log das chances de uma mulher receber um Prêmio Mérito Acadêmico quando comparado com os homens.