No modelo logit, estamos interessados em uma variável \(Y\) dicotômica que assume os valores 1 ou 0, indicando se um evento de interesse ocorreu ( \(Y = 1\) ) ou se não ocorreu ( \(Y = 0\) ).
A probabilide de ocorrência desse evento, que vamos chamar de \(p\) (isto é, \(p = P(Y = 1)\)) pode ser modelada como uma resposta a uma série de variáveis explicativas \(X_1, \cdots,X_k\). O modelo relaciona \(p\) e as variáveis explicativas através da funão logito:
\[ log\left(\frac{p}{1-p}\right) = \beta_0 + \beta_1X_1 + \cdots + \beta_kX_k \]
O objetivo deste breve relatório é compreender melhor a interpretação do modelo em termos de como cada variável \(X_j\) influencia na probabilidade \(p\) do evento de interesse, considerando os coeficientes \(\beta_j\) estimados.
A razão \(\left(\frac{p}{1-p}\right)\) é chama de razão de chances, ou odds. Assim, \(\beta_j\) é a taxa de variação no logarítimo do odds para cada unidade aumentada em \(X_j\), uma vez que
\[ \frac{\partial log\left(\frac{p}{1-p}\right)}{\partial X_j} = \beta_j \] Há forma de relacionar \(p\) e as variáveis \(X_j\). Para simplificar as expressões, considere \(odds = \left(\frac{p}{1-p}\right)\) e \(odds^{'}_{j}\) a derivada parcial de \(odds\) com relação a \(X_j\). Assim
\[ odds = \left(\frac{p}{1-p}\right) = e^{\beta_0 = \beta_1X_1 + \cdots + \beta_kX_k} \] e
\[ \frac{\partial \left(\frac{p}{1-p}\right)}{\partial X_j} = odds^{'}_{j} = e^{\beta_0 = \beta_1X_1 + \cdots + \beta_kX_k}\times\beta_j = \left(\frac{p}{1-p}\right)\times\beta_j = odds \times\beta_j \] ou seja
\[ \beta_j = \frac{odds^{'}_{j}}{odds} \]
Isto é, \(\beta_j\) pode ser interpretado como a variação percentual no odds para cada unidade de variação em \(X_j\)
Geralmente, \(\beta_j\) é interpretado em termos de variação percentual na probabilidade \(p\), e não como variação percentual no odds. Assim, faz-se necessário entender corretamente a relação entre a variação percentual no odds e a variação percentual entre as probabilidades correspondentes.
O gráfico abaixo mostra como o odds varia com relaçao aos valores da probabilidade \(p\), variando de \(0\) quando \(p=0\) a tende ao infinito à medida em que \(p\) se aproxima de 1.
Suponha que comparamos duas probabilidades, \(p_1\) e \(p_2\), cujas razões de chance \(odds_1\) e \(odds_2\) estejam proporcionalmente relacionadas por um fator \(K\). Isto é,
\[ \frac{odds1}{odds2} = K \]
Convertendo a expressão acima em termos das probabilidades \(p_1\) e \(p_2\), temos
\[ \frac{\left(\frac{p_1}{1-p_1}\right)}{\left(\frac{p_2}{1-p_2}\right)} = K \]
Colocando \(p_1\) em função de \(p_2\), temos:
\[ p_1 = \frac{Kp_2}{1-(K-1)p_2} \]
Assim, a razão \(p_1/p_2\) fica
\[ \frac{p_1}{p_2} = \frac{K}{1-(K-1)p2} \]
Com base nessa relação, depreende-se as seguintes propriedades
Se \(K > 1\), a razão \(\frac{p_1}{p_2}\) se aproxima de \(K\) quando \(p_2\) tende a zero, e aumenta à medida em que \(p_2\) aumenta, e assume seu valor máximo de \(2K-1\) quando \(p_2 = \frac{1}{2K-1}\)
Se \(K < 1\), a razão \(\frac{p_1}{p_2}\) se aproxima de \(K\) quando \(p_2\) tende a zero, e diminui à medida em que \(p_2\) aumenta, assumindo seu valor mínimo de \(\frac{K}{2-K}\) à medida em que \(p_2\) se aproxima de 1
Se \(K = 1\), \(p1 = p2\)
Para ilustrar, consideramos dois cenários, um em que e outro em que
Para o primeiro cenário, a relação entre \(p_1\) e \(p_2\) é ilustrada abaixo. A linha vermelha é a relação real entre \(p_1\) e \(p_2\) considerando a razão \(K\) entre as odds. A linha azul considera \(p_1 = K\times p_2\).
Já o gráfico abaixo mostra a razão entre \(p_1\) e \(p_2\) para diferentes valores de \(p_2\)
Para o segundo cenário, a relação entre \(p_1\) e \(p_2\) é ilustrada abaixo. A linha vermelha é a relação real entre \(p_1\) e \(p_2\) considerando a razão \(K\) entre as odds. A linha azul considera \(p_1 = K\times p_2\).
Já o gráfico abaixo mostra a razão entre \(p_1\) e \(p_2\) para diferentes valores de \(p_2\)