En este análisis estaré utilizando el modelo de Regresión logística. Ya que este método está diseñado pata estimar la probabilídad de ocurrencia de un evento, en función de una o varias variables explicativas. Estaré trabajando con un problema donde una institución financiera quiere entender qué factores inciden en la aprobación de solicitudes de préstamos.
## [1] "Approved" "Rejected"
| Variable | Descripción | Tipo.sugerido |
|---|---|---|
| Income | Ingreso mensual (USD) | Numérica |
| Loan_Amount | Monto solicitado (USD) | Numérica |
| Education | Nivel educativo (Graduate / Not Graduate) | Categórica |
| Self_Employed | Trabaja por cuenta propia (Yes / No) | Categórica |
| Cibil_Score | Puntaje crediticio | Numérica |
## [1] "Graduate" "Not Graduate"
## [1] "No" "Yes"
Interés Principal: Es poder determinar cómo cambian las probabilidades de una solicitud de prestamo ser aprobada según estas condiciones.
Ahora vamos a ver el modelo ajustado para ver los coeficientes de Escala logit y de Escala odds ratio. Con la escala logit se podré ver el coeficiente \(\beta_i\) indica cuánto cambia el logartimo de la razón de probabilídades cuando \(X_1\) aumenta en una unidad. El odds ratio muestra como el incremento en \(X_1\) hace que la probabilídad del evento aumente o disminuya.
# Modelo logístico ajustado
modelo1 <- glm(loan ~ income + amount + education + employed + cibil,
family = binomial, data = data2)
# Resumen de coeficientes
coefs <- summary(modelo1)$coefficients
# Tabla con Logit y Odds Ratio
tabla_mod1 <- data.frame(
Termino = rownames(coefs),
Logit = round(coefs[, 1], 3),
Odds_Ratio = round(exp(coefs[, 1]), 3),
row.names = NULL,
check.names = FALSE
)
tabla_mod1Intercepto: (OR = 0.000) representa la situación base de referencia, un solicitante no graduado, no empleado por su cuenta, con ingreso y puntaje crediticio promedio. La probabilídad base de aprobación basicamente es nula, porque sin características favorables, la solicitud del prestamo tiene ser rechazado.
Ingreso Mensual: (OR = 1.000) Muestra que el ingreso mensual no tiene efecto apreciable en la probabilídad de aprobación del préstamo, manteniendo las demas variables constantes.
Monto Solicitado: (OR = 1.000) Indica que el monto de solicitudes tampoco ejerce algún efecto significativo en la aprobación. Es decir, solicitar una cantidad mayor o menor no cambia la probabilídad de aprobación cuando los demás factores se quedan constantes.
Nivel Educación (Graduado vs No Graduado): (OR = 0.931) Este resultado muestra que los solicitantes no graduados presentan una probabilídad de 7% menor respecto a los graduados (1 - 0.931 =0.069), mientras las demás variables son constantes. Así que significa que tener un mayor grado de educación aumenta la probabilidad de ser aprobado, aunque no es mucha la diferencia.
Trabaja por cuenta Propia (Si vs No):(OR = 1.058) Sugiere que los solicitantes empleados tienen una probabilidad de aprobación de 5.8% mayor respecto a los no empleados (1.058 - 1 =0.058). Así que es evidente decir que contar con empleo incremeinta la confianza del prestamista.
Puntaje Crediticio: (OR =. 1.022) Este resultado muestra que por cada punto adicional en el puntaje crediticio, la probabilídad de aprobación puede aumentar hasta un 2.2% (1.022 - 1 =0.002) manteniendo las demás variables constantes.