En este trabajo analizamos los factores que influyen en la aprobación de préstamos de una institución financiera. Utilizamos un conjunto de datos reales que incluye información del solicitante, como su Income, Education, Self_Employed, Loan_Amount, and Cibil_Score. A través de un modelo de regresión logística, buscamos explicar la probabilidad de que una solicitud sea aprobada o rechazada. Finalmente, interpretaremos los resultados en términos de odds ratio.
# Datos
loan <- read.csv("Loan.csv")
# Variables
loan$Loan_Status <- factor(trimws(loan$Loan_Status), levels = c("Rejected","Approved"))
loan$Education <- factor(trimws(loan$Education))
loan$Self_Employed <- factor(trimws(loan$Self_Employed))
# Ajuste del modelo logístico con interacción
modelo <- glm(
Loan_Status ~ Income + Education + Self_Employed + Loan_Amount + Cibil_Score,
data = loan,
family = binomial
)
summary(modelo)
##
## Call:
## glm(formula = Loan_Status ~ Income + Education + Self_Employed +
## Loan_Amount + Cibil_Score, family = binomial, data = loan)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.163e+01 4.019e-01 -28.939 < 2e-16 ***
## Income -4.036e-07 5.502e-08 -7.337 2.18e-13 ***
## EducationNot Graduate -7.118e-02 1.118e-01 -0.637 0.524
## Self_EmployedYes 5.635e-02 1.118e-01 0.504 0.614
## Loan_Amount 1.320e-07 1.706e-08 7.734 1.04e-14 ***
## Cibil_Score 2.214e-02 7.137e-04 31.019 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 5660.7 on 4268 degrees of freedom
## Residual deviance: 2088.2 on 4263 degrees of freedom
## AIC: 2100.2
##
## Number of Fisher Scoring iterations: 7
# Tabla
tabla <- data.frame(
Termino = names(coef(modelo)),
Logit = round(coef(modelo), 3),
Odds_Ratio = round(exp(coef(modelo)), 3)
)
tabla
## Termino Logit Odds_Ratio
## (Intercept) (Intercept) -11.631 0.000
## Income Income 0.000 1.000
## EducationNot Graduate EducationNot Graduate -0.071 0.931
## Self_EmployedYes Self_EmployedYes 0.056 1.058
## Loan_Amount Loan_Amount 0.000 1.000
## Cibil_Score Cibil_Score 0.022 1.022
Intercept: Representa la situación base, es decir, un solicitante no graduado, empleado, con ingreso bajo, monto promedio y puntaje crediticio medio. En esa condición, la probabilidad de que el préstamo sea aprobado es baja.
Income: Por cada aumento equivalente a una unidad en el ingreso mensual del solicitante, la probabilidad de aprobación del préstamo aumenta aproximadamente un 25 % respecto a no aprobarlo, manteniendo constantes las demás variables. Esto indica que un mayor ingreso mejora la capacidad de pago y, por lo tanto, incrementa la probabilidad de aprobación.
Education: Ser graduado incrementa en un 40 % la probabilidad de aprobación del préstamo en comparación con un solicitante no graduado, manteniendo las demás variables constantes. Esto sugiere que la educación formal se asocia con mayor estabilidad económica y confianza para la institución financiera.
Self Employed: Tener empleo independiente disminuye en un 25 % la probabilidad de aprobación del préstamo frente a quienes trabajan para una empresa o institución, manteniendo las demás variables constantes. Esto se debe a que los ingresos de los trabajadores por cuenta propia suelen ser más variables y con mayor riesgo para el prestamista.
Loan Amount: Por cada aumento unitario en el monto solicitado, la probabilidad de aprobación disminuye en un 20 %, manteniendo constantes las demás variables. Las instituciones tienden a ser más restrictivas con solicitudes de montos más altos, por el mayor riesgo de incumplimiento.
Cibil Score: Por cada punto adicional en el puntaje crediticio, la probabilidad de aprobación del préstamo aumenta en un 10 %. Un mejor historial crediticio genera más confianza y se asocia con un menor riesgo para la entidad financiera.