Introducción

En este análisis estaré utilizando el modelo de Regresión logística. Ya que este método está diseñado pata estimar la probabilídad de ocurrencia de un evento, en función de una o varias variables explicativas. Estaré trabajando con un problema donde una institución financiera quiere entender qué factores inciden en la aprobación de solicitudes de préstamos.

Variables:

La variable dependiente representa:

  • Y = 1: Solicitud de préstamo aprovado
  • Y = 0: Solicitud de préstamo no es aprovado
## [1] "Approved" "Rejected"

Las variables independientes representan:

Variable Descripción Tipo.sugerido
Income Ingreso mensual (USD) Numérica
Loan_Amount Monto solicitado (USD) Numérica
Education Nivel educativo (Graduate / Not Graduate) Categórica
Self_Employed Trabaja por cuenta propia (Yes / No) Categórica
Cibil_Score Puntaje crediticio Numérica
## [1] "Graduate"     "Not Graduate"
## [1] "No"  "Yes"

Interés Principal: Es poder determinar cómo cambian las probabilidades de una solicitud de prestamo ser aprobada según estas condiciones.

head(data2)

Modelo logístico ajustado

Ahora vamos a ver el modelo ajustado para ver los coeficientes de Escala logit y de Escala odds ratio. Con la escala logit se podré ver el coeficiente \(\beta_i\) indica cuánto cambia el logartimo de la razón de probabilídades cuando \(X_1\) aumenta en una unidad. El odds ratio muestra como el incremento en \(X_1\) hace que la probabilídad del evento aumente o disminuya.

# Modelo logístico ajustado

modelo1 <- glm(loan ~ income + amount + education + employed + cibil, 
               family = binomial, data = data2)

# Resumen de coeficientes
coefs <- summary(modelo1)$coefficients

# Tabla con Logit y Odds Ratio
tabla_mod1 <- data.frame(
  Termino     = rownames(coefs),
  Logit       = round(coefs[, 1], 3),
  Odds_Ratio  = round(exp(coefs[, 1]), 3),
  row.names   = NULL,
  check.names = FALSE
  )

tabla_mod1

Interpretación de resultados

  • Intercepto: (OR = 0.000) representa la situación base de referencia, un solicitante no graduado, no empleado por su cuenta, con ingreso y puntaje crediticio promedio. La probabilídad base de aprobación basicamente es nula, porque sin características favorables, la solicitud del prestamo tiene ser rechazado.

  • Ingreso Mensual: (OR = 1.000) Muestra que el ingreso mensual no tiene efecto apreciable en la probabilídad de aprobación del préstamo, manteniendo las demas variables constantes.

  • Monto Solicitado: (OR = 1.000) Indica que el monto de solicitudes tampoco ejerce algún efecto significativo en la aprobación. Es decir, solicitar una cantidad mayor o menor no cambia la probabilídad de aprobación cuando los demás factores se quedan constantes.

  • Nivel Educación (Graduado vs No Graduado): (OR = 0.931) Este resultado muestra que los solicitantes no graduados presentan una probabilídad de 7% menor respecto a los graduados (1 - 0.931 =0.069), mientras las demás variables son constantes. Así que significa que tener un mayor grado de educación aumenta la probabilidad de ser aprobado, aunque no es mucha la diferencia.

  • Trabaja por cuenta Propia (Si vs No):(OR = 1.058) Sugiere que los solicitantes empleados tienen una probabilidad de aprobación de 5.8% mayor respecto a los no empleados (1.058 - 1 =0.058). Así que es evidente decir que contar con empleo incremeinta la confianza del prestamista.

  • Puntaje Crediticio: (OR =. 1.022) Este resultado muestra que por cada punto adicional en el puntaje crediticio, la probabilídad de aprobación puede aumentar hasta un 2.2% (1.022 - 1 =0.002) manteniendo las demás variables constantes.