Tarea 7 - ESTA 4501

Se cargó la base de datos en un documento CSV.

datos <- read.csv("Loan_Approval_Dataset.csv", header = T)

Recodificación de variables

datos$Loan_Status <- factor(datos$Loan_Status)
datos$Education <- factor(datos$Education)
datos$Self_Employed <- factor(datos$Self_Employed)
str(datos)

## 'data.frame':    4269 obs. of  6 variables:
##  $ Loan_Status  : Factor w/ 2 levels " Approved"," Rejected": 1 2 2 2 2 2 1 2 1 2 ...
##  $ Income       : int  9600000 4100000 9100000 8200000 9800000 4800000 8700000 5700000 800000 1100000 ...
##  $ Loan_Amount  : int  29900000 12200000 29700000 30700000 24200000 13500000 33000000 15000000 2200000 4300000 ...
##  $ Education    : Factor w/ 2 levels " Graduate"," Not Graduate": 1 2 1 1 2 1 1 1 1 2 ...
##  $ Self_Employed: Factor w/ 2 levels " No"," Yes": 1 2 1 1 2 2 1 2 2 1 ...
##  $ Cibil_Score  : int  778 417 506 467 382 319 678 382 782 388 ...

Modelo logístico ajustado:

#Ajuste del modelo
modelo <- glm(Loan_Status ~ Income + Loan_Amount + Education + Self_Employed + Cibil_Score, family = binomial, data = datos)

coefs <- summary(modelo)$coefficients


#Tabla
tabla_modelo <- data.frame(
  Termino = rownames(coefs),
  Logit = round(coefs[, "Estimate"], 3),
  Odds_Ratio = round(exp(coefs[, "Estimate"]), 3),
  row.names = NULL,
  check.names = FALSE
)

tabla_modelo

##                  Termino  Logit Odds_Ratio
## 1            (Intercept) 11.631 112493.314
## 2                 Income  0.000      1.000
## 3            Loan_Amount  0.000      1.000
## 4 Education Not Graduate  0.071      1.074
## 5      Self_Employed Yes -0.056      0.945
## 6            Cibil_Score -0.022      0.978

Interpretación del modelo:

+Intercepto: odds ratio -> representa el valor base cuando todas las demás variables son 0. Nos está indicando una probabilidad muy alta de que apruebe el préstamo.

+Income:odds ratio -> No tiene efecto positivo o negativo, cambios en el ingreso no afectan la probabilidad de que se apruebe el préstamo.

+Loan_Amount:odds ratio -> Tampoco afecta la probabilidad de que se les apruebe el préstamo de manera significativa.

+Education:odds ratio -> Las personas sin título universitario tienen 7.4 más probabilidad de se les apruebe el préstamo que los graduados, manteniendo las demás variables constantes.

+Self_Employed:odds ratio -> Los que trabajan por cuenta propia tienen 5.5% menos de probabilidad de que se les apruebe el préstamo.

+Cibil_Score:odds ratio -> Por cada unidad adicional en el puntaje CIBIL, las probabilidades de que se apruebe el evento disminuyen 2.2%, menteniendo las demás variables constantes.

Conclusión:

Este modelo nos deja saber que ninguna variable numérica (ingreso o cantidad del préstamo) ejerce un efecto relevante sobre la probabilidad de que se apruebe un préstamo. Por otro lado, las características demográficas y crediticias muestras efectos pequeños. El efecto más notable es el intercepto elevado, nos deja saber que independientemente de las demás variables, es muy probable que se apruebe el préstamo.