datos <- read.csv("Loan_Approval_Dataset.csv", header = T)
datos$Loan_Status <- factor(datos$Loan_Status)
datos$Education <- factor(datos$Education)
datos$Self_Employed <- factor(datos$Self_Employed)
str(datos)
## 'data.frame': 4269 obs. of 6 variables:
## $ Loan_Status : Factor w/ 2 levels " Approved"," Rejected": 1 2 2 2 2 2 1 2 1 2 ...
## $ Income : int 9600000 4100000 9100000 8200000 9800000 4800000 8700000 5700000 800000 1100000 ...
## $ Loan_Amount : int 29900000 12200000 29700000 30700000 24200000 13500000 33000000 15000000 2200000 4300000 ...
## $ Education : Factor w/ 2 levels " Graduate"," Not Graduate": 1 2 1 1 2 1 1 1 1 2 ...
## $ Self_Employed: Factor w/ 2 levels " No"," Yes": 1 2 1 1 2 2 1 2 2 1 ...
## $ Cibil_Score : int 778 417 506 467 382 319 678 382 782 388 ...
#Ajuste del modelo
modelo <- glm(Loan_Status ~ Income + Loan_Amount + Education + Self_Employed + Cibil_Score, family = binomial, data = datos)
coefs <- summary(modelo)$coefficients
#Tabla
tabla_modelo <- data.frame(
Termino = rownames(coefs),
Logit = round(coefs[, "Estimate"], 3),
Odds_Ratio = round(exp(coefs[, "Estimate"]), 3),
row.names = NULL,
check.names = FALSE
)
tabla_modelo
## Termino Logit Odds_Ratio
## 1 (Intercept) 11.631 112493.314
## 2 Income 0.000 1.000
## 3 Loan_Amount 0.000 1.000
## 4 Education Not Graduate 0.071 1.074
## 5 Self_Employed Yes -0.056 0.945
## 6 Cibil_Score -0.022 0.978
+Intercepto: odds ratio -> representa el valor base cuando todas las demás variables son 0. Nos está indicando una probabilidad muy alta de que apruebe el préstamo.
+Income:odds ratio -> No tiene efecto positivo o negativo, cambios en el ingreso no afectan la probabilidad de que se apruebe el préstamo.
+Loan_Amount:odds ratio -> Tampoco afecta la probabilidad de que se les apruebe el préstamo de manera significativa.
+Education:odds ratio -> Las personas sin título universitario tienen 7.4 más probabilidad de se les apruebe el préstamo que los graduados, manteniendo las demás variables constantes.
+Self_Employed:odds ratio -> Los que trabajan por cuenta propia tienen 5.5% menos de probabilidad de que se les apruebe el préstamo.
+Cibil_Score:odds ratio -> Por cada unidad adicional en el puntaje CIBIL, las probabilidades de que se apruebe el evento disminuyen 2.2%, menteniendo las demás variables constantes.
Este modelo nos deja saber que ninguna variable numérica (ingreso o cantidad del préstamo) ejerce un efecto relevante sobre la probabilidad de que se apruebe un préstamo. Por otro lado, las características demográficas y crediticias muestras efectos pequeños. El efecto más notable es el intercepto elevado, nos deja saber que independientemente de las demás variables, es muy probable que se apruebe el préstamo.