# Modelo logístico
modelo <- glm(Loan_Status ~ Income + Loan_Amount + Education + Self_Employed + Cibil_Score, family = binomial, data = loan)
modelo
##
## Call: glm(formula = Loan_Status ~ Income + Loan_Amount + Education +
## Self_Employed + Cibil_Score, family = binomial, data = loan)
##
## Coefficients:
## (Intercept) Income Loan_Amount
## -1.163e+01 -4.036e-07 1.320e-07
## EducationNot Graduate Self_EmployedYes Cibil_Score
## -7.118e-02 5.635e-02 2.214e-02
##
## Degrees of Freedom: 4268 Total (i.e. Null); 4263 Residual
## Null Deviance: 5661
## Residual Deviance: 2088 AIC: 2100
Se ajusta un modelo de regresión logística binaria, donde la variable dependiente es Loan_Status. El modelo busca estimar cómo el ingreso, el monto solicitado, el nivel educativo, el tipo de empleo y el puntaje crediticio afectan la probabilidad de aprobación.
# Coeficientes Escala Logit
summary(modelo)$coefficients
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.163065e+01 4.018963e-01 -28.9394277 3.812304e-184
## Income -4.036497e-07 5.501538e-08 -7.3370343 2.183786e-13
## Loan_Amount 1.319735e-07 1.706331e-08 7.7343389 1.039418e-14
## EducationNot Graduate -7.117561e-02 1.117877e-01 -0.6367036 5.243179e-01
## Self_EmployedYes 5.635005e-02 1.117936e-01 0.5040544 6.142231e-01
## Cibil_Score 2.213858e-02 7.137036e-04 31.0192857 2.962324e-211
En esta tabla se muestran los coeficientes en escala logit. Un valor positivo indica que al aumentar esa variable, crece el logaritmo de la razón de probabilidades de aprobación; uno negativo indica que disminuye.
#Odds Ratio
coefs <- summary(modelo)$coefficients
tabla_resultados <- data.frame(Termino = rownames(coefs), Logit_Beta = round(coefs[, "Estimate"], 3), Odds_Ratio = round(exp(coefs[, "Estimate"]), 3), row.names = NULL)
tabla_resultados
## Termino Logit_Beta Odds_Ratio
## 1 (Intercept) -11.631 0.000
## 2 Income 0.000 1.000
## 3 Loan_Amount 0.000 1.000
## 4 EducationNot Graduate -0.071 0.931
## 5 Self_EmployedYes 0.056 1.058
## 6 Cibil_Score 0.022 1.022
Intercepto:Loan_Status(-11.63) / OR(0.000): probabilidades base de aprobación del préstamo cuando todas las variables independientes valen cero es nula.
Income(-0.0000004) / OR(1.000): Por cada dólar adicional de ingreso mensual, la probabilidad de aprobación del préstamo disminuye 0.0%, manteniendo constantes las demás variables.
Loan_Amount(0.000000132) /OR(1.000): Al aumentar el monto solicitado por un dólar adicional, la probabilidad de aprobación aumenta 0.0%, manteniendo constante las demás variables.
Education(-0.071) / OR(0.931): Los solicitantes sin títulos universitarios tienen 6.9% menos probabilidad de obtener la aprobación del préstamo, en comparación con los solicitantes con títulos universitarios, manteniendo constantes las demás variables. El nivel de educación ayuda a la probabilidad de que te acepten un préstamo. (1-0.931=0.069)
Self_Employed(0.056) / OR(1.058): Los solicitantes que trabajan por cuenta propia tienen una probabilidad de aprobación de 5.8% mayor respecto a los que no trabajan por cuenta propia, manteniendo constantes las demás variables. (1.058-1=0.058)
Cibil_Score(0.022) / OR(1.022): por cada punto porcentual adicional en el puntaje crediticio aumenta la probabilidad de aprobación del préstamos un 2.2%, manteniendo constantes las demás variables. Tener un buen crédito aumenta positivamente la posibilidad de que un préstamo sea aprobado.(1.022-1=0.022)
Conclusión: A través de los modelos podemos concluir que Cibil Score y Educación son los factores que más aumentan la probabilidad de aprobación del préstamos. Las variables de Income, Loan_Amount y Self_Employed tienen un efecto muy pequeños / leves.