Modelo logístico

# Modelo logístico 
modelo <- glm(Loan_Status ~ Income + Loan_Amount + Education + Self_Employed + Cibil_Score, family = binomial, data = loan)

modelo
## 
## Call:  glm(formula = Loan_Status ~ Income + Loan_Amount + Education + 
##     Self_Employed + Cibil_Score, family = binomial, data = loan)
## 
## Coefficients:
##           (Intercept)                 Income            Loan_Amount  
##            -1.163e+01             -4.036e-07              1.320e-07  
## EducationNot Graduate       Self_EmployedYes            Cibil_Score  
##            -7.118e-02              5.635e-02              2.214e-02  
## 
## Degrees of Freedom: 4268 Total (i.e. Null);  4263 Residual
## Null Deviance:       5661 
## Residual Deviance: 2088  AIC: 2100

Se ajusta un modelo de regresión logística binaria, donde la variable dependiente es Loan_Status. El modelo busca estimar cómo el ingreso, el monto solicitado, el nivel educativo, el tipo de empleo y el puntaje crediticio afectan la probabilidad de aprobación.

Coeficientes Escala Logit

# Coeficientes Escala Logit
summary(modelo)$coefficients
##                            Estimate   Std. Error     z value      Pr(>|z|)
## (Intercept)           -1.163065e+01 4.018963e-01 -28.9394277 3.812304e-184
## Income                -4.036497e-07 5.501538e-08  -7.3370343  2.183786e-13
## Loan_Amount            1.319735e-07 1.706331e-08   7.7343389  1.039418e-14
## EducationNot Graduate -7.117561e-02 1.117877e-01  -0.6367036  5.243179e-01
## Self_EmployedYes       5.635005e-02 1.117936e-01   0.5040544  6.142231e-01
## Cibil_Score            2.213858e-02 7.137036e-04  31.0192857 2.962324e-211

En esta tabla se muestran los coeficientes en escala logit. Un valor positivo indica que al aumentar esa variable, crece el logaritmo de la razón de probabilidades de aprobación; uno negativo indica que disminuye.

Odds Ratio

#Odds Ratio
coefs <- summary(modelo)$coefficients

tabla_resultados <- data.frame(Termino = rownames(coefs), Logit_Beta = round(coefs[, "Estimate"], 3), Odds_Ratio = round(exp(coefs[, "Estimate"]), 3), row.names = NULL)

tabla_resultados
##                 Termino Logit_Beta Odds_Ratio
## 1           (Intercept)    -11.631      0.000
## 2                Income      0.000      1.000
## 3           Loan_Amount      0.000      1.000
## 4 EducationNot Graduate     -0.071      0.931
## 5      Self_EmployedYes      0.056      1.058
## 6           Cibil_Score      0.022      1.022

Intercepto:Loan_Status(-11.63) / OR(0.000): probabilidades base de aprobación del préstamo cuando todas las variables independientes valen cero es nula.

Income(-0.0000004) / OR(1.000): Por cada dólar adicional de ingreso mensual, la probabilidad de aprobación del préstamo disminuye 0.0%, manteniendo constantes las demás variables.

Loan_Amount(0.000000132) /OR(1.000): Al aumentar el monto solicitado por un dólar adicional, la probabilidad de aprobación aumenta 0.0%, manteniendo constante las demás variables.

Education(-0.071) / OR(0.931): Los solicitantes sin títulos universitarios tienen 6.9% menos probabilidad de obtener la aprobación del préstamo, en comparación con los solicitantes con títulos universitarios, manteniendo constantes las demás variables. El nivel de educación ayuda a la probabilidad de que te acepten un préstamo. (1-0.931=0.069)

Self_Employed(0.056) / OR(1.058): Los solicitantes que trabajan por cuenta propia tienen una probabilidad de aprobación de 5.8% mayor respecto a los que no trabajan por cuenta propia, manteniendo constantes las demás variables. (1.058-1=0.058)

Cibil_Score(0.022) / OR(1.022): por cada punto porcentual adicional en el puntaje crediticio aumenta la probabilidad de aprobación del préstamos un 2.2%, manteniendo constantes las demás variables. Tener un buen crédito aumenta positivamente la posibilidad de que un préstamo sea aprobado.(1.022-1=0.022)

Conclusión: A través de los modelos podemos concluir que Cibil Score y Educación son los factores que más aumentan la probabilidad de aprobación del préstamos. Las variables de Income, Loan_Amount y Self_Employed tienen un efecto muy pequeños / leves.