En este análisis estadístico, examinaremos los factores que pueden influir en la aprobación de solicitudes de préstamo dentro de una institución financiera. Para este propósito, utilizaremos un conjunto de datos reales (Loan_Approval_Dataset.csv) que incluye información relevante sobre los solicitantes, tales como su situación laboral, activos reportados y el resultado final de la solicitud. Este análisis busca identificar las variables más determinantes en el proceso de aprobación, con el fin de comprender mejor los criterios que intervienen en la toma de decisiones.
# Datos del modelo
data <- data.frame(
status = Loan_Approval_Dataset$Loan_Status,
income = Loan_Approval_Dataset$Income,
loan = Loan_Approval_Dataset$Loan_Amount,
educ = Loan_Approval_Dataset$Education,
selfemploy = Loan_Approval_Dataset$Self_Employed,
cibil = Loan_Approval_Dataset$Cibil_Score
)
# Factores de las variables categóricas
data$status <- factor(data$status)
data$status <- relevel(data$status, ref = "Rejected")
data$educ <- factor(data$educ)
data$selfemploy <- factor(data$selfemploy)
#Ajuste del modelo
modelo <- glm(status ~ income + loan + educ + selfemploy + cibil,
family=binomial, data = data)
summary(modelo)
##
## Call:
## glm(formula = status ~ income + loan + educ + selfemploy + cibil,
## family = binomial, data = data)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.163e+01 4.019e-01 -28.939 < 2e-16 ***
## income -4.036e-07 5.502e-08 -7.337 2.18e-13 ***
## loan 1.320e-07 1.706e-08 7.734 1.04e-14 ***
## educNot Graduate -7.118e-02 1.118e-01 -0.637 0.524
## selfemployYes 5.635e-02 1.118e-01 0.504 0.614
## cibil 2.214e-02 7.137e-04 31.019 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 5660.7 on 4268 degrees of freedom
## Residual deviance: 2088.2 on 4263 degrees of freedom
## AIC: 2100.2
##
## Number of Fisher Scoring iterations: 7
Intercepto: Representa el estatus de las solicitudes de préstamo en el cual las personas que lo solicitan están graduadas, trabajan para alguien más y las demás variables explicativas tengan un valor de cero. Normalmente esto no ocurriría pero sirve como punto de partida para estudiar los factores. Cuando todas las variables tienen valor de cero hay una probabilidad muy alta de que el préstamo sea rechazado.
Ingreso mensual (USD): El cambio en el ingreso mensual no influye en la probabilidad de que el préstamo sea aprobado o rechazado.
Cantidad del monto solicitado (USD): La cantidad del monto solicitado en el préstamo no afecta la probabilidad de aprobar o rechazar la solicitud del préstamo.
Nivel educativo (graduado o no graduado): Un solicitante que no está graduado tiene una probabilidad de 6.9% menor de que el préstamo le sea aprobado en comparación con un solicitante que si está graduado. Es decir, manteniendo constante las variables numéricas, solicitantes no graduados y que están empleadas para alguién más tienen una menor probabilidad de que le aprueben el préstamo que personas graduadas empleadas para alguién más.
Trabaja por cuenta propia (Si o No): Solicitantes graduados que trabajan por cuenta propia tienen un 5.8% mayor de probabilidad de que su solicitud al préstamo sea aprobada que los solicitantes empleados por otro patrono, manteniendo constante las demás variables. Es decir, personas graduadas que trabajan para otra persona tienen menor probabilidad de aprobación al préstamo que personas graduadas que trabajan por cuenta propia con la misma cantidad de ingreso mensual, monto solicitado y puntaje crediticio.
Puntaje crediticio: Cuando el puntaje crediticio aumenta en un punto la probabilidad de que el préstamo sea aceptado aumenta en un 2.2% para los solicitantes graduados que están empleados para alguien más y las demás variables también se mantienen constantes. Es decir, mientras mayor sea el puntaje crediticio mayor será la probabilidad de que le aprueben el préstamo.