FACULTAD DE CIENCIAS

Modelos de Supervivencia y Series de Tiempo

Séptimo Semestre (2020-1)

PROYECTO 1
Integrantes del equipo:
  • Arredondo G Inda Jesús Antonio.
  • Castillo González Alan Jesús.
  • Pérez Ruiz María Fernanda.
  • Rodríguez Pérez Emmanuel.
  • Ruiz Puga Ingrid Pamela.
  • Sánchez Barajas Raúl Miguel.

Introducción

Es fundamental que el banco tenga la posibilidad de identificar a los clientes que puedan representar un riesgo.

Una estrategia de mitigación de riesgos es la clasificación de sus clientes de acuerdo a la perspectiva de riesgo crediticio, dónde se clasifican como alto o bajo riesgo.

Así, el banco deberá recabar la información que les permite conocer y asentar las razones por las que se consideran algunos clientes de alto riesgo.

Objetivos

Objetivo General

Nuestro objetivo general como asesores es darle a conocer al banco la mejor estrategia para que pueda seleccionar a sus clientes ,con base en sus características, con la finalidad de que permanezcan un mayor tiempo en el estado de bajo riesgo crediticio.

Objetivos Específicos

Para realizar el siguiente análisis, nos hemos planteado los siguientes objetivos a realizar para poder cumplir con el objetivo general:

  • Seleccionar y resaltar las variables que influyen en la clasificación de los clientes.

  • Por medio de diagramas hacer un análisis de los datos otorgados por el banco.

  • Aplicar métodos estadísticos de supervivencia para determinar la influencia de distintos facto res que propician que un cliente se encuentre en un estado de bajo o alto riesgo crediticio.

  • Proponer estrategias al banco para prevenir que sus clientes caigan en un alto riesgo crediticio.

Análisis

Realizamos tablas de contingencia, gráficas y la matriz de correlación, dónde podemos observar la frecuencia de las variables segun la clasificación de los cientes, tales como:

Diagrama de correlación

Diagrama de correlación

Figura 1: Diagrama de correlación.

Figura 1: Diagrama de correlación.

Se observa que las variables que estan más podria influir para que una persona sea clasificada de alto o bajo riesgo son: estado de la cuenta de cheques, proposito para el crédito, estado de ahorro, historial crediticio, otros planes de cuotas, trabajador extranjero.

Estado de la cuenta de cheques

Estado de la cuenta de cheques

bad good
<0 49.27007 50.72993
>=200 22.22222 77.77778
0<=X<200 39.03346 60.96654
no checking 11.67513 88.32487
Note:
Tabla dada en porcentajes.

La mayor proporción de clientes en riesgo están con saldos negativos en su cuenta de cheques con el banco.

Historial crediticio

Historial crediticio

Figura 2: Historial crediticio.

Figura 2: Historial crediticio.

Podemos ver que la categoria de pagos existentes es donde mayor proporción de los clientes con calificación mala. En cambio, en clientes que tienen otro crédito o están en una situación crítica actualmente cuentan con una mayor proporción con calificación buena, pero a la larga prodría traer problemas al banco.

Créditos existentes

Créditos existentes

bad good
31.59558 68.40442
27.62763 72.37237
21.42857 78.57143
33.33333 66.66667
Note:
Tabla dada en porcentajes.

La mayor proporción de lis clientes en riesgo son los que cuentan con cuatro créditos existentes

Propósito del crédito

Propósito del crédito

Figura 3: Propósito del crédito.

Figura 3: Propósito del crédito.

El gráfico anterior nos muestra la proporción en la cual se está usando el crédito solicitado por clientes con alto riesgo crediticio. Como se puede observar la mayor proporción se encuentra: para la compra de autos nuevos, en la compra de muebles y equipo de radio/TV.

Tipo de trabajo

Tipo de trabajo

high qualif/self emp/mgmt skilled unemp/unskilled non res unskilled resident
bad 17.00000 62.00000 2.333333 18.66667
good 13.85714 63.42857 2.142857 20.57143
Note:
Tabla dada en porcentajes.

El 62% de las personas clasificadas en alto riesgo estan en la categoria de “expertos”.

Tiempo empleado

Tiempo empleado

Figura 4: Tiempo empleado.

Figura 4: Tiempo empleado.

El mayor número de personas de alto y bajo riesgo son los que han trabajado entre 1 y 4 años.

Trabajador foraneo

Trabajador foraneo

no yes
bad 1.333333 98.66667
good 4.714286 95.28571
Note:
Tabla dada en porcentajes.

La mayoría de la cartera de los clientes en alto y bajo riesgo son foraneos.

Variables

Hasta ahora los clientes clasificados de alto y bajo riesgo se concentran en la misma categoria de la mayoria de las variables, por lo que no es determinante para tomar una decision que impacte en la estrategia. Solamente el estado de la cuenta de cheques y el proposito se contrasta en diferentes categorias según el tipo de cliente.

Propositos de crédito

Figura 5: Propósitos de crédito.

Figura 5: Propósitos de crédito.

Cuenta de cheques

Figura 5: Propósitos de crédito.

Figura 5: Propósitos de crédito.

Se observa que la mayoría d elos clientes en estado de alto riesgo tienen saldo negativo en su cuenta de cheques.

De lo descrito anterior podemos inferir que las categorías “Propósito” y “Cuenta de cheques” influyen en como se clasifica el cliente del banco.

Analisís de Supervivencia

Se hace un análisis de supervivencia de la duración con respecto al tiempo de fallo o censura, donde se considera como fallo el momento en el que se clasifica como cliente de “alto riesgo” y como censura si permanece en la clasificación de bajo riesgo.

A continuación se tomó una muestra aleatoria representativa de los clientes , con los cuales, graficamos los tiempos de supervivencia de la respectiva muestra, donde 1 representa que un cliente fue clasificado de alto riesgo y 0 si se mantuvo como un cliente de bajo riesgo, se observa lo siguiente.

Dentro de los 30 clientes en la muestra, únicamente 6 presentaron el fallo, es decir, en esta muestra el 20% de los clientes son clasificados como “alto riesgo”

A continuación se presentan las gráficas de supervivencia para analizar las variables que se consideraron más importates.

Figura 7: Supervivencia en estado de bajo riesgo.

Figura 7: Supervivencia en estado de bajo riesgo.

Podemos observar el comportamiento que los clientes han tenido con el banco. Notamos que en particular después de los 3 años se tiene el 50 % de probabilidad de permanecer en estado de bajo riesgo crediticio.

Figura 8: Supervivencia de los clientes segun historial crediticio.

Figura 8: Supervivencia de los clientes segun historial crediticio.

Para la curva de “Todo pagado” observamos que en proporción, al año 2, se tiene el 50% de sobrevivencia de los clientes, mientras que, para “Otro credito existente” dicha sobrevivencia la podemos encontrar hasta el cuarto año.

Contrastando ambas curvas de supervivencia vemos que el tiempo de supervivencia para otro credito existente es mayor, sin embargo tenemos censurada esta variable al año 5.

Figura 9: Supervivencia de los clientes segun el proposito del crédito.

Figura 9: Supervivencia de los clientes segun el proposito del crédito.

Observando las curvas de supervivencia para “electrodomésticos” y “carro usado” con la menor y mayor supervivencia respectivamente podemos notar que en los primeros 4 años es mayor la sobrevivencia de los clientes cuyo proposito es comprar un carro usado que los que compran electrodomesticos.

Figura 10: Supervivencia de los clientes segun el la cuenta de cheques.

Figura 10: Supervivencia de los clientes segun el la cuenta de cheques.

Observando que los clientes cuyo estado de cuenta de cheques con saldo negativo tienen una menor supervivencia que todos los demas tipos de saldos. Contrastando con la supervivencia de los clientes sin una cuenta de cheques pues su probabilidad de supervivencia es evidentemente mayor que los tipos de cuenta anteriores.

Estadisticamente se tienen evidencias para poder decir que los clientes sin cuenta de cheques se mantienen mayor tiempo en estado de bajo riesgo crediticio.

Figura 11: Supervivencia de los clientes segun el tiempo de empleo.

Figura 11: Supervivencia de los clientes segun el tiempo de empleo.

Los clientes que tienen una mayor probabilidad de supervivencia en estado de bajo riesgo a través del tiempo, son quienes han estado empleados entre cuatro y siete años pues razonablemente las personas con menor estabilidad en un trabajo, es decir, los desempleados y los que tienen menos de un año trabajando pueden cambiar a un estado de alto riesgo crediticio más facilmente, pues tienen menor probabilidad de supervivencia. Notando que en el grupo de los desempleados se pueden encontrar personas quienes cuenten con un trabajo informal, este hecho puede explicar que las supervivencia de este grupo se mayor que los que han estado empleados durante un tiempo menor a un año.

Figura 11: Supervivencia de los clientes segun el tipo de trabajo.

Figura 11: Supervivencia de los clientes segun el tipo de trabajo.

La mayor sobrevivencia se encuentra en los empleados que estan “altamente calificados” pues su curva se encuentra siempre por encima del tipo de empeado “bajo perfil de habilidades” por lo que debemos interpretar que es más factible la duración de clientes altamente calificados en la clasificación de bajo riesgo crediticio.

Figura 12: Supervivencia de los clientes segun otras deudas existentes.

Figura 12: Supervivencia de los clientes segun otras deudas existentes.

Los clientes quienes tienen otras deudas bancarias tienen menor probabilidad de permanecer en estado de bajo riesgo crediticio. Contra los clientes que no tienen deudas adicionales, pues su supervivencia es mayor a la anteriormente descrita.

Figura 13: Supervivencia de los clientes según empleado extranjero.

Figura 13: Supervivencia de los clientes según empleado extranjero.

Comparando con los resultados obtenidos en la tabla de contingencia ubicada en la sección anterior, donde resaltabamos que en ambas clasificaciones de alto y bajo riesgo se encontraban en su mayoría clientes de procedencia extranjera en donde encontrabamos el dilema en de identificar si la categoría de trabajador extranjero era un factor a favor o en contra de la calificación crediticia de los clientes del banco, podemos observar que los clientes extranjeros permanecen un mayor tiempo en la clasificación deseada por el banco, ya que la supervivencia de los clientes nacionales falla por completo en el cuarto año. Enfatizando que los clientes nacionales tiene una probabilidad del 70% de mantenerse en un estado de bajo riesgo crediticio la cual no cambia durante los meses 20 a 48, a diferencia de los extranjeros que cuya probabilidad disminuye en el mismo período.

Figura 14: Supervivencia de los clientes según su cuenta de ahorros.

Figura 14: Supervivencia de los clientes según su cuenta de ahorros.

Por lo general, las probabilidades de las demás categorías van disminuyendo en el período del mes 25 al 48 mientras que los clientes que tienen ahorros mayores o iguales a 1000 unidades monetarias su probabilidad se mantiene constante en dicho período.

Funciones de Riesgo Acumulado

Figura 15: Riesgo Acumulado de los clientes según su monto de crédito.

Figura 15: Riesgo Acumulado de los clientes según su monto de crédito.

Se observa que el grupo de clientes con un monto de credito entre 1000 y 2000 u.m. hay más riesgo de caer en estado de alto riesgo a diferencia de los otros dos grupos. También se observa que aunque en el grupo de clientes con montos de credito mayores a 3000 es el que más clientes tiene, en este se tiene menor riesgo.

Figura 16: Riesgo Acumulado de los clientes según su edad.

Figura 16: Riesgo Acumulado de los clientes según su edad.

Se observa que en el grupo de clientes de edad menor a 30 años hay más riesgo de caer en estado de alto riesgo a diferencia de los otros dos grupos. También se observa que aunque en el grupo de clientes con edades entre 30 y 60 años se tiene el mayor numero de clientes, en este se tiene menor riesgo.

Figura 17: Riesgo Acumulado de los clientes segun su estado de cuenta de cheques.

Figura 17: Riesgo Acumulado de los clientes segun su estado de cuenta de cheques.

Se observa que en el grupo de clientes con “cuenta de cheques negativa” hay más riesgo de caer en estado de alto riesgo a diferencia de los otros tres grupos. También se observa que aunque en el grupo de clientes “sin cuenta de cheques” se tiene el mayor numero de clientes, en este se tiene menor riesgo.

Figura 18: Riesgo Acumulado de los clientes segun sus créditos existentes.

Figura 18: Riesgo Acumulado de los clientes segun sus créditos existentes.

Si bien es más conveniente analizar a los grupos con uno o dos créditos existentes, pues ahí es donde se concentra la mayor parte de los clientes, se tiene que el riesgo es prácticamente el mismo para las curvas.

Puebas de simulitud para curvas de supervivencia

## Call:
## survdiff(formula = Surv(time = duration, event = fallo) ~ existing_credits, 
##     data = data)
## 
##                      N Observed Expected (O-E)^2/E (O-E)^2/V
## existing_credits=1 633      200   192.23    0.3140    1.0011
## existing_credits=2 333       92   101.14    0.8268    1.4268
## existing_credits=3  28        6     4.97    0.2113    0.2395
## existing_credits=4   6        2     1.65    0.0743    0.0821
## 
##  Chisq= 1.6  on 3 degrees of freedom, p= 0.7

Mediante una prueba para conocer las similitudes entre curvas de supervivencia, notamos que no se parecen las curvas de las distintas categorias que distinguen a los clientes con 1, 2, 3 o 4 creditos existentes pues no encontramos similitudes entre quienes cuentan con 1 y 2 creditos; y quieres cuentan con 3 y 4 créditos.

## Call:
## survdiff(formula = Surv(time = duration, event = fallo) ~ foreign_worker, 
##     data = data)
## 
##                      N Observed Expected (O-E)^2/E (O-E)^2/V
## foreign_worker=no   37        4     3.97  1.74e-04  0.000198
## foreign_worker=yes 963      296   296.03  2.34e-06  0.000198
## 
##  Chisq= 0  on 1 degrees of freedom, p= 1

Dada la prueba de hipótesis realizada para comparar las funciones de supervivencia de los trabajadores nacionales y extranjeros, podemos notar que la hipótesis para determinar si las probabilidades de supervivencia en el estado de bajo riesgo para ambos grupos se parecen se rechaza.

## Call:
## survdiff(formula = Surv(time = duration, event = fallo) ~ purpose, 
##     data = data)
## 
##                               N Observed Expected (O-E)^2/E (O-E)^2/V
## purpose=business             97       34   44.531    2.4906     3.468
## purpose=domestic appliance   12        4    2.627    0.7176     0.846
## purpose=education            50       22   15.983    2.2653     2.792
## purpose=furniture/equipment 181       58   43.878    4.5454     6.000
## purpose=new car             234       89   57.717   16.9561    24.154
## purpose=other                12        5    7.894    1.0607     1.347
## purpose=radio/tv            280       62   79.163    3.7209     5.826
## purpose=repairs              22        8    5.081    1.6775     1.866
## purpose=retraining            9        1    0.834    0.0328     0.035
## purpose=used car            103       17   42.293   15.1266    20.235
## 
##  Chisq= 56.1  on 9 degrees of freedom, p= 7e-09

Mediante la prueba de hipótesis se afirma que las curvas de supervivencia de propósito para el crédito no tienen similitudes pues sus probabilidades de permanecer en un estado de bajo riesgo es diferente para todos los propósitos.

Conclusión

Por lo anteriormente analizado podemos sugerir que el banco debe prestar atención a que tipo de personas les esta otorgando créditos, pues debe evitar facilitar créditos a personas cuyo saldo en cuenta de cheques sea negativo, o si el propósito del crédito es para un auto nuevo o electrodomésticos pues podemos sugerir que la probabilidad de los clientes que tienen estos propósitos es menor que la probabilidad de otro propósito de mantenerse en un estado de bajo riesgo. Adicionalmente se le sugiere otorgar créditos a las personas con antiguedad de 4 a 7 años, pues resultan las que se mantienen mayor tiempo en estado de bajo riesgo. Los clientes que tienen mayor probabilidad de presentar el fallo, es decir, los clientes que pueden presentar mayor riesgo son las personas con edad menor a 30 años. Tanto para las personas que cuentan con 1 o 2 créditos son quienes presentan mayor riesgo de caer en la clasificación de cliente de alto riesgo crediticio.