Introducción

EL presente trabajo busca realizar un análisis bivariado. Los datos utilizados en este análisis provienen de LendingClub.com, una plataforma que conecta a personas que necesitan dinero (prestatarios) con aquellas que buscan oportunidades de inversión (inversores). El objetivo del inversor es identificar a prestatarios con un perfil que demuestre una alta probabilidad de devolver el préstamo en su totalidad.

En este caso, se trabajará con datos de préstamos emitidos entre 2007 y 2010, con el propósito de analizar la calidad del prestatario. Los datos contienen diversas características del prestatario, que permiten determinar su probabilidad de impago. La base consta de 9578 observaciones y 14 variables.

A continuación, se describe el significado de algunas de las variables:

  • credit.policy: Indica si el cliente cumple con los criterios de suscripción de créditos de LendingClub.com (1 si cumple, 0 en caso contrario).
  • purpose: El propósito del préstamo, que puede ser para tarjeta de crédito, consolidación de deudas, educación, compras importantes, negocios pequeños u otros.
  • int.rate: La tasa de interés del préstamo como una proporción (por ejemplo, una tasa del 11% se almacenaría como 0.11). A los prestatarios considerados de mayor riesgo se les asignan tasas de interés más altas.
  • installment: Las cuotas mensuales que el prestatario debe pagar si el préstamo es financiado.
  • log.annual.inc: El logaritmo natural del ingreso anual declarado por el prestatario.
  • dti: La relación deuda-ingreso del prestatario (cantidad de deuda dividida entre el ingreso anual).
  • fico: La puntuación de crédito FICO del prestatario.
  • days.with.cr.line: El número de días que el prestatario ha tenido una línea de crédito.
  • revol.bal: El saldo revolving del prestatario (cantidad no pagada al final del ciclo de facturación de la tarjeta de crédito).
  • revol.util: La tasa de utilización de la línea de crédito revolving del prestatario (proporción de crédito utilizado en relación con el total disponible).
  • inq.last.6mths: El número de consultas de crédito realizadas por los acreedores en los últimos 6 meses.
  • delinq.2yrs: El número de veces que el prestatario ha tenido pagos retrasados por más de 30 días en los últimos 2 años.
  • pub.rec: El número de registros públicos desfavorables del prestatario, como quiebras, gravámenes fiscales o juicios.

Estadística descriptiva

A continuación, se puede se puede observar que la tasa de interés promedio de la muestra es de 12.21%, en promedio el logaritmo del ingreso anual 10.929, el ratio deuda ingreso es de 12.607 en proemdio, mientras que el puntaje fico tiene una media de 710.8.

##     int.rate      log.annual.inc        dti              fico      
##  Min.   :0.0600   Min.   : 7.548   Min.   : 0.000   Min.   :612.0  
##  1st Qu.:0.1039   1st Qu.:10.558   1st Qu.: 7.213   1st Qu.:682.0  
##  Median :0.1221   Median :10.929   Median :12.665   Median :707.0  
##  Mean   :0.1226   Mean   :10.932   Mean   :12.607   Mean   :710.8  
##  3rd Qu.:0.1407   3rd Qu.:11.291   3rd Qu.:17.950   3rd Qu.:737.0  
##  Max.   :0.2164   Max.   :14.528   Max.   :29.960   Max.   :827.0

El siguiente gráfico muestra la distribución de la tasa de interés de los créditos otorgados,a partir de el se podría tener la hipótesis que la tasa de interés tiene una distribución normal.

El siguiente gráfico muestra la distribución del puntaje fico de los prestarios, el cual presenta un sesgo positivo en su distribución.

La mayor cantidad de créditos corresponde a la consolidación de deudas. La consolidación de deudas implica obtener un nuevo préstamo o tarjeta de crédito para pagar otros préstamos o tarjetas de crédito existentes.

Relación entre variables

Hipótesis de correlación

H1: Relación entre la tasa de interés y el ingreso anual (Indirecta)
H2: Relación entre la tasa de interés y la relación entre la deuda y el ingreso (Directa)
H3: Relación entre la tasa de interés y el puntaje de credito (Indirecta)

A continuación se presenta el gráfico de la prueba de correlación entre las variables seleccionadas:

Análisis de correlación

En cuanto a la primera hipótesis, esta no se cumplió dado que la relación entre la tasa de interés y el ingreso anual, si bien es muy pequeña (0.06) es directa y no inversa como se había propuesto.

En cuanto a la segunda hipótesis, esta si se cumplió dado que la relación entre la tasa de interés y la relación entre la deuda y el ingreso, si bien es pequeña (0.22) es directa como se había propuesto.

En cuanto a la tercera hipótesis, esta si se cumplió con mayor seguridad dado que la relación entre la tasa de interés y el puntaje de crediticio es bastante baja (-0.71) y es indirecta como se había propuesto.

Hipótesis de \(\chi^2\)

H1: Existe una relación significativa entre el uso de tarjetas de crédito y el desconocimiento de las políticas de aseguramiento relacionadas con los créditos bancarios. Esto debido a que las tarjetas de crédito pueden ser un primer acercamiento al crédito para muchas personas, personas que podrían estar menos informadas que quienes ya han accedido antes.

H2: Existe una relación significativa entre la finalidad de un préstamo para “debt consolidation” y la probabilidad de que el cliente pague completamente su deuda. La relación se propone porque comúnmente estos “debt consolidation” funcionan como una alternativa a los clientes para reestructurar sus créditos para mayor conveniencia para ellos, haciendo que solo haya una entidad acreedora y en algunos casos tasas de interés y planes de pago más cómodos para los clientes.

H3 Existe una relación significativa entre el propósito del préstamo para pequeño negocio (small business) y el incumplimiento de pago completo. Esto se propone debido a que los emprendimientos no son inversiones rentables o seguras en el corto plazo y esto expone a las personas al riesgo de incumplimiento de pago.

A continuación se presentan los gráficos de la prueba de \(\chi^2\) entre las variables seleccionadas:

Asumiendo una significancia del 5%, teniendo en cuenta los valores de p obtenidos para las dos primeras hipótesis, no hay suficiente evidencia para afirmar que existe una relación entre las variables, esto aplica para ambas hipótesis planteadas.

Al mismo tiempo, para la tercera hipótesis, hay suficiente evidencia para no rechazar una posible relación entre los clientes que solicitan un préstamo para emprendimiento y su incumplimiento en el pago de su crédito.