EL presente trabajo busca realizar un análisis bivariado. Los datos utilizados en este análisis provienen de LendingClub.com, una plataforma que conecta a personas que necesitan dinero (prestatarios) con aquellas que buscan oportunidades de inversión (inversores). El objetivo del inversor es identificar a prestatarios con un perfil que demuestre una alta probabilidad de devolver el préstamo en su totalidad.
En este caso, se trabajará con datos de préstamos emitidos entre 2007 y 2010, con el propósito de analizar la calidad del prestatario. Los datos contienen diversas características del prestatario, que permiten determinar su probabilidad de impago. La base consta de 9578 observaciones y 14 variables.
A continuación, se describe el significado de algunas de las variables:
A continuación, se puede se puede observar que la tasa de interés promedio de la muestra es de 12.21%, en promedio el logaritmo del ingreso anual 10.929, el ratio deuda ingreso es de 12.607 en proemdio, mientras que el puntaje fico tiene una media de 710.8.
## int.rate log.annual.inc dti fico
## Min. :0.0600 Min. : 7.548 Min. : 0.000 Min. :612.0
## 1st Qu.:0.1039 1st Qu.:10.558 1st Qu.: 7.213 1st Qu.:682.0
## Median :0.1221 Median :10.929 Median :12.665 Median :707.0
## Mean :0.1226 Mean :10.932 Mean :12.607 Mean :710.8
## 3rd Qu.:0.1407 3rd Qu.:11.291 3rd Qu.:17.950 3rd Qu.:737.0
## Max. :0.2164 Max. :14.528 Max. :29.960 Max. :827.0
El siguiente gráfico muestra la distribución de la tasa de interés de los créditos otorgados,a partir de el se podría tener la hipótesis que la tasa de interés tiene una distribución normal.
El siguiente gráfico muestra la distribución del puntaje fico de los prestarios, el cual presenta un sesgo positivo en su distribución.
La mayor cantidad de créditos corresponde a la consolidación de deudas. La consolidación de deudas implica obtener un nuevo préstamo o tarjeta de crédito para pagar otros préstamos o tarjetas de crédito existentes.
H1: Relación entre la tasa de interés y el ingreso
anual (Indirecta)
H2: Relación entre la tasa de interés y la relación
entre la deuda y el ingreso (Directa)
H3: Relación entre la tasa de interés y el puntaje de
credito (Indirecta)
A continuación se presenta el gráfico de la prueba de correlación entre las variables seleccionadas:
En cuanto a la primera hipótesis, esta no se cumplió dado que la relación entre la tasa de interés y el ingreso anual, si bien es muy pequeña (0.06) es directa y no inversa como se había propuesto.
En cuanto a la segunda hipótesis, esta si se cumplió dado que la relación entre la tasa de interés y la relación entre la deuda y el ingreso, si bien es pequeña (0.22) es directa como se había propuesto.
En cuanto a la tercera hipótesis, esta si se cumplió con mayor seguridad dado que la relación entre la tasa de interés y el puntaje de crediticio es bastante baja (-0.71) y es indirecta como se había propuesto.
H1: Existe una relación significativa entre el uso de tarjetas de crédito y el desconocimiento de las políticas de aseguramiento relacionadas con los créditos bancarios. Esto debido a que las tarjetas de crédito pueden ser un primer acercamiento al crédito para muchas personas, personas que podrían estar menos informadas que quienes ya han accedido antes.
H2: Existe una relación significativa entre la finalidad de un préstamo para “debt consolidation” y la probabilidad de que el cliente pague completamente su deuda. La relación se propone porque comúnmente estos “debt consolidation” funcionan como una alternativa a los clientes para reestructurar sus créditos para mayor conveniencia para ellos, haciendo que solo haya una entidad acreedora y en algunos casos tasas de interés y planes de pago más cómodos para los clientes.
H3 Existe una relación significativa entre el propósito del préstamo para pequeño negocio (small business) y el incumplimiento de pago completo. Esto se propone debido a que los emprendimientos no son inversiones rentables o seguras en el corto plazo y esto expone a las personas al riesgo de incumplimiento de pago.
A continuación se presentan los gráficos de la prueba de \(\chi^2\) entre las variables seleccionadas:
Asumiendo una significancia del 5%, teniendo en cuenta los valores de p obtenidos para las dos primeras hipótesis, no hay suficiente evidencia para afirmar que existe una relación entre las variables, esto aplica para ambas hipótesis planteadas.
Al mismo tiempo, para la tercera hipótesis, hay suficiente evidencia para no rechazar una posible relación entre los clientes que solicitan un préstamo para emprendimiento y su incumplimiento en el pago de su crédito.