library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.4.3
## corrplot 0.95 loaded
library(readxl)
datos <- read_excel("CREDITOS.xlsx")
ggplot(datos, aes(x = factor(EDAD))) +
  geom_bar(fill = "skyblue", color = "black") +
  geom_text(stat = "count", aes(label = ..count..), vjust = -0.5) + 
  labs(title = "Distribución de Edades", x = "Edad", y = "Frecuencia") +
  theme_minimal()
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

GRAFICA 1: SOLICITUD DE CRÉDITOS POR EDAD

datos %>% 
  group_by(EDAD, Solicitud = `¿Usted solicitó algún(os) crédito(s) y/o préstamo(s) durante el último año?`) %>% 
  summarise(Conteo = n(), .groups = "drop") %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Solicitud)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +  # Espaciado entre barras
  geom_text(aes(label = Conteo), 
            position = position_dodge(width = 0.8), 
            vjust = -0.3, 
            size = 3) +  # Tamaño de las etiquetas
  labs(title = "Solicitud de Crédito por Edad", 
       x = "Edad", 
       y = "Número de Personas") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 10),  # Rotar etiquetas del eje X
        plot.margin = margin(10, 10, 10, 10)) 

GRAFICA 2: SOLICITUD DE CRÉDITOS POR EDAD (18-21)

datos %>% 
  filter(EDAD >= 18 & EDAD <= 21) %>%  # Filtra edades entre 18 y 21 años
  group_by(EDAD, Solicitud = `¿Usted solicitó algún(os) crédito(s) y/o préstamo(s) durante el último año?`) %>% 
  summarise(Conteo = n(), .groups = "drop") %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Solicitud)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Solicitud de Crédito por Edad (18-21 años)", x = "Edad", y = "Número de Personas") +
  theme_minimal()

Se puede observar que los jóvenes de 18 años son quienes menos solicitan y tienen créditos de toda la población encuestada, en este caso, un total de 132 personas, seguido de los jóvenes de 19 años.

Además, los jóvenes de 20 años encuestados fueron los que más solicitaron crédito por primera vez en el último año.

Por último, las personas de 19 años fueron quienes más solicitaron créditos por primera vez en el último año de la población encuestada.

GRAFICA 3: SOLICITUD DE CRÉDITOS POR EDAD (22-25)

datos %>% 
  filter(EDAD >= 22 & EDAD <= 25) %>%  
  group_by(EDAD, Solicitud = `¿Usted solicitó algún(os) crédito(s) y/o préstamo(s) durante el último año?`) %>% 
  summarise(Conteo = n(), .groups = "drop") %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Solicitud)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Solicitud de Crédito por Edad (22-25 años)", x = "Edad", y = "Número de Personas") +
  theme_minimal()

En esta gráfica se puede apreciar que los adultos-jóvenes de 24 años son las personas que más poseen créditos , apesar de que no hayan sido solicitados específicamente en el último año. En este caso, respondieron 16 de ellos que ya poseían un crédito con anterioridad, y 12 de ellos que si solicitaron un crédito en el último año, pero que además ya tenían otros créditos.

En general, se puede apreciar que en todas las edades, la propensión a solicitar créditos en el último año no fue muy alta, y que de la población encuestada, 828 de ellos no tienen créditos, es decir, el 79%.

GRAFICA 4: RAZONES POR LAS QUE NO SOLICITÓ CRÉDITO POR EDAD

datos %>% 
  filter(!is.na(`¿Cuál(es) es(son) la(s) razón(es) por la(s) que no solicitó crédito en el último año?`)) %>%  
  group_by(EDAD, Motivo_no_solicitud = `¿Cuál(es) es(son) la(s) razón(es) por la(s) que no solicitó crédito en el último año?`) %>% 
  summarise(Conteo = n(), .groups = "drop") %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Motivo_no_solicitud)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +  # Espaciado entre barras
  geom_text(aes(label = Conteo), 
            position = position_dodge(width = 0.8), 
            vjust = -0.3, 
            size = 3) +  # Tamaño de etiquetas
  labs(title = "Razones para no solicitar crédito por Edad", 
       x = "Edad", 
       y = "Número de Personas") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 10),  # Rotar etiquetas del eje X
        plot.margin = margin(10, 10, 10, 10))

## INTERPRETACIÓN

Las razones por las cuales no se solicitó el crédito fue principalmente por que a los jovenes adultos “No les gusta tener deudas”, estas cifras varían entre 68 y 83 para el grupo entre 18 y 21 años. Mientras que en el grupo de 22 a 25 años los valores predominantes son entre 51 y 65 personas. Este patrón sugiere que la aversión al endeudamiento es el mayor obstáculo para la adquisición de crédito, incluso en el momento que las personas empiezan a adquirir mayor independencia financiera.

Otras razones por las cuales no se solicita el crédito es porque “no entiende cómo funciona un crédito ni los pagos asociados al mismo”, “No tiene cómo responder / ingresos bajos”, “No tiene vida crediticia”. Estas tres razones se pueden definir como la falta de conocimiento financiero por parte de los encuestados, o problemas financieros que no permiten la capacidad de pago.

Los jovenes tienen una percepción negativa del endeudamiento, posiblemente por miedo a comprometerse con pagos a largo plazo. Este se debe por su incertidumbre ante el futuro, o por el ambiente actual que es adverso a la planeación a largo plazo.

GRAFICA 5: RAZONES POR LAS QUE NO SOLICITÓ CRÉDITO POR EDAD (18-21)

datos %>% 
  filter(!is.na(`¿Cuál(es) es(son) la(s) razón(es) por la(s) que no solicitó crédito en el último año?`), 
         EDAD >= 18 & EDAD <= 21) %>%  
  group_by(EDAD, Motivo_no_solicitud = `¿Cuál(es) es(son) la(s) razón(es) por la(s) que no solicitó crédito en el último año?`) %>% 
  summarise(Conteo = n(), .groups = "drop") %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Motivo_no_solicitud)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +  # Espaciado entre barras
  geom_text(aes(label = Conteo), 
            position = position_dodge(width = 0.8), 
            vjust = -0.3, 
            size = 3) +  # Tamaño de etiquetas
  labs(title = "Razones para no solicitar crédito por Edad (18-21 años)", 
       x = "Edad", 
       y = "Número de Personas") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1, size = 10),  # Rotar etiquetas del eje X
        plot.margin = margin(10, 10, 10, 10)) 

GRAFICA 6: RAZONES POR LAS QUE NO SOLICITÓ CRÉDITO POR EDAD (22-25)

datos %>% 
  filter(!is.na(`¿Cuál(es) es(son) la(s) razón(es) por la(s) que no solicitó crédito en el último año?`),  # Filtrar valores NA
         EDAD >= 22 & EDAD <= 25) %>%  
  group_by(EDAD, Motivo_no_solicitud = `¿Cuál(es) es(son) la(s) razón(es) por la(s) que no solicitó crédito en el último año?`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Motivo_no_solicitud)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Razones para no solicitar crédito por Edad (22-25 años)", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

GRAFICA 7: ENTIDADES A LAS QUE SOLICITÓ CRÉDITO POR EDAD

datos %>% 
  filter(!is.na(`¿Ante qué entidades solicitó su(s) crédito(s) y/o préstamo(s)?`)) %>%  # Filtrar valores NA
  group_by(EDAD, Entidad = `¿Ante qué entidades solicitó su(s) crédito(s) y/o préstamo(s)?`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Entidad)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Entidad en la que solicitó el crédito por Edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

En la gráfica se analizan las distintas entidades en las que los adultos jovenes solicitaron crédito según su edad. Los bancos son la principal fuente de crédito en todas las edades, seguido de las cooperativas y luego almacenes.

Se puede notar que los jóvenes entre los 21 y 22 años son quienes solicitan prestamos a gota a gota y que a medida que aumenta la edad, las personas prefieren acudir solamente a entidades más formales, como por ejemplo los bancos, compañías de ifnanciamiento y cooperativas. Diferente a lo observado en edades tempranas ( 18-22 años), que acuden a distintas instituciones, y hasta a familiares.

GRAFICA 8: TIPO DE CRÉDITO SOLICITADO POR EDAD

datos %>% 
  filter(!is.na(`¿Qué tipo de crédito(s) solicitó?`)) %>%  # Filtrar valores NA
  group_by(EDAD, Tipo_credito = `¿Qué tipo de crédito(s) solicitó?`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Tipo_credito)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Tipo de crédito solicitado por Edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

Este gráfico representa la cantidad de jóvenes entre 18 y 25 años que han solicitado distintos tipos de crédito. Se observa una tendencia clara en las preferencias de financiamiento según la edad. Los créditos más solicitados son las tarjetas de crédito y los créditos de vivienda. La tarjeta de crédito es la opción más frecuente en todas las edades, con un pico a los 24 años (10 personas). Mientras que el crédito de vivienda gana relevancia a partir de los 20 años y tiene su punto más alto a los 23 años (8 personas), se especula que es que los jóvenes a esta edad ya están planeando asentarse o vivir separado de sus padres. Por otro lado, los créditos de consumo y microcréditos tienen una demanda baja

Se puede deducir que los jóvenes tienen preferencia por tarjetas de crédito, ya que son el primer producto financiero de crédito al que acceden los jóvenes. Las tarjetas de crédito son más fáciles de obtener en comparación con otros tipos de crédito. El crédito de consumo y los microcréditos tienen menor demanda en esta población, posiblemente porque las tarjetas suplen sus necesidades inmediatas.

GRAFICA 9: APROBACIÓN O DESAPROBACIÓN DE CRÉDITOS POR EDAD

datos %>% 
  filter(!is.na(`¿Le fue aprobado el (los) crédito(s) que solicitó?`)) %>%  # Filtrar valores NA
  group_by(EDAD, Aprobado = `¿Le fue aprobado el (los) crédito(s) que solicitó?`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Aprobado)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Aprobación de créditos por Edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

Este gráfico muestra la cantidad de créditos aprobados y rechazados en diferentes edades, proporcionando una visión sobre la facilidad o dificultad para acceder al crédito en jóvenes entre 18 y 25 años. Se descubrió que la tasa de aprobación aumenta con la edad:

A partir de los 20 años, los aprobados superan considerablemente a los rechazados. A los 23 años, se observa el pico más alto de aprobaciones (18 personas).   A medida que pasa el tiempo, los jóvenes adquieren trabajos estables o estudios universitarios con respaldo financiero. A medida que los jóvenes usan productos financieros como tarjetas de crédito, van construyendo su historial. La tasa de aprobación mejora con la edad, alcanzando su punto máximo entre los 23 y 25 años. El número de rechazos se mantiene bajo y estable a partir de los 20 años, lo que indica que la mayoría de quienes aplican cumplen con los requisitos.

GRAFICA 10: RAZON DE DESAPROBACIÓN DE CRÉDITOS POR EDAD

datos %>% 
  filter(!is.na(`¿Por qué le negaron el (los) crédito(s) que solicitó?`)) %>%  # Filtrar valores NA
  group_by(EDAD, Motivo_no_aprobación = `¿Por qué le negaron el (los) crédito(s) que solicitó?`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Motivo_no_aprobación)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Motivo de no aprobación de créditos por Edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

Este gráfico muestra las razones principales por las que los créditos no fueron aprobados según la edad de los solicitantes. El motivo más común es “No tengo historial crediticio”, lo cual es muy común en los jóvenes entre 19 y 22 años. Esto confirma que la falta de historial crediticio es una barrera importante para acceder a préstamos.

Además del historial, se observan otros factores como la falta de garantías. A partir de los 24 años, comienzan a aparecer casos de personas reportadas en centrales de riesgo, lo que les impide acceder a nuevos créditos.

GRAFICA 11: USO DEL ÚLTIMO CRÉDITO APROBADO POR EDAD

datos %>% 
  filter(!is.na(`¿Para qué utilizó usted el último crédito aprobado?`)) %>%  # Filtrar valores NA
  group_by(EDAD, Uso = `¿Para qué utilizó usted el último crédito aprobado?`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = Uso)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Uso del último crédito aprobado por Edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

El análisis del uso del último crédito aprobado por edad revela que la mayoría de los créditos fueron destinados a gastos del hogar, siendo esta la categoría con mayor frecuencia en todas las edades, alcanzando un pico de 18 personas a los 24 años. Esto indica que, en lugar de utilizar el crédito como una herramienta de inversión, muchas personas lo emplean para cubrir necesidades básicas.

El pago de matrículas y educación sugiere que algunos solicitantes recurren al crédito para financiar su formación. Además, se observa una presencia significativa de créditos destinados a otros gastos personales y al pago de otros préstamos o créditos, lo que podría ser una señal de sobreendeudamiento o de la necesidad de refinanciación de deudas previas.

Este panorama sugiere que los créditos están siendo utilizados principalmente para cubrir gastos inmediatos en lugar de impulsar proyectos de crecimiento financiero. Finalmente, el hecho de que un porcentaje de los créditos sea utilizado para pagar otras deudas refleja un posible riesgo de sobreendeudamiento, lo que hace necesario monitorear esta tendencia y ofrecer programas de consolidación de deudas con tasas más bajas.

GRAFICA 12: SATISFACCIÓN EN EL TIEMPO DE APROBACIÓN POR EDAD

datos %>% 
  filter(!is.na(`Satisfacción tiempo de aprobación`)) %>%  # Filtrar valores NA
  group_by(EDAD, satisfaccion_tiempo = `Satisfacción tiempo de aprobación`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = satisfaccion_tiempo)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Nivel de satisfacción en el tiempo de aprobación por edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

##INTERPRETACIÓN

El análisis del nivel de satisfacción en el tiempo de aprobación del crédito por edad muestra que la mayoría de las personas otorgaron una calificación de 6 , lo que indica un alto nivel de satisfacción con la rapidez del proceso. Este patrón es consistente en todos los grupos de edad, con picos de 15 personas a los 24 años, es decir la percepción sobre los tiempos de aprobación es positiva.

Sin embargo, también se observan algunos casos de menor satisfacción. Las calificaciones más bajas, como 1 y 2, aparecen en menor cantidad, pero reflejan que existen algunos usuarios que perciben el tiempo de aprobación como lento o ineficiente. Estos casos son más frecuentes en los rangos de 18 a 22 años.

Asimismo, se observa una presencia moderada de calificaciones intermedias, como 3 y 4, lo que indica que, aunque la mayoría está satisfecha, todavía hay margen de mejora en ciertos procesos.

GRAFICA 13: SATISFACCIÓN EN EL TIEMPO DE DESEMBOLSO POR EDAD

datos %>% 
  filter(!is.na(`Satisfacción tiempo de desembolso`)) %>%  # Filtrar valores NA
  group_by(EDAD, satisfaccion_desembolso = `Satisfacción tiempo de desembolso`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = satisfaccion_desembolso)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Nivel de satisfacción en el tiempo de desembolso por edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

El análisis del nivel de satisfacción en el tiempo de desembolso del crédito por edad muestra que la mayoría de las personas calificaron con 6. Este comportamiento es consistente en todas las edades, con picos en los 23 años (15 personas), 21 años (13 personas) y 25 años (12 personas).

Las calificaciones más bajas, como 1 y 2, aparecen en menor proporción, pero indican que algunas personas perciben el tiempo de desembolso como lento. Las calificaciones intermedias, como 3 y 4, aparecen con mayor frecuencia en los rangos de 18 a 22 años, lo que indica que una parte de los solicitantes jóvenes siente que el desembolso podría mejorar. Aunque la percepción general del tiempo de desembolso es positiva, existen áreas de oportunidad para mejorar la experiencia de ciertos usuarios, especialmente aquellos que otorgan calificaciones intermedias o bajas.

GRAFICA 14: SATISFACCIÓN FRENTE AL MONTO DESEMBOLSADO POR EDAD

datos %>% 
  filter(!is.na(`Satisfacción frente a monto desembolsado`)) %>%  # Filtrar valores NA
  group_by(EDAD, satisfaccion_monto = `Satisfacción frente a monto desembolsado`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = satisfaccion_monto)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Nivel de satisfacción en el monto desembolsado por edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

El análisis del nivel de satisfacción en el monto desembolsado por edad revela que la mayoría de los encuestados otorgaron una calificación de 6, lo que indica una alta satisfacción con la cantidad de dinero desembolsada. Este patrón es particularmente notable en las edades de 23 años (12 personas), 21 años (11 personas) y 24 años (9 personas)**, donde se observan los mayores niveles de satisfacción.

Sin embargo, también hay grupos de personas que expresaron satisfacción media o baja. Las calificaciones de 1 y 2, que reflejan insatisfacción con el monto recibido, están presentes en todos los rangos de edad, aunque en menor proporción. Esto sugiere que hay individuos que consideran insuficiente el monto desembolsado, aunque no representan la mayoría. Las calificaciones 3 y 4, que representan una satisfacción intermedia, son más comunes en los 18 a 22 años, con una presencia significativa también en los 24 años.

GRAFICA 15: SATISFACCIÓN FRENTE A LA TASA DE INTERÉS POR EDAD

datos %>% 
  filter(!is.na(`Satisfacción tasa de interés`)) %>%  # Filtrar valores NA
  group_by(EDAD, satisfaccion_tasa = `Satisfacción tasa de interés`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = satisfaccion_tasa)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Nivel de satisfacción en la tasa por edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

El análisis del nivel de satisfacción en la tasa por edad muestra una distribución más equilibrada en comparación con los gráficos anteriores de desembolso y monto. A diferencia de los otros indicadores, las opiniones están más divididas. Sin embargo, se observa una proporción notable de personas que dieron una calificación de 1 y 2, lo que sugiere cierto descontento con la tasa aplicada, especialmente en las edades de 21 y 24 años, donde hay más personas con calificaciones bajas.

En general, el nivel de satisfacción en la tasa muestra una percepción más dispersa, con opiniones variadas que indican que, si bien algunos grupos están satisfechos, otros expresan una fuerte insatisfacción.

GRAFICA 16: SATISFACCIÓN FRENTE A LA CUOTA POR EDAD

datos %>% 
  filter(!is.na(`Satisfacción frente a la cuota`)) %>%  # Filtrar valores NA
  group_by(EDAD, satisfaccion_cuota = `Satisfacción frente a la cuota`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = satisfaccion_cuota)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Nivel de satisfacción en la cuota por edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

## INTERPRETACIÓN

El análisis del nivel de satisfacción en la cuota por edad refleja una distribución diversa de opiniones. Se observa que la calificación 4  es una de las más frecuentes, especialmente en las edades de 22 a 25 años, lo que indica una percepción moderada sobre la cuota. Sin embargo, También hay personas que están satisfechas.

Tienen una presencia más dispersa, lo que indica que el nivel de insatisfacción no es tan concentrado en grupos específicos. En general, la percepción de la cuota parece ser más equilibrada que la de la tasa o el monto desembolsado, pero aún existen grupos de edad donde las opiniones son más críticas.

GRAFICA 17: FRECUENCIA DE PAGO DEL ULTIMO CREDITO APROBADO POR EDAD

datos %>% 
  filter(!is.na(`¿Cuál es la frecuencia de pagos de su último crédito/préstamo aprobado?`)) %>%  # Filtrar valores NA
  group_by(EDAD, frecuencia = `¿Cuál es la frecuencia de pagos de su último crédito/préstamo aprobado?`) %>% 
  summarise(Conteo = n()) %>% 
  ggplot(aes(x = factor(EDAD), y = Conteo, fill = frecuencia)) +
  geom_bar(stat = "identity", position = "dodge") +
  geom_text(aes(label = Conteo), position = position_dodge(width = 0.9), vjust = -0.5) + 
  labs(title = "Frecuencia de pagos por edad", x = "Edad", y = "Número de Personas") +
  theme_minimal()
## `summarise()` has grouped output by 'EDAD'. You can override using the
## `.groups` argument.

INTERPRETACIÓN

Se demuestra una clara preferencia por los pagos mensuales en todos los grupos de edad. Esta modalidad es la más común y aumenta conforme avanza la edad, alcanzando su punto más alto en los 24 años con 23 personas que optan por esta opción.

Otras modalidades de pago, como la opción flexible y la semanal, tienen una presencia menor y están distribuidas de manera dispersa. Además, hay algunas personas que no saben o no responden (celeste), lo que indica cierto nivel de desconocimiento o falta de interés en el tema.

En general, este patrón sugiere que la mayoría de las personas prefiere la estabilidad y previsibilidad de los pagos mensuales, lo que podría indicar que es el modelo más adecuado para la mayoría.

datos$`Satisfacción tiempo de aprobación` <- ifelse(
  datos$`Satisfacción tiempo de aprobación` == "NS/NR (E: No leer)", 
  NA, 
  datos$`Satisfacción tiempo de aprobación`
)
datos$`Satisfacción tiempo de desembolso` <- ifelse(
  datos$`Satisfacción tiempo de desembolso` == "NS/NR (E: No leer)", 
  NA, 
  datos$`Satisfacción tiempo de desembolso`
)
datos$`Satisfacción frente a monto desembolsado` <- ifelse(
  datos$`Satisfacción frente a monto desembolsado` == "NS/NR (E: No leer)", 
  NA, 
  datos$`Satisfacción frente a monto desembolsado`
)
datos$`Satisfacción tasa de interés` <- ifelse(
  datos$`Satisfacción tasa de interés` == "NS/NR (E: No leer)", 
  NA, 
  datos$`Satisfacción tasa de interés`
)
datos$`Satisfacción frente a la cuota` <- ifelse(
  datos$`Satisfacción frente a la cuota` == "NS/NR (E: No leer)", 
  NA, 
  datos$`Satisfacción frente a la cuota`
)
unique(datos$`Satisfacción tiempo de aprobación`)
## [1] NA  "6" "3" "5" "2" "1" "4"
satisfaccion_cols <- c("Satisfacción tiempo de aprobación", "Satisfacción tiempo de desembolso", 
                        "Satisfacción frente a monto desembolsado", "Satisfacción tasa de interés", 
                        "Satisfacción frente a la cuota")

# Convierte las columnas a numéricas
datos[satisfaccion_cols] <- lapply(datos[satisfaccion_cols], function(x) as.numeric(as.character(x)))

GRAFICA 18: DIAGRAMA DE CORRELACIÓN DE EDAD Y SATISFACCIÓN

datos$Satisfaccion_Promedio <- rowMeans(datos[, c("Satisfacción tiempo de aprobación", "Satisfacción tiempo de desembolso", "Satisfacción frente a monto desembolsado", "Satisfacción tasa de interés", "Satisfacción frente a la cuota")], na.rm = TRUE)

ggplot(datos, aes(x = EDAD, y = Satisfaccion_Promedio)) +
  geom_point(color = "blue", alpha = 0.6) +
  geom_smooth(method = "lm", color = "red", se = FALSE) +
  labs(title = "Edad vs Satisfacción Promedio", x = "Edad", y = "Satisfacción Promedio") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
## Warning: Removed 890 rows containing non-finite outside the scale range
## (`stat_smooth()`).
## Warning: Removed 890 rows containing missing values or values outside the scale range
## (`geom_point()`).

## INTERPRETACIÓN

El gráfico de dispersión muestra la relación entre la edad y la satisfacción promedio. Cada punto azul representa la satisfacción de una persona en una determinada edad.

En general, la línea de tendencia es prácticamente horizontal, lo que indica que no hay una variación significativa en la satisfacción promedio conforme aumenta la edad. La satisfacción parece oscilar alrededor de un valor medio cercano a 4, sin una tendencia clara de aumento o disminución.

Esto sugiere que la percepción de satisfacción con la cuota se mantiene relativamente estable en los distintos grupos de edad, sin evidencias de que los más jóvenes o los mayores tengan una opinión marcadamente diferente.

GRAFICA 19: DIAGRAMA DE CORRELACIÓN DE SATISFACCIÓN ENTRE CUOTA Y TASA

ggplot(datos, aes(x = `Satisfacción tasa de interés`, y = `Satisfacción frente a la cuota`)) +
  geom_point(color = "blue", alpha = 0.6) +  # Puntos en color azul con transparencia
  geom_smooth(method = "lm", color = "red", se = TRUE) +  # Línea de regresión lineal con intervalo de confianza
  labs(title = "Relación entre Satisfacción con la Tasa de Interés y la Cuota",
       x = "Satisfacción con la Tasa de Interés",
       y = "Satisfacción con la Cuota") +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
## Warning: Removed 891 rows containing non-finite outside the scale range
## (`stat_smooth()`).
## Warning: Removed 891 rows containing missing values or values outside the scale range
## (`geom_point()`).

## INTERPRETACION

El gráfico de dispersión muestra la relación entre la satisfacción con la tasa de interés y la satisfacción con la cuota. Se observa la relación positiva, donde la línea de tendencia roja indica que a medida que aumenta la satisfacción con la tasa de interés, también aumenta la satisfacción con la cuota. La zona de confianza representa el intervalo de confianza, lo que sugiere que la relación es consistente y no una coincidencia

Los datos sugieren que los usuarios que están más satisfechos con la tasa de interés también tienden a estar más satisfechos con la cuota. Esto podría indicar que una percepción favorable de los costos financieros influye directamente en la satisfacción general con los pagos.

GRAFICA 20: SATISFACCIÓN PROMEDIO POR EDAD

satisfaccion_por_edad <- datos %>%
  group_by(EDAD) %>%
  summarise(Satisfaccion_Promedio = mean(Satisfaccion_Promedio, na.rm = TRUE))

print(satisfaccion_por_edad)
## # A tibble: 8 × 2
##    EDAD Satisfaccion_Promedio
##   <dbl>                 <dbl>
## 1    18                  4.28
## 2    19                  4.22
## 3    20                  4.7 
## 4    21                  4.35
## 5    22                  4.07
## 6    23                  4.84
## 7    24                  4.11
## 8    25                  4.32

GRAFICA 21: SATISFACCIÓN PROMEDIO POR EDAD

ggplot(satisfaccion_por_edad, aes(x = EDAD, y = Satisfaccion_Promedio)) +
  geom_line(color = "blue", size = 1) +  
  geom_point(color = "red", size = 2) +
  labs(title = "Satisfacción Promedio por Edad", x = "Edad", y = "Satisfacción Promedio") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

INTERPRETACIÓN

Este gráfico de líneas muestra la satisfacción promedio por edad. La satisfacción promedio no tiene una tendencia clara, sino que tiene una variación muy grade con picos y caídas a lo largo de las edades. Los picos de satisfacción alrededor de los 20 y 23 años, mientras que las caídas son de los 22 y 24 años. Es posible que la variabilidad esté influenciada por factores externos como experiencias personales, cambios en la vida académica o laboral, o condiciones económicas.

GRAFICA 22: DIAGRAMA DE CAJAS DE SATISFACCIÓN CON LA TASA DE INTERES Y EDAD

ggplot(datos, aes(x = factor(EDAD), y = `Satisfacción tasa de interés`)) +
  geom_boxplot(fill = "lightgreen") +
  labs(title = "Satisfacción con la tasa de interés por edad", x = "Edad", y = "Nivel de Satisfacción") +
  theme_minimal()
## Warning: Removed 891 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

## INTERPRETACIÓN

Se puede observar que para la edad de 19 y 21 años, hay una alta dispersión, lo que indica que los niveles de satisfacción frente a la tasa de interés varían mucho entre los individuos de dicha edad.Por otro lado, para las edades de 18 y 22 años, la dispersión es baja, manifestando que hay una menor variabilidad en la satisfacción con la tasa de interés.

En la edad de 18 años se puede apreciar que hay 2 valores atípicos, en este caso, una satisfacción de 1 (nada satisfecho) y 6 (totalmente satisfecho), además que el 50% de los encuestados presentan una satisfacción entre 3 y 4.

En el caso de la edad de 23 años, el 50% de la población tiene una satisfacción entre 3 y 6.

GRAFICA 23: DIAGRAMA DE CAJAS DE SATISFACCIÓN CON LA CUOTA Y EDAD

ggplot(datos, aes(x = factor(EDAD), y = `Satisfacción frente a la cuota`)) +
  geom_boxplot(fill = "purple") +
  labs(title = "Satisfacción con la cuota por edad", x = "Edad", y = "Nivel de Satisfacción") +
  theme_minimal()
## Warning: Removed 890 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

## INTERPRETACIÓN

Se puede observar que las edades que presentan mayor dispersión son 19 y 21 años,lo que indica que los niveles de satisfacción frente a la cuota varían mucho entre dichos individuos.

Para la edad de 25 años, el 50% de los individuos presenta una satisfacción bastante alta, entre 4 y 5. Sin embargo, hay dos datos atípicos, en los que algunos individuos presentan una satisfacción frente a la cuota de 1 y 2, bastante baja.

Las edades de 18, 19 y 21 años presentan altas satisfacciones, que llegan a 6.