Introducción:

Este análisis evalúa la presencia de limitación espacial en la cartera de crédito de la fintech en función del incumplimiento, definida como la tasa de cartera con más de 60 días de mora. El estudio se realiza a nivel municipal en todas las regiones donde opera la entidad, examinando la distribución del incumplimiento y su posible agrupación geográfica. Posteriormente, se aplicará un modelo espacial para ajustar y explicar de manera más precisa el comportamiento de la tasa de malos (BR).

Origen base de datos:

La base de datos utilizada proviene de la fintech e incluye información a nivel municipal y departamental sobre la tasa de malos (BR). Para su georreferenciación, se asignan las coordenadas de latitud y longitud de cada municipio con base en los datos del DANE. Esto permite convertir la información en un objeto espacial, facilitando el análisis de patrones geográficos.

Descriptiva inicial:

El mapa muestra la distribución de la tasa de malos (BR) por municipio en Colombia. Se observa una mayor concentración de incumplimiento en las regiones del centro y norte del país, mientras que en el oriente y sur hay menor presencia de datos y, posiblemente, menor actividad crediticia. La intensidad del color azul indica municipios con una tasa de BR más alta, sugiriendo posibles patrones de agrupación geográfica del incumplimiento. Este comportamiento sugiere la necesidad de aplicar técnicas de análisis espacial para evaluar la existencia de clasificación geográfica en el riesgo crediticio.

<

El mapa muestra la distribución de la tasa de malos (BR) por municipio en Colombia, destacando en rojo y amarillo los municipios con tasas superiores a la media. Se observa que los mayores niveles de incumplimiento se concentran en el norte y el occidente del país, especialmente en regiones de la costa Caribe y el eje cafetero. También hay focos dispersos de alto incumplimiento en algunas zonas del sur. Estos patrones sugieren posibles factores regionales que influyen en la mora, como condiciones económicas, acceso a crédito o dinámicas locales del mercado financiero.

Prueba de Moran I bajo aleatorización:
## 
##  Moran I test under randomisation
## 
## data:  TASA_MALOS_MUNICIPIO_sf$BR  
## weights: knn_5_listw    
## 
## Moran I statistic standard deviate = 5.7973, p-value = 3.369e-09
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##      0.1061305366     -0.0010030090      0.0003415055
## 
##  Moran I test under randomisation
## 
## data:  TASA_MALOS_MUNICIPIO_sf$BR  
## weights: nb_100km_listw  
## n reduced by no-neighbour observations  
## 
## Moran I statistic standard deviate = 14.274, p-value < 2.2e-16
## alternative hypothesis: greater
## sample estimates:
## Moran I statistic       Expectation          Variance 
##      1.061274e-01     -1.010101e-03      5.633656e-05

Los resultados del test de Moran indican significativamente una autocorrelación espacial positiva en la tasa de malos (BR) a nivel municipal.

Vecindario basado en k vecinos más cercanos (k=5) Moran I = 0.1061 , valor p 3.37e-09 → evidencia de agrupación espacial. Vecindario basado en distancia (100 km) Moran I = 0.1061 , valor p < 2.2e-16 → aún mayor significancia en la compensación espacial. En ambos casos, el p-valor extremadamente bajo confirma que los municipios con alta tasa de incumplimiento tienden a estar geográficamente cerca de unos de otros, lo que sugiere la existencia de factores espaciales que influyen en el riesgo crediticio. Esto justifica la necesidad de modelar la mora considerando efectos espaciales.

Clústeres LISA en Tasa de Malos (BR):

El análisis de clusters LISA (Indicadores Locales de Asociación Espacial) revela patrones espaciales significativos en la tasa de incumplimiento:

Clusters High-High (rojo): Se concentran principalmente en el norte del país, indicando municipios con alta morosidad rodeados de municipios con comportamiento similar.

Clusters Low-Low (azul): Ubicados en el centro y suroccidente, sugieren regiones con baja morosidad agrupadas geográficamente.

Clusters High-Low (verde) y Low-High (amarillo): Representan municipios con valores atípicos espaciales, donde un municipio con alta morosidad está rodeado de municipios con baja morosidad y viceversa.

La presencia de clusters significativos refuerza la hipótesis de que el incumplimiento no es aleatorio, sino que sigue patrones espaciales definidos. Esto sugiere la necesidad de incorporar efectos espaciales en la modelización del riesgo crediticio.

Mapa de Getis-Ord Gi (Z-scores) en Tasa de Malos (BR):
## [[1]]
## mapping: colour = ~Gi_star 
## geom_sf: na.rm = FALSE
## stat_sf: na.rm = FALSE
## position_identity 
## 
## [[2]]
## <ggproto object: Class CoordSf, CoordCartesian, Coord, gg>
##     aspect: function
##     backtransform_range: function
##     clip: on
##     crs: NULL
##     datum: crs
##     default: TRUE
##     default_crs: NULL
##     determine_crs: function
##     distance: function
##     expand: TRUE
##     fixup_graticule_labels: function
##     get_default_crs: function
##     is_free: function
##     is_linear: function
##     label_axes: list
##     label_graticule: 
##     labels: function
##     limits: list
##     lims_method: cross
##     modify_scales: function
##     ndiscr: 100
##     params: list
##     range: function
##     record_bbox: function
##     render_axis_h: function
##     render_axis_v: function
##     render_bg: function
##     render_fg: function
##     setup_data: function
##     setup_layout: function
##     setup_panel_guides: function
##     setup_panel_params: function
##     setup_params: function
##     train_panel_guides: function
##     transform: function
##     super:  <ggproto object: Class CoordSf, CoordCartesian, Coord, gg>
## [[1]]
## mapping: colour = ~as.numeric(Gi_star) 
## geom_sf: na.rm = FALSE
## stat_sf: na.rm = FALSE
## position_identity 
## 
## [[2]]
## <ggproto object: Class CoordSf, CoordCartesian, Coord, gg>
##     aspect: function
##     backtransform_range: function
##     clip: on
##     crs: NULL
##     datum: crs
##     default: TRUE
##     default_crs: NULL
##     determine_crs: function
##     distance: function
##     expand: TRUE
##     fixup_graticule_labels: function
##     get_default_crs: function
##     is_free: function
##     is_linear: function
##     label_axes: list
##     label_graticule: 
##     labels: function
##     limits: list
##     lims_method: cross
##     modify_scales: function
##     ndiscr: 100
##     params: list
##     range: function
##     record_bbox: function
##     render_axis_h: function
##     render_axis_v: function
##     render_bg: function
##     render_fg: function
##     setup_data: function
##     setup_layout: function
##     setup_panel_guides: function
##     setup_panel_params: function
##     setup_params: function
##     train_panel_guides: function
##     transform: function
##     super:  <ggproto object: Class CoordSf, CoordCartesian, Coord, gg>

El análisis del estadístico Getis-Ord Gi * identifica zonas de alta y baja concentración de morosidad en Colombia:

Hotspots (Rojo): Municipios con altos niveles de morosidad (BR) rodeados por municipios con comportamiento similar . Se observan principalmente en el norte del país , lo que sugiere factores regionales que aumentan el riesgo crediticio, como condiciones económicas adversas o menor capacidad de pago.

Coldspots (Azul): Municipios con baja morosidad (BR) rodeados de municipios con baja morosidad . Se concentran en la zona centro-occidental del país , lo que puede reflejar regiones con mayor estabilidad financiera y menor riesgo de incumplimiento.

Zonas sin agrupación significativa: Municipios donde el incumplimiento no sigue un patrón espacial claro, representado en colores neutros.

Modelo SAR (Espacial Autoregresivo) para Tasa de Malos (BR) :
## 
## Call:
## lagsarlm(formula = BR ~ 1, data = TASA_MALOS_MUNICIPIO_sf, listw = knn_5_listw, 
##     method = "eigen")
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -0.1452570 -0.0544362 -0.0459552  0.0090331  0.9489112 
## 
## Type: lag 
## Coefficients: (asymptotic standard errors) 
##              Estimate Std. Error z value  Pr(>|z|)
## (Intercept) 0.0459552  0.0048404  9.4941 < 2.2e-16
## 
## Rho: 0.23101, LR test value: 25.178, p-value: 5.2274e-07
## Asymptotic standard error: 0.046735
##     z-value: 4.9431, p-value: 7.6886e-07
## Wald statistic: 24.434, p-value: 7.6886e-07
## 
## Log likelihood: 655.6714 for lag model
## ML residual variance (sigma squared): 0.015598, (sigma: 0.12489)
## Number of observations: 998 
## Number of parameters estimated: 3 
## AIC: -1305.3, (AIC for lm: -1282.2)
## LM test for residual autocorrelation
## test value: 15.507, p-value: 8.2217e-05

El modelo SAR estima la dependencia espacial en la tasa de malos (BR) a nivel municipal, considerando la influencia de los municipios vecinos cercanos.

Principales resultados: Rho (ρ) = 0.231: Indica una autocorrelación espacial positiva significativa , es decir, los municipios con alta morosidad tienden a estar rodeados de municipios con alta morosidad y viceversa.

Significación estadística: El p-valor del test de razón de verosimilitud (LR test) es 5.2e-07 , confirmando que el modelo SAR mejora la explicación del BR en comparación con un modelo sin estructura espacial.

El test de Wald y el valor z de ρ también son altamente significativos ( p < 0.001 ), reforzando la importancia del efecto espacial. Ajuste del modelo:

Log-likelihood = 655.67 y AIC = -1305.3 muestran un mejor ajuste en comparación con un modelo sin efectos espaciales ( AIC = -1282.2 ). Prueba LM para autocorrelación residual: Test estadístico = 15.507 , p-value 8.22e-05 , lo que indica que aún hay cierta autocorrelación espacial en los residuos, sugiriendo que podrían explorarse modelos más avanzados.

Conclusión: El modelo confirma la presencia de efectos espaciales significativos en la tasa de malos (BR), lo que valida la necesidad de incluir dependencia espacial en la modelización del riesgo crediticio. Municipios con alta morosidad no están aislados, sino que siguen patrones geográficos definidos, lo que sugiere que factores regionales influyen en la probabilidad de incumplimiento.

Modelo SEM (Modelo de Error Espacial) para Tasa de Malos (BR) :
## 
## Call:errorsarlm(formula = BR ~ 1, data = TASA_MALOS_MUNICIPIO_sf, 
##     listw = knn_5_listw, method = "eigen")
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -0.1452570 -0.0544362 -0.0459552  0.0090331  0.9489112 
## 
## Type: error 
## Coefficients: (asymptotic standard errors) 
##             Estimate Std. Error z value  Pr(>|z|)
## (Intercept) 0.059761   0.005141  11.624 < 2.2e-16
## 
## Lambda: 0.23101, LR test value: 25.178, p-value: 5.2274e-07
## Asymptotic standard error: 0.046735
##     z-value: 4.9431, p-value: 7.6886e-07
## Wald statistic: 24.434, p-value: 7.6886e-07
## 
## Log likelihood: 655.6714 for error model
## ML residual variance (sigma squared): 0.015598, (sigma: 0.12489)
## Number of observations: 998 
## Number of parameters estimated: 3 
## AIC: -1305.3, (AIC for lm: -1282.2)

El modelo SEM (Spatial Error Model) captura la dependencia espacial en los errores, considerando que factores no observados pueden influir en la morosidad de los municipios vecinos.

Principales resultados: Lambda (λ) = 0.231: Indica que existen efectos espaciales significativos en los errores , es decir, factores no medidos que influyen en la morosidad están correlacionados entre municipios cercanos.

Significación estadística: El p-valor del LR test (5.22e-07) confirma que el modelo SEM mejora la explicación de la tasa de malos en comparación con un modelo sin estructura espacial. El test de Wald y el valor z de λ también son altamente significativos ( p < 0.001 ), reforzando la importancia de los efectos espaciales en los errores.

Ajuste del modelo: Log-verosimilitud = 655.67 y AIC = -1305.3 , lo que indica un mejor ajuste que un modelo sin efectos espaciales ( AIC = -1282.2 ).

Comparación con el modelo SAR: SAR (modelo anterior) captura la autocorrelación espacial en la variable dependiente ( tasa de malos ). SEM (este modelo) asume que la autocorrelación espacial está en los errores, es decir, hay factores no medidos que explican el patrón de morosidad en los municipios.

Ambos modelos presentan el mismo ajuste estadístico, por lo que la elección dependerá del contexto:

Si la morosidad de un municipio depende directamente de la morosidad de sus vecinos → SAR.

Si la morosidad es influenciada por factores espaciales no observados → SEM.

Conclusión: El modelo SEM confirma que existen factores espaciales no observados que afectan el comportamiento de la tasa de malos en municipios cercanos. Esto sugiere que no solo el comportamiento de los vecinos es importante, sino también variables regionales estructurales que pueden estar influyendo en el riesgo de incumplimiento.

Mapa de la Tasa de Malos (BR) estimada bajo el modelo SAR-Error :

``

El mapa muestra la estimación de la tasa de malos (BR) ajustada por el modelo SAR-Error , incorporando efectos espaciales en la estructura del error.

Principales hallazgos:

Distribución espacial de la tasa de malos estimados: Las zonas en rojo y naranja representan municipios con una alta tasa de morosidad estimada . Se concentran principalmente en el norte y algunas áreas dispersas en el sur del país . Los tonos verdes y azules indican municipios con baja tasa de incumplimiento estimada , predominando en el centro y suroccidente del país .

Comparación con los datos originales: El modelo SAR-Error ajusta la tasa de malos considerando factores espaciales no observados que afectan a los municipios vecinos, reduciendo posibles sesgos en la estimación.

Se mantiene la tendencia de agrupación geográfica de la morosidad, validando la presencia de patrones espaciales significativos .

Conclusiones del análisis:

Distribución Geográfica de la Morosidad

Los resultados de Moran’s I (global) y LISA (local) confirman que la tasa de malos (BR) no está distribuida al azar, sino que exhibe una autocorrelación espacial positiva . Municipios con alta morosidad tienden a rodearse de municipios con alta morosidad, y viceversa. Clústeres de Alto y Bajo Incumplimiento

El análisis LISA identifica clusters Alto-Alto (rojo) en regiones del norte del país, mientras que los Bajo-Bajo (azul) se ubican principalmente en el centro-occidente. Esto sugiere la existencia de factores regionales comunes (económicos, sociales o de infraestructura) que influyen en la tasa de malos. Zonas Críticas y Estables (Getis–Ord Gi*)

El estadístico Gi* refuerza la presencia de hotspots (concentraciones altas de incumplimiento) y coldspots (baja morosidad) de forma significativa. Los “hotspots” se encuentran sobre todo en el norte, mientras que los “coldspots” se localizan en áreas más centrales. Modelos espaciales: SAR y SEM

Tanto el modelo SAR (lag) como el modelo SAR-Error (SEM) mejoran el ajuste respecto a un modelo sin efectos espaciales (AIC más bajo). El coeficiente espacial ( 𝜌 ρen SAR o la laen SEM) resulta significativo, confirmando que hay una dependencia espacial real: los valores de BR en un municipio no pueden explicarse de forma independiente de sus vecinos. Implicaciones Prácticas

Al detectar agrupamientos de alta morosidad, la fintech podría focalizar estrategias preventivas o de cobranza en regiones identificadas como “hotspots”. La presencia de efectos espaciales indica la necesidad de contemplar factores territoriales (nivel de ingresos, educación financiera, acceso bancario) en la gestión de riesgo y en la toma de decisiones de colocación de crédito. Futuros Pasos

Incluir variables socioeconómicas y demográficas para profundizar en las causas de la autocorrelación espacial. Evaluar otros modelos espaciales (SAC, GWR, etc.) para captar mejor la heterogeneidad geográfica. Desarrollar planos de acción diferenciados según zonas críticas (hotspots) y zonas estables (coldspots). En resumen, el análisis confirma el patrón espacial de la morosidad y ratifica la importancia de incorporar la dimensión geográfica en la evaluación y gestión del riesgo crediticio.