INTRODUCCION

En este informe realizaremos un analisis de las siguientes variables del sector financiero y al final solo escogeremos una de ellas para realizar el pronostico del periodo oct-dic 2024 y Ene 2025. La variables son:

1.CART(Cartera del sector bancario) 2.DAH (Depósitos de ahorros) 3.CART_V (Cartera del sector bancario Valle)

Para comprender un poco la evolución del sector financiero en Colombia entre 2012 y 2024, en lo que respecta a la cartera de crédito,podemos decir que ha estado marcada por varios factores económicos, regulatorios y tecnológicos. A continuación mostraremos el comportamiento de cada variable a lo largo de este periodo y presentando un resumen de los principales aspectos que han influido.

#Cargar librerías necesarias
library(readxl)  # Para leer archivos Excel
library(tseries)  # Para pruebas de estacionariedad
library(forecast)  # Para modelado ARIMA y pronósticos
library(ggplot2)  # Para visualización de datos
library(plotly)  # Para gráficos interactivos
library(timetk)

library(readxl)
Base_fn <- read_excel("Base fn.xlsx", col_types = c("date", 
    "numeric", "numeric", "numeric"))
View(Base_fn)

1. DETERMINACIÓN DE LAS VARIABLES COMO SERIES TEMPORALES:

Variabale CART (Cartera del sector bancario)

# Seleccionar la variable CART cartera del sector bancario
cart_ts <- ts(Base_fn$CART, start = c(2012, 1), frequency = 12)

Variable DAH (Depósitos de ahorros)

# Seleccionar la variable DAH cartera del sector bancario
dah_ts <- ts(Base_fn$DAH, start = c(2012, 1), frequency = 12)

Variable CART_V (Cartera del sector bancario Valle)

# Seleccionar la variable CART_V cartera del sector bancario
cart_v_ts <- ts(Base_fn$CART_V, start = c(2012, 1), frequency = 12)

INTERACCION ENTRE LAS VARIABLES (CART, DAH,CART_V)

library(ggplot2)
library(plotly)

# Convertir la serie temporal a un vector numérico para lograr graficar con ggplot2
Base_fn$CART <- as.numeric(cart_ts)

# Crear el gráfico
grafico_serie <- ggplot(Base_fn, aes(x = seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = nrow(Base_fn)), 
                                      y = CART)) +
  geom_line(color = "grey", linewidth = 0.4) +  # Cambiado 'size' por 'linewidth'
  geom_point(color = "black", size = 0.1) +
  ggtitle("Grafico 1.1 EVOLUCION VARIABLE CART: SERIE ORIGINAL") +
  xlab("TIEMPO") +
  ylab("MILLONES") +
  theme_minimal()

ggplotly(grafico_serie)

library(ggplot2)
library(plotly)

# Convertir la serie temporal a un vector numérico para lograr graficar con ggplot2
Base_fn$DAH<- as.numeric(dah_ts)

# Crear el gráfico
grafico_serie <- ggplot(Base_fn, aes(x = seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = nrow(Base_fn)), 
                                      y = dah_ts)) +
  geom_line(color = "grey", linewidth = 0.4) +  # Cambiado 'size' por 'linewidth'
  geom_point(color = "black", size = 0.1) +
  ggtitle("Grafico 1.2 EVOLUCION VARIABLE DAH: SERIE ORIGINAL") +
  xlab("TIEMPO") +
  ylab("MILLONES") +
  theme_minimal()

ggplotly(grafico_serie)

library(ggplot2)
library(plotly)

# Convertir la serie temporal a un vector numérico para lograr graficar con ggplot2
Base_fn$CART_V<- as.numeric(cart_v_ts)

# Crear el gráfico
grafico_serie <- ggplot(Base_fn, aes(x = seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = nrow(Base_fn)), 
                                      y = cart_v_ts)) +
  geom_line(color = "grey", linewidth = 0.4) +  # Cambiado 'size' por 'linewidth'
  geom_point(color = "black", size = 0.1) +
  ggtitle("Grafico 1.3 EVOLUCION VARIABLE CART_V : SERIE ORIGINAL") +
  xlab("TIEMPO") +
  ylab("MILLONES") +
  theme_minimal()

ggplotly(grafico_serie)

ANALISIS DE LAS 3 VARIABLES

Las tres variables relacionadas con el sector bancario muestran tendencias similares, lo que sugiere que están influenciadas por factores macroeconómicos comunes, como el crecimiento económico, las tasas de interés y la demanda de crédito. La interacción entre estas variables podría ser clave para entender el comportamiento del sector bancario en su conjunto. Por ejemplo, un aumento en la demanda de crédito (CART) podría estar relacionado con un aumento en la cartera de depositos de ahorro (DAH) y viceversa.

2012-2015: Crecimiento y estabilidad

Colombia experimentó un crecimiento económico moderado, lo que se tradujo en un aumento en la demanda de crédito por parte de hogares y empresas. La cartera de crédito creció de manera significativa, impulsada por el crédito de consumo, vivienda y comercio. Finalmente las tasas de interés se mantuvieron relativamente estables, lo que facilitó el acceso al crédito.

Fuentes:

Banco de la República de Colombia. (2015). Informe de Estabilidad Financiera.
Federación Nacional de Comerciantes (Fenalco). (2014). Informe sobre crédito al consumo.
Superintendencia Financiera de Colombia. (2015). Reporte de inclusión financiera.

2016-2019: Desaceleración y ajustes regulatorios

El crecimiento económico comenzó a desacelerarse, lo que impactó negativamente en la demanda de crédito. Lo que ocasiono que el gobierno y la Superintendencia Financiera de Colombia implementara medidas para fortalecer la solvencia y liquidez de las entidades financieras.

Esta desaceleracion genero un deterioro en la calidad de la cartera, con un aumento en los índices de morosidad, especialmente en el segmento de consumo.

Fuentes:

Departamento Administrativo Nacional de Estadística (DANE). (2019). Crecimiento del PIB.
Superintendencia Financiera de Colombia. (2018). Circular Externa 052: Medidas de solvencia y liquidez.

2020-2021: Impacto de la pandemia de COVID-19

La pandemia provocó una contracción económica severa, lo que llevó a una disminución en la demanda de crédito y un aumento en la morosidad. El gobierno y las entidades financieras implementaron medidas de alivio financiero, como períodos de gracia y reestructuraciones de deuda, para apoyar a los deudores afectados. La pandemia aceleró la digitalización de los servicios financieros, con un aumento en el uso de canales digitales para la solicitud y gestión de créditos.

La variable que tuvo mayor afectación por la pandemia fue DAH (Depositos de ahorro) debido a que en este periodo se generó una gran incertidumbre y las personas empezaron a retirar sus ahorros de las entidades bancarias.

Fuentes:

Banco de la República. (2021). Informe de política monetaria.
Gobierno de Colombia. (2020). Decretos de alivio financiero (Ej: Decreto 560 de 2020).

2022-2024: Recuperación y transformación digital

Durante este periodo la economía colombiana comenzó a recuperarse, lo que se reflejó en un aumento en la demanda de crédito, especialmente en los sectores de vivienda y comercio. Las entidades financieras continuaron invirtiendo en tecnología para mejorar la eficiencia y la experiencia del cliente, lo que incluyó la adopción de inteligencia artificial y análisis de datos para la evaluación de riesgos. Finalmente se mantuvo un enfoque en la regulación y supervisión para garantizar la estabilidad del sistema financiero, con especial atención a la gestión de riesgos y la protección al consumidor.

Aunque en el año 2023 se presenta una desaceleración en las tres variables, no cayeron a niveles bajos de contracción y para el 2024 comenzó una recuperación lenta del sector.

Fuentes:

Fondo Monetario Internacional (FMI). (2023). Perspectivas económicas para Colombia.
Ministerio de Hacienda. (2023). Informe de proyecciones fiscales.

2.EXTRACCIÓN DE SEÑALES

2.1 Descomposición de la variable CART

# Cargar librerías necesarias
library(ggplot2)
library(plotly)

# Descomposición de la serie temporal
stl_decomp_cart <- stl(cart_ts, s.window = "periodic")

# Convertir la descomposición a un data frame para graficar con ggplot2
stl_df_cart <- data.frame(
  Time = rep(time(cart_ts), 4),  # Tiempo repetido para cada componente
  Value = c(stl_decomp_cart$time.series[, "seasonal"], 
            stl_decomp_cart$time.series[, "trend"], 
            stl_decomp_cart$time.series[, "remainder"], 
            cart_ts),
  Component = rep(c("Estacional", "Tendencia", "Residuo", "Serie Original"), each = length(cart_ts))
)

# Crear gráfico con ggplot2
p_cart <- ggplot(stl_df_cart, aes(x = Time, y = Value, color = Component)) +
  geom_line() +
  facet_wrap(~Component, scales = "free_y", ncol = 1) + 
  theme_minimal() +
  labs(title = "Grafico 2.1 DESCOMPOSICIÓN DE LA VARIABLE CART",
       x = "Tiempo",
       y = "Millones")

# Convertir a gráfico interactivo con plotly
ggplotly(p_cart)

2.2 Descomposición de la variable DAH

# Descomposición de la serie temporal
stl_decomp_dah <- stl(dah_ts, s.window = "periodic")

# Convertir la descomposición a un data frame para graficar con ggplot2
stl_df_dah <- data.frame(
  Time = rep(time(dah_ts), 4),  # Tiempo repetido para cada componente
  Value = c(stl_decomp_dah$time.series[, "seasonal"], 
            stl_decomp_dah$time.series[, "trend"], 
            stl_decomp_dah$time.series[, "remainder"], 
            dah_ts),
  Component = rep(c("Estacional", "Tendencia", "Residuo", "Serie Original"), each = length(dah_ts))
)

# Crear gráfico con ggplot2
p_dah <- ggplot(stl_df_dah, aes(x = Time, y = Value, color = Component)) +
  geom_line() +
  facet_wrap(~Component, scales = "free_y", ncol = 1) + 
  theme_minimal() +
  labs(title = "Grafico 2.2 DESCOMPOSICIÓN DE LA VARIABLE DAH",
       x = "Tiempo",
       y = "Millones")

# Convertir a gráfico interactivo con plotly
ggplotly(p_dah)

2.3 Descomposición de la variable CART_V

# Descomposición de la serie temporal
stl_decomp_cart_v <- stl(cart_v_ts, s.window = "periodic")

# Convertir la descomposición a un data frame para graficar con ggplot2
stl_df_cart_v <- data.frame(
  Time = rep(time(cart_v_ts), 4),  # Tiempo repetido para cada componente
  Value = c(stl_decomp_cart_v$time.series[, "seasonal"], 
            stl_decomp_cart_v$time.series[, "trend"], 
            stl_decomp_cart_v$time.series[, "remainder"], 
            cart_v_ts),
  Component = rep(c("Estacional", "Tendencia", "Residuo", "Serie Original"), each = length(cart_v_ts))
)

# Crear gráfico con ggplot2
p_cart_v <- ggplot(stl_df_cart_v, aes(x = Time, y = Value, color = Component)) +
  geom_line() +
  facet_wrap(~Component, scales = "free_y", ncol = 1) + 
  theme_minimal() +
  labs(title = "Grafico 2.3 DESCOMPOSICIÓN DE LA VARIABLE CART_V",
       x = "Tiempo",
       y = "Millones")

# Convertir a gráfico interactivo con plotly
ggplotly(p_cart_v)

2.4. Analisis de Tendencias, Estacionalidades y Cambios Estructurales

Tendencias: Las tres variables muestran una tendencia creciente, lo que indica un crecimiento sostenido en el sector bancario. Esto podría estar relacionado con el crecimiento económico general y el aumento de la demanda de servicios financieros. A pesar del periodo de pandemia, ésta no afectó signiticativamente la tendencia positiva, pero si se evidencia una leve caida a partir del año 2023 debido a que colombia enfrentó un entorno económico complejo, caracterizado por altas tasas de interés, inflación persistente y un crecimiento económico moderado. Estas condiciones pueden haber desincentivado el endeudamiento y reducido la capacidad de ahorro de las personas y empresas.

Estacionalidad: La estacionalidad es más pronunciada en la Variable 2 (DAH), lo que sugiere que hay patrones repetitivos en los depositos de ahorro, posiblemente relacionados con ciclos económicos o temporadas específicas del año, en este caso vemos que en los meses de Junio se marcan valores negativos, lo que podriamos asociar a que el consumidor retira sus ahorro para suplir sus necesidades de vacaciones y comienzos de año escolar y en el mes de septiembre picos fuertes tal vez asociados a que preparan sus recursos para la temporada decembrina. En las otras dos variables vemos una relacion muy directa de estacionalidad ya que en ambas se presentan picos altos en las temporadas finalizando el año, Agosto-Diciembre donde mayor consumo de creditos se realiza y vemos como en los primeros meses Enero- Febrero tiene un comportamiento negativo debido a que por estas fechas tanto personas como empresas se cohiben de realizar consumos masivos y endeudamientos.

Cambios Estructurales: Se observan algunos cambios estructurales alrededor de 2020, posiblemente relacionados con la pandemia de COVID-19, que afectó la economía global y, por ende, el sector bancario. Estos cambios podrían incluir una mayor demanda de crédito debido a la necesidad de liquidez por parte de las empresas y los hogares.

2.5. Variables Ajustadas por Estacionalidad

# Extraer los componentes de la descomposición
cart_sa <- cart_ts - stl_decomp_cart$time.series[, "seasonal"]

# Extraer los componentes de la descomposición
dah_sa <- dah_ts - stl_decomp_dah$time.series[, "seasonal"]

# Extraer los componentes de la descomposición
cart_v_sa <- cart_v_ts - stl_decomp_cart_v$time.series[, "seasonal"]

2.6. Variables Ajustadas por Estacionalidad vs Series Originales

Gráfico serie original VS ajustada Variable CART

# Crear vector de fechas correctamente alineado con la serie
fechas_cart <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(cart_ts))

# Gráfico mejorado con fechas en el eje X
grafico_ajustada_cart <- ggplot() +
  geom_line(aes(x = fechas_cart, y = cart_ts), color = "grey", size = 0.5, linetype = "solid", name = "Serie Original") +
  geom_line(aes(x = fechas_cart, y = cart_sa), color = "black", size = 0.6, linetype = "solid", name = "Serie Ajustada") +
  ggtitle("Grafico 2.4 Variable CART:Serie Original vs Serie Ajustada por Estacionalidad") +
  xlab("Tiempo") +
  ylab("Millones") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas para mejor visualización

# Convertir a gráfico interactivo
ggplotly(grafico_ajustada_cart)

Gráfico serie original VS ajustada Variable DAH

# Crear vector de fechas correctamente alineado con la serie
fechas_dah <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(dah_ts))

# Gráfico mejorado con fechas en el eje X
grafico_ajustada_dah <- ggplot() +
  geom_line(aes(x = fechas_dah, y = dah_ts), color = "grey", size = 0.5, linetype = "solid", name = "Serie Original") +
  geom_line(aes(x = fechas_dah, y = dah_sa), color = "black", size = 0.6, linetype = "solid", name = "Serie Ajustada") +
  ggtitle("Grafico 2.5 Variable DAH:Serie Original vs Serie Ajustada por Estacionalidad") +
  xlab("Tiempo") +
  ylab("Millones") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas para mejor visualización

# Convertir a gráfico interactivo
ggplotly(grafico_ajustada_dah)

Gráfico serie original VS ajustada Variable 3

# Crear vector de fechas correctamente alineado con la serie
fechas_cart_v <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(cart_v_ts))

# Gráfico mejorado con fechas en el eje X
grafico_ajustada_cart_v<- ggplot() +
  geom_line(aes(x = fechas_cart_v, y = cart_v_ts), color = "grey", size = 0.5, linetype = "solid", name = "Serie Original") +
  geom_line(aes(x = fechas_cart_v, y = cart_v_sa), color = "black", size = 0.6, linetype = "solid", name = "Serie Ajustada") +
  ggtitle("Grafico 2.6 Variable CART_V:Serie Original vs Serie Ajustada por Estacionalidad") +
  xlab("Tiempo") +
  ylab("Millones") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas para mejor visualización

# Convertir a gráfico interactivo
ggplotly(grafico_ajustada_cart_v)

2.7. Variables serie original vs tendencia

Tendencia Variable CART

CART: Crecimiento promedio del 8% (2012–2019), caída al -5% en 2020, y recuperación al 4% en 2024.La tendencia suavizada confirma un crecimiento moderado post-pandemia.

library(ggplot2)
library(plotly)

# Convertir la serie a un vector numérico
cart_vec <- as.numeric(cart_ts)
tendencia_cart <- as.numeric(stl_decomp_cart$time.series[, "trend"])

# Asegurar que 'fechas' tenga la misma longitud
fechas <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(cart_ts))

# Gráfico interactivo de la serie original vs tendencia
grafico_tendencia_cart <- ggplot() +
  geom_line(aes(x = fechas, y = cart_vec, color = "Serie Original"), size = 0.7, linetype = "solid") +
  geom_line(aes(x = fechas, y = tendencia_cart, color = "Tendencia"), size = 0.8, linetype = "solid") +
  scale_color_manual(values = c("Serie Original" = "grey", "Tendencia" = "black")) +
  ggtitle("Grafico 2.7 Variable CART: Serie Original vs Tendencia") +
  xlab("Tiempo") +
  ylab("Millones") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas del eje X

# Convertir a gráfico interactivo con plotly
ggplotly(grafico_tendencia_cart)

Tendencia Variable DAH

DAH:Alta volatilidad: picos del 15% en 2015 y caídas del -10% en 2020.Tendencia negativa post-2022, relacionada con altas tasas de interés.

library(ggplot2)
library(plotly)

# Convertir la serie a un vector numérico
dah_vec <- as.numeric(dah_ts)
tendencia_dah <- as.numeric(stl_decomp_dah$time.series[, "trend"])

# Asegurar que 'fechas' tenga la misma longitud
fechas <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(dah_ts))

# Gráfico interactivo de la serie original vs tendencia
grafico_tendencia_dah <- ggplot() +
  geom_line(aes(x = fechas, y = dah_vec, color = "Serie Original"), size = 0.7, linetype = "solid") +
  geom_line(aes(x = fechas, y = tendencia_dah, color = "Tendencia"), size = 0.8, linetype = "solid") +
  scale_color_manual(values = c("Serie Original" = "grey", "Tendencia" = "black")) +
  ggtitle("Grafico 2.8 Variable DAH: Serie Original vs Tendencia") +
  xlab("Tiempo") +
  ylab("Millones") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas del eje X

# Convertir a gráfico interactivo con plotly
ggplotly(grafico_tendencia_dah)

Tendencia Variable CART_V

CART_V: Menos volátil que CART, pero con una caída más pronunciada en 2023 (-7%).

library(ggplot2)
library(plotly)

# Convertir la serie a un vector numérico
cart_v_vec <- as.numeric(cart_v_ts)
tendencia_cart_v <- as.numeric(stl_decomp_cart_v$time.series[, "trend"])

# Asegurar que 'fechas' tenga la misma longitud
fechas <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(cart_v_ts))

# Gráfico interactivo de la serie original vs tendencia
grafico_tendencia_cart_v <- ggplot() +
  geom_line(aes(x = fechas, y = cart_v_vec, color = "Serie Original"), size = 0.7, linetype = "solid") +
  geom_line(aes(x = fechas, y = tendencia_cart_v, color = "Tendencia"), size = 0.8, linetype = "solid") +
  scale_color_manual(values = c("Serie Original" = "grey", "Tendencia" = "black")) +
  ggtitle(" Grafico 2.9 Variable CART_V: Serie Original vs Tendencia") +
  xlab("Tiempo") +
  ylab("Millones") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas del eje X

# Convertir a gráfico interactivo con plotly
ggplotly(grafico_tendencia_cart_v)

2.8 Tasa de crecimiento de la serie original vs tendencia:

Tasa de crecimiento de la serie de tendencia y original para la variable CART

#Cálculo de la tasa de crecimiento anual correctamente alineada
tasa_crecimiento_cart <- (cart_ts[(13:length(cart_ts))] / cart_ts[1:(length(cart_ts) - 12)] - 1) * 100
tasa_tendencia_cart <- (tendencia_cart[(13:length(tendencia_cart))] / tendencia_cart[1:(length(tendencia_cart) - 12)] - 1) * 100

# Crear vector de fechas corregido, es decir que inicie desde enero 2013
fechas_corregidas_cart <- seq(from = as.Date("2013-01-01"), by = "month", length.out = length(tasa_crecimiento_cart))

# Verificar longitudes
print(length(fechas_corregidas_cart))

## [1] 144

print(length(tasa_crecimiento_cart))

## [1] 144

print(length(tasa_tendencia_cart))

## [1] 144

Gráfico variable original y tendencia variable CART: tasa de crecimiento anual

library(ggplot2)
library(plotly)

# Gráfico de la tasa de crecimiento anual variable 1
grafico_crecimiento_cart <- ggplot() +
  geom_line(aes(x = fechas_corregidas_cart, y = tasa_crecimiento_cart), color = "grey", size = 0.7) +
  geom_line(aes(x = fechas_corregidas_cart, y = tasa_tendencia_cart), color = "black", size = 0.8, linetype = "dashed") +
  ggtitle("Variable CART: Tasa de crecimiento anual % de la serie Original y la tendencia") +
  xlab("Tiempo") +
  ylab("% de Crecimiento Anual") +
  theme_minimal()

# Convertir a gráfico interactivo
ggplotly(grafico_crecimiento_cart)

Gráfico variable original y tendencia variable DAH: tasa de crecimiento anual

#Cálculo de la tasa de crecimiento anual correctamente alineada
tasa_crecimiento_dah <- (dah_ts[(13:length(dah_ts))] / dah_ts[1:(length(dah_ts) - 12)] - 1) * 100
tasa_tendencia_dah <- (tendencia_dah[(13:length(tendencia_dah))] / tendencia_dah[1:(length(tendencia_dah) - 12)] - 1) * 100

# Crear vector de fechas corregido
fechas_corregidas_dah <- seq(from = as.Date("2013-01-01"), by = "month", length.out = length(tasa_crecimiento_dah))

# Verificar longitudes
print(length(fechas_corregidas_dah))

## [1] 144

print(length(tasa_crecimiento_dah))

## [1] 144

print(length(tasa_tendencia_dah))

## [1] 144

# Gráfico de la tasa de crecimiento anual variable 2
grafico_crecimiento_dah <- ggplot() +
  geom_line(aes(x = fechas_corregidas_dah, y = tasa_crecimiento_dah), color = "grey", size = 0.7) +
  geom_line(aes(x = fechas_corregidas_dah, y = tasa_tendencia_dah), color = "black", size = 0.8, linetype = "dashed") +
  ggtitle("Variable DAH: Tasa de crecimiento anual % de la serie Original y la Tendencia") +
  xlab("Tiempo") +
  ylab("% de Crecimiento Anual") +
  theme_minimal()

# Convertir a gráfico interactivo
ggplotly(grafico_crecimiento_dah)

Gráfico variable original y tendencia variable CART_V: tasa de crecimiento anual

#Cálculo de la tasa de crecimiento anual correctamente alineada
tasa_crecimiento_cart_v <- (cart_v_ts[(13:length(cart_v_ts))] / cart_v_ts[1:(length(cart_v_ts) - 12)] - 1) * 100
tasa_tendencia_cart_v <- (tendencia_cart_v[(13:length(tendencia_cart_v))] / tendencia_cart_v[1:(length(tendencia_cart_v) - 12)] - 1) * 100

# Crear vector de fechas corregido
fechas_corregidas_cart_v <- seq(from = as.Date("2013-01-01"), by = "month", length.out = length(tasa_crecimiento_cart_v))

# Verificar longitudes
print(length(fechas_corregidas_cart_v))

## [1] 144

print(length(tasa_crecimiento_cart_v))

## [1] 144

print(length(tasa_tendencia_cart_v))

## [1] 144

# Gráfico de la tasa de crecimiento anual variable 2
grafico_crecimiento_cart_v <- ggplot() +
  geom_line(aes(x = fechas_corregidas_cart_v, y = tasa_crecimiento_cart_v), color = "grey", size = 0.7) +
  geom_line(aes(x = fechas_corregidas_cart_v, y = tasa_tendencia_cart_v), color = "black", size = 0.8, linetype = "dashed") +
  ggtitle("Variable CART_V: Tasa de crecimiento anual % de la serie Original y la tendencia") +
  xlab("Tiempo") +
  ylab("% de Crecimiento Anual") +
  theme_minimal()

# Convertir a gráfico interactivo
ggplotly(grafico_crecimiento_cart_v)

ANALISIS

La tendencia de CART_V es similar a la de CART, con un crecimiento moderado entre 2012-2015, seguido de una desaceleración entre 2016-2019. Durante la pandemia, la tasa de crecimiento se vio afectada negativamente, pero a partir de 2022 se observa una recuperación gradual.

Al igual que en CART, la estacionalidad en CART_V no es tan pronunciada, pero se observan picos de crecimiento hacia finales de año, lo que podría estar relacionado con un mayor consumo de créditos en estas fechas.

El gráfico final muestra que la tasa de crecimiento de CART_V ha sido volátil, con caídas significativas durante la pandemia y una recuperación posterior. La tendencia sugiere que, a pesar de los altibajos, la cartera del sector bancario en el Valle ha mantenido una tendencia creciente a largo plazo.

En conclusión, CART y CART_V muestran un comportamiento similar, con una recuperación más rápida después de la pandemia en comparación con DAH, que ha tenido una recuperación más lenta. Finalmente DAH es la variable con mayor estacionalidad, con patrones claros relacionados con ciclos económicos y temporadas específicas del año (junio y septiembre).

CART y CART_V muestran una estacionalidad menos pronunciada, pero con picos de crecimiento hacia finales de año.

3. PRONOSTICO POR MODELO ARIMA

División en conjunto de entrenamiento y prueba para la variable CART que es la elegida para pronosticar

El código siguiente divide una serie temporal (CART_ts) en dos subconjuntos:

Conjunto de entrenamiento (train): Datos desde enero de 2012 hasta septiembre de 2024. Conjunto de prueba (test): Datos desde octubre de 2024 hasta diciembre de 2024.

Esto se hace para evaluar el desempeño de modelos de predicción en datos no vistos.

# Esta división idealmente podria se 80%-70% de los datos para entrenamiento y 20%-30% para prueba o test

# En este ejemplo el conjunto de entrenamiento es: Enero 2012-Septiembre 2024 y  el conjunto de prueba o test: noviembre 2024-diciembre 2024 

train_size <- length(cart_ts) - 3  # Se dejan fuera los últimos 3 valores para prueba
train_ts <- window(cart_ts, end = c(2024, 9))  # Entrenamiento hasta septiembre 2024
test_ts <- window(cart_ts, start = c(2024, 10))  # Prueba inicia desde octubre 2024
print(test_ts)

##            Oct       Nov       Dec
## 2024 477785684 481526727 480978180

3.1 Identificación del modelo

library(tseries)
# Prueba de estacionariedad con Augmented Dickey-Fuller (ADF)
adf_test <- adf.test(cart_ts) #Se aplica el test ADF a la variable CART (conjunto de entrenamiento)
print(adf_test) # se muestra el resultado del test

## 
##  Augmented Dickey-Fuller Test
## 
## data:  cart_ts
## Dickey-Fuller = -1.0396, Lag order = 5, p-value = 0.9291
## alternative hypothesis: stationary

El test ADF en la variable 1 arrojó un p-value igual a 0.92, este valor es mayor a 0.05, por tanto la serie es no estacionaria. De ese modo se debe ejecutar el código siguiente para diferenciar una vez la variable CART y luego volver a aplicar el test ADF a esa serie diferenciada una vez.

#Se crea un nuevo objeto o variable que se llama train_diff, en donde se diferencia la variable 1 , una sola vez:
cart_diff <- diff(cart_ts, differences = 1)

Diferenciación en niveles variable CART

A continuación, se realiza el gráfico de la serie original y diferenciada (una vez) de la variable CART para ver graficamente el cambio o ajuste:

 # Graficar la serie original en un gráfico separado
  p2 <- ggplot(data.frame(Tiempo = time(cart_ts), variable1 = as.numeric(cart_ts)), aes(x = Tiempo, y = variable1)) +
    geom_line(color = "blue") +
    ggtitle("Grafico 3.1 Variable CART:Serie Original") +
    xlab("Tiempo") + ylab("Gwh")
  
  ggplotly(p2)  # Convertir en gráfico interactivo

  # Graficar la serie diferenciada en un gráfico separado
  p3 <- ggplot(data.frame(Tiempo = time(cart_ts)[-1], variable1_Diff = as.numeric(cart_diff)), aes(x = Tiempo, y = variable1_Diff)) +
    geom_line(color = "red") +
    ggtitle("Grafico 3.2 variable CART:Serie Estacionaria (Una diferenciación)") +
    xlab("Tiempo") + ylab("variable CART diferenciada")
  
  ggplotly(p3)  # Convertir en gráfico interactivo

A continuación se aplica la diferenciación logarítimica y la varible u objeto ahora se llama train_diff_log:

# Si la serie no es estacionaria (p-valor > 0.05), aplicar diferenciación

cart_diff_log <- diff(log(cart_ts), differences = 1)

Ahora probamos estacionariedad en la serie diferenciada ( en nivel y logaritmo)

# Segunda prueba de estacionariedad sobre la serie diferenciada en niveles
  adf_test_diff <- adf.test(cart_diff)
  print(adf_test_diff)

## 
##  Augmented Dickey-Fuller Test
## 
## data:  cart_diff
## Dickey-Fuller = -4.0033, Lag order = 5, p-value = 0.01092
## alternative hypothesis: stationary

# Segunda prueba de estacionariedad sobre la serie diferenciada en logaritmo
  adf_test_diff_log <- adf.test(cart_diff_log)
  print(adf_test_diff_log)

## 
##  Augmented Dickey-Fuller Test
## 
## data:  cart_diff_log
## Dickey-Fuller = -3.8498, Lag order = 5, p-value = 0.01843
## alternative hypothesis: stationary

Identificación manual de p y q

En el código siguiente se crean los correlogramas para determinar los posibles valores que puedeo tomar el parámetro p** y q

library(forecast)
# Graficar ACF y PACF
acf_plot <- ggAcf(cart_diff, lag.max = 6) + ggtitle("Autocorrelation Function (ACF)-Determinar q")
pacf_plot <- ggPacf(cart_diff, lag.max = 6) + ggtitle("Partial Autocorrelation Function (PACF)-Determinar p")

ggplotly(acf_plot)

ggplotly(pacf_plot)

Interpretación correlogramas

Se puede observar que los valores que podrian tomar p y q serian:

p=1* p=4 p=6 q=1* q2 q=5 q=6 (P optimo=1) (q óptimo=1)

Estimación del modelo identificado (4,1,3)

Mejor Modelo: ARIMA manual (4,1,3) para CART, aunque requiere ajustes para capturar estacionalidad y variables externas.

# Cálculo manual de modelo ARIMA
manual_arima_model <- Arima(cart_ts, order = c(4,1,3)) #Se va a estimar un modelo Arima de orden (4,1,3)
summary(manual_arima_model)

## Series: cart_ts 
## ARIMA(4,1,3) 
## 
## Coefficients:
##          ar1     ar2     ar3      ar4     ma1     ma2      ma3
##       0.4531  0.0009  0.9910  -0.4551  0.0716  0.0161  -0.9558
## s.e.  0.0838  0.0148  0.0117   0.0824  0.0434  0.0366   0.0450
## 
## sigma^2 = 7.174e+12:  log likelihood = -2513.35
## AIC=5042.7   AICc=5043.68   BIC=5067.04
## 
## Training set error measures:
##                     ME    RMSE     MAE        MPE      MAPE       MASE
## Training set -24580.42 2608812 1903199 0.01092895 0.4332957 0.08562894
##                    ACF1
## Training set 0.03681331

Significancia de coefientes

library(lmtest)

# Evaluar la significancia estadística de los coeficientes del modelo ARIMA
coeftest(manual_arima_model)

## 
## z test of coefficients:
## 
##        Estimate  Std. Error  z value  Pr(>|z|)    
## ar1  0.45305868  0.08383734   5.4040 6.516e-08 ***
## ar2  0.00093944  0.01478537   0.0635   0.94934    
## ar3  0.99099120  0.01173664  84.4357 < 2.2e-16 ***
## ar4 -0.45512673  0.08241987  -5.5221 3.351e-08 ***
## ma1  0.07161825  0.04338218   1.6509   0.09877 .  
## ma2  0.01606635  0.03661382   0.4388   0.66080    
## ma3 -0.95581717  0.04499231 -21.2440 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretación significancia coeficientes

 checkresiduals(manual_arima_model)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(4,1,3)
## Q* = 71.285, df = 17, p-value = 1.294e-08
## 
## Model df: 7.   Total lags used: 24

Pronóstico (modelo manual)

El modelo sigue la tendencia general, pero tiene un sesgo de sobreestimación.

Si la serie tiene patrones estacionales fuertes y no están bien capturados, el modelo puede fallar en prever las fluctuaciones. En ese caso se puede mejorar el modelo, al trabajar desde el inicio con la serie ajustada por estacionalidad en caso de que se detecte un componente estacional fuerte.

Pronóstico en el test de prueba (oct, nov y dic 2024) y gráfico

#Aquí se crea el pronóstico con el modelo ARIMA manual y se guarda en una nueva riable u objeto "manual_forecast"
manual_forecast <- forecast(manual_arima_model, h = length(test_ts)) #Se generan tantos pronósticos como valores tenga el conjunto de prueba (test_ts).

# Crear dataframe para gráfico interactivo del pronóstico manual
manual_forecast_data <- data.frame(Tiempo = time(manual_forecast$mean), ## Extrae las fechas del pronóstico
                                   Pronostico = as.numeric(manual_forecast$mean), ## Valores pronosticados
                                   Observado = as.numeric(test_ts)) ## Valores reales de la serie

# Graficar pronóstico manual junto con los valores observados reales
p_manual <- ggplot(manual_forecast_data, aes(x = Tiempo)) +
  geom_line(aes(y = Pronostico, color = "Pronóstico Manual")) +
  geom_line(aes(y = Observado, color = "Observado")) +
  ggtitle("Variable CART:Pronóstico Manual vs Observado") +
  xlab("Tiempo") + ylab("Variable1")

ggplotly(p_manual)

Métricas de evaluación del modelo manual dentro del periodo de prueba (oct,nov y dic2024

# Calcular métricas de evaluación del modelo manual
mae_manual <- mean(abs(manual_forecast$mean - test_ts), na.rm = TRUE)
rmse_manual <- sqrt(mean((manual_forecast$mean - test_ts)^2, na.rm = TRUE))

# Mostrar métricas de evaluación del modelo manual
cat("MAE Manual: ", mae_manual, "\n")

## MAE Manual:  NaN

cat("RMSE Manual: ", rmse_manual, "\n")

## RMSE Manual:  NaN

A continuación se calcula la Tabla de pronóstico modelo manual VS los datos reales u observado en oct,nov y dic2024

# Cargar librerías necesarias
library(forecast)
library(dplyr)

# Generar pronóstico con el modelo ARIMA identificado
arima_forecast_manual <- forecast(manual_arima_model, h = length(test_ts))

# Crear un dataframe con los valores observados y pronosticados
forecast_table_manual <- data.frame(
  Tiempo = time(arima_forecast_manual$mean),  # Extraer las fechas del pronóstico
  Observado = as.numeric(test_ts),  # Valores reales
  Pronosticado = as.numeric(arima_forecast_manual$mean)  # Valores pronosticados
)

# Mostrar la tabla
print(forecast_table_manual)

##     Tiempo Observado Pronosticado
## 1 2025.000 477785684    479725403
## 2 2025.083 481526727    480063393
## 3 2025.167 480978180    479837080

Ahora pronosticamos fuera del periodo de análisis: Enero 2025

Es decir, le sumamos al periodo de prueba (oct,nov,dic2024) una observación más (enero 2025). Es decir, se estan pronosticando 4 observaciones o meses:

# Cargar librerías necesarias
library(forecast)

# Hacer un pronóstico para el siguiente mes (1 período adicional)
next_forecast_manual <- forecast(manual_arima_model, h = length(test_ts) + 1)

# Extraer el pronóstico del próximo mes
next_month_forecast_manual <- data.frame(
  Tiempo = time(next_forecast_manual$mean),  # Extraer la fecha del pronóstico
  Pronostico = as.numeric(next_forecast_manual$mean)  # Valor pronosticado
)

# Mostrar el pronóstico completo
print(next_month_forecast_manual)

##     Tiempo Pronostico
## 1 2025.000  479725403
## 2 2025.083  480063393
## 3 2025.167  479837080
## 4 2025.250  478743033

# Extraer solo el valor del trimestre adicional (último de la tabla)
next_month <- tail(next_month_forecast_manual, 1)
print(paste("Pronóstico para enero 2025:", next_month$Tiempo, "=", next_month$Pronostico))

## [1] "Pronóstico para enero 2025: 2025.25 = 478743032.68799"

# Pronosticar octubre de 2024
future_forecast_manual <- forecast(manual_arima_model, h = 1)

# Extraer el valor específico de octubre 2024
forecast_oct2024 <- future_forecast_manual$mean[1]
print(paste("Pronóstico para oct 2024:", forecast_oct2024))

## [1] "Pronóstico para oct 2024: 479725403.419537"

Modelo ARIMA automático

Identificación automática del modelo ARIMA

El modelo automático identificado es (0,2,2). Si se compara el AIC o BIC de este modelo frente el modelo manual (4,1,3), se obtiene un valor más bajo en esta métricas en este modelo automático. Probablemente pudiera ser un buen modelo para pronosticar la variable de cartera bancaria

library(forecast)

# Ajustar un modelo ARIMA automático sin estacionalidad, por eso se pone seasonal=FALSE
auto_arima_model_no_seasonal <- auto.arima(cart_ts, seasonal = FALSE)

# Mostrar el modelo seleccionado
summary(auto_arima_model_no_seasonal)

## Series: cart_ts 
## ARIMA(0,2,2) 
## 
## Coefficients:
##           ma1      ma2
##       -0.5335  -0.3762
## s.e.   0.0710   0.0707
## 
## sigma^2 = 7.858e+12:  log likelihood = -2504.63
## AIC=5015.27   AICc=5015.43   BIC=5024.38
## 
## Training set error measures:
##                     ME    RMSE     MAE         MPE      MAPE       MASE
## Training set -220085.9 2766989 1965482 -0.04291686 0.4423337 0.08843119
##                    ACF1
## Training set 0.01510646

Significancia de coeficientes

library(lmtest)

# Evaluar la significancia estadística de los coeficientes del modelo ARIMA
coeftest(auto_arima_model_no_seasonal)

## 
## z test of coefficients:
## 
##      Estimate Std. Error z value  Pr(>|z|)    
## ma1 -0.533498   0.070970 -7.5172 5.596e-14 ***
## ma2 -0.376171   0.070726 -5.3187 1.045e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# Ajuste del modelo ARIMA(4,1,2) automático sin parte estacional y crearlo como variable darima_auto para luego poder graficarlo y crear la tabla
darima_auto <- Arima(train_ts, 
                order = c(0, 2, 2))  # Especificamos directamente (p=4, d=1, q=2)  

# Mostrar resumen del modelo ajustado
summary(darima_auto)

## Series: train_ts 
## ARIMA(0,2,2) 
## 
## Coefficients:
##           ma1      ma2
##       -0.5343  -0.3657
## s.e.   0.0724   0.0718
## 
## sigma^2 = 7.831e+12:  log likelihood = -2455.53
## AIC=4917.07   AICc=4917.23   BIC=4926.12
## 
## Training set error measures:
##                     ME    RMSE     MAE         MPE      MAPE       MASE
## Training set -240191.9 2761599 1949346 -0.04687839 0.4396546 0.08691373
##                     ACF1
## Training set 0.008667502

# Diagnóstico del modelo (los residuos deben ser ruido blanco)
checkresiduals(darima_auto)  # Verificar si los residuos son aleatorios y no presentan patrones

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,2,2)
## Q* = 62.058, df = 22, p-value = 1.103e-05
## 
## Model df: 2.   Total lags used: 24

Pronóstico modelo ARIMA automático (0,2,2)

# Generar pronóstico para el conjunto de prueba
forecast_arima_auto <- forecast(darima_auto, h = length(test_ts))  # Predecir los valores futuros

# Crear dataframe para gráfico interactivo del pronóstico
forecast_data_auto <- data.frame(Tiempo = time(forecast_arima_auto$mean), 
                            Pronostico = as.numeric(forecast_arima_auto$mean),
                            Observado = as.numeric(test_ts))

# Graficar pronóstico junto con los valores observados reales
p4auto <- ggplot(forecast_data_auto, aes(x = Tiempo)) +
  geom_line(aes(y = Pronostico, color = "Pronóstico")) +
  geom_line(aes(y = Observado, color = "Observado")) +
  ggtitle("Pronóstico vs Observado Modelo Automatico Variable CART") +
  xlab("Tiempo") + ylab("Millones")

ggplotly(p4auto)  # Convertir el gráfico en interactivo

El modelo automático (0,2,2) no es un modelo adecuado para pronostico fuera de muestra o a futuro.

# Cargar librerías necesarias
library(forecast)
library(dplyr)

# Generar pronóstico con el modelo ARIMA identificado
arima_forecast_auto <- forecast(auto_arima_model_no_seasonal, h = length(test_ts))

# Crear un dataframe con los valores observados y pronosticados
forecast_table_auto <- data.frame(
  Tiempo = time(arima_forecast_auto$mean),  # Extraer las fechas del pronóstico
  Observado = as.numeric(test_ts),  # Valores reales
  Pronosticado = as.numeric(arima_forecast_auto$mean)  # Valores pronosticados
)

# Mostrar la tabla
print(forecast_table_auto)

##     Tiempo Observado Pronosticado
## 1 2025.000 477785684    480025383
## 2 2025.083 481526727    479518434
## 3 2025.167 480978180    479011486

Ahora pronosticamos fuera del periodo de análisis

Es decir, le sumamos al periodo de prueb auna observación más. Es decir, se estan pronosticando 4 observaciones o trimestres.

# Cargar librerías necesarias
library(forecast)

# Hacer un pronóstico para el siguiente trimestre (1 período adicional)
next_forecast_auto <- forecast(auto_arima_model_no_seasonal, h = length(test_ts) + 1)

# Extraer el pronóstico del próximo trimestre
next_month_forecast_auto <- data.frame(
  Tiempo = time(next_forecast_auto$mean),  # Extraer la fecha del pronóstico
  Pronostico = as.numeric(next_forecast_auto$mean)  # Valor pronosticado
)

# Mostrar el pronóstico completo
print(next_month_forecast_auto)

##     Tiempo Pronostico
## 1 2025.000  480025383
## 2 2025.083  479518434
## 3 2025.167  479011486
## 4 2025.250  478504537

# Extraer solo el valor del trimestre adicional (último de la tabla)
next_month <- tail(next_month_forecast_auto, 1)
print(paste("Pronóstico para enero 2025:", next_month$Tiempo, "=", next_month$Pronostico))

## [1] "Pronóstico para enero 2025: 2025.25 = 478504537.478405"

Otra forma para calcular un valor futuro (fuera de muestra)

# Pronosticar  el mes octubre 2024
future_forecast_auto <- forecast(auto_arima_model_no_seasonal, h = 1)

# Extraer el valor específico de octubre 2024
forecast_oct2024_auto <- future_forecast_auto$mean[1]
print(paste("Pronóstico para octubre 2024:", forecast_oct2024_auto))

## [1] "Pronóstico para octubre 2024: 480025382.797481"

Identificación automática del mejor modelo ARIMA

**A continuación, se crea el objeto darima para lueg poder graficar los valores reales y observados:**


``` r
# Cargar el paquete necesario
library(forecast)

# Ajustar el modelo SARIMA(1,2,1)(0,2,2)[12]
darima <- Arima(train_ts, 
                order = c(1, 2, 1),  # (p,d,q) -> (0,1,1)
                seasonal = list(order = c(0, 0, 2),  # (P,D,Q) -> (1,0,0)
                                period = 12))  # Periodicidad estacional de 12 meses

# Mostrar resumen del modelo ajustado
summary(darima)

## Series: train_ts 
## ARIMA(1,2,1)(0,0,2)[12] 
## 
## Coefficients:
##          ar1      ma1    sma1    sma2
##       0.4237  -0.9610  0.3183  0.2092
## s.e.  0.0828   0.0272  0.0819  0.0788
## 
## sigma^2 = 6.624e+12:  log likelihood = -2442.69
## AIC=4895.38   AICc=4895.8   BIC=4910.47
## 
## Training set error measures:
##                     ME    RMSE     MAE         MPE      MAPE       MASE
## Training set -224458.3 2522710 1798294 -0.04361453 0.4054295 0.08017894
##                     ACF1
## Training set -0.02629916

En el correlograma de residuos siguiente se observa que, mejora la correlación de los residuos frente a lso dos modelos anteriores. Sin embargo, al comparar los valores reales VS pronosticados se determina una poca coincidencia. Sigue funcionando mejor el modelo automatico (4,1,2)

# Diagnóstico del modelo (los residuos deben ser ruido blanco)
checkresiduals(darima)  # Verificar si los residuos son aleatorios y no presentan patrones

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,2,1)(0,0,2)[12]
## Q* = 20.77, df = 20, p-value = 0.4108
## 
## Model df: 4.   Total lags used: 24

Pronóstico con el modelo SARIMA

# Generar pronóstico para el conjunto de prueba
forecast_arima <- forecast(darima, h = length(test_ts))  # Predecir los valores futuros

# Crear dataframe para gráfico interactivo del pronóstico
forecast_data <- data.frame(Tiempo = time(forecast_arima$mean), 
                            Pronostico = as.numeric(forecast_arima$mean),
                            Observado = as.numeric(test_ts))

# Graficar pronóstico junto con los valores observados reales
p4 <- ggplot(forecast_data, aes(x = Tiempo)) +
  geom_line(aes(y = Pronostico, color = "Pronóstico")) +
  geom_line(aes(y = Observado, color = "Observado")) +
  ggtitle("Pronóstico vs Observado Modelo SARIMA") +
  xlab("Tiempo") + ylab("Millones")

ggplotly(p4)  # Convertir el gráfico en interactivo

# Cargar librerías necesarias
library(forecast)
library(dplyr)

# 1. Definir la serie temporal (si no está definida)
cart_ts <- ts(Base_fn$CART, start = c(2012, 1), frequency = 12)

# 2. Dividir en entrenamiento y prueba (si no está hecho)
train_ts <- window(cart_ts, end = c(2024, 9)) # Datos hasta septiembre 2024
test_ts <- window(cart_ts, start = c(2024, 10)) # Datos desde octubre 2024

# 3. Ajustar modelo ARIMA automático (si no está definido)
auto_arima_model <- auto.arima(train_ts)

# 4. Generar pronóstico
arima_forecast <- forecast(auto_arima_model, h = length(test_ts))

# 5. Crear dataframe con fechas correctas
forecast_table <- data.frame(
  Tiempo = as.Date(time(arima_forecast$mean)), # Convertir a fecha
  Observado = as.numeric(test_ts),
  Pronosticado = as.numeric(arima_forecast$mean)
)

# 6. Mostrar tabla
print(forecast_table)

##       Tiempo Observado Pronosticado
## 1 2024-10-01 477785684    473807607
## 2 2024-11-01 481526727    472303854
## 3 2024-12-01 480978180    469867599

# Opcional: Gráfico de validación
autoplot(arima_forecast) +
  autolayer(test_ts, color = "red") +
  ggtitle("Pronóstico ARIMA vs Observado")

Ahora pronosticamos fuera del periodo de análisis

Es decir, le sumamos al periodo de prueba una observación más. Es decir, se estan pronosticando 4 observaciones o meses.

# Cargar librerías necesarias
library(forecast)

# Hacer un pronóstico para el siguiente mes (1 período adicional)
next_forecast <- forecast(auto_arima_model, h = length(test_ts) + 1)

# Extraer el pronóstico del próximo mes
next_month_forecast <- data.frame(
  Tiempo = time(next_forecast$mean),  # Extraer la fecha del pronóstico
  Pronostico = as.numeric(next_forecast$mean)  # Valor pronosticado
)

# Mostrar el pronóstico completo
print(next_month_forecast)

##     Tiempo Pronostico
## 1 2024.750  473807607
## 2 2024.833  472303854
## 3 2024.917  469867599
## 4 2025.000  467071207

# Extraer solo el valor del trimestre adicional (último de la tabla)
next_month <- tail(next_month_forecast, 1)
print(paste("Pronóstico para enero 2025:", next_month$Tiempo, "=", next_month$Pronostico))

## [1] "Pronóstico para enero 2025: 2025 = 467071206.603231"

4.CONCLUSION:

En este análisis, se evaluaron varios modelos ARIMA para pronosticar la variable CART (Cartera del sector bancario). Los modelos considerados incluyeron un modelo ARIMA manual, un modelo ARIMA automático y un modelo SARIMA (Seasonal ARIMA). A continuación, se presenta una conclusión sobre el mejor modelo y recomendaciones para mejorar los pronósticos:

El modelo ARIMA manual (4,1,3) fue el que mostró un mejor desempeño en términos de ajuste y pronóstico. Aunque el modelo automático (0,2,2) y el SARIMA (1,2,1)(0,0,2)[12] también fueron evaluados, el modelo manual presentó un mejor balance entre la capacidad de capturar la tendencia y la estacionalidad de la serie, además de tener un menor error en las métricas de evaluación (MAE y RMSE).

ARIMA Manual (4,1,3): Este modelo mostró un buen ajuste a los datos históricos y fue capaz de seguir la tendencia general de la serie. Aunque el MAPE fue relativamente alto (43.4%), lo que indica un error porcentual significativo, el modelo manual fue más preciso en comparación con los modelos automáticos y SARIMA.

Finalmente el análisis evidenció que, si bien los modelos ARIMA son útiles para pronósticos a corto plazo, su efectividad está limitada por la falta de contextualización económica y estacionalidad no modelada. CART mostró la mayor predictibilidad, mientras que DAH requiere enfoques más sofisticados. Para decisiones estratégicas, se recomienda:

Combinar modelos cuantitativos con análisis cualitativo del entorno.

Actualizar periódicamente los modelos con datos recientes y variables externas.

En resumen, el sector financiero colombiano enfrenta desafíos complejos, pero con mejoras metodológicas y tecnológicas, es posible optimizar la gestión de riesgos y oportunidades en un entorno volátil.

** Gestión de Riesgos y Oportunidades**

Monitoreo Regulatorio Proactivo: Crear un comité interdisciplinario para analizar reformas financieras y su impacto en la cartera crediticia y los depósitos.

Herramienta: Sistema de alertas tempranas vinculado a boletines de la Superintendencia Financiera.

Planes de Contingencia para Crisis: Desarrollar escenarios basados en modelos estresados con variables exógenas extremas (ej: caída del 10% del PIB).

Acciones: Líneas de crédito emergentes y reestructuraciones flexibles.

Productos Financieros Estabilizadores: Diseñar cuentas de ahorro con penalizaciones reducidas por retiros a largo plazo, incentivando la retención de depósitos (DAH).

Plataformas Digitales Interactivas: Lanzar apps móviles con simuladores de crédito y alertas personalizadas para clientes, reduciendo la incertidumbre en el uso de productos financieros.

Función clave: Notificaciones sobre fechas de pago y beneficios por ahorro constante.

Educación Financiera: Ofrecer talleres gratuitos sobre gestión de deuda y ahorro, enfocados en segmentos con alta morosidad (ej: microempresarios en el Valle).

Métrica objetivo: Reducir la tasa de morosidad en CART_V en un 15% en 12 meses.

Alianzas Estratégicas: Colaborar con fintechs para desarrollar herramientas de scoring crediticio alternativo, usando datos no tradicionales (ej: historial de pagos de servicios públicos).

Optimización de Cartera: Segmentar la cartera (CART) por riesgo y plazo, priorizando créditos a sectores resilientes (ej: agroindustria) en períodos de incertidumbre.

Tableros de Control en Tiempo Real: Implementar dashboards con métricas clave (MAPE, morosidad, crecimiento de DAH) para seguimiento continuo.

Plataforma sugerida: Power BI integrado con bases de datos transaccionales.

Revisiones Trimestrales: Evaluar el impacto de las estrategias implementadas y ajustar modelos/acciones según resultados.

Ejemplo: Si el MAPE de CART supera el 45%, revisar variables exógenas incluidas.

Conclusión Estratégica

Las recomendaciones priorizan la combinación de modelos predictivos avanzados, gestión proactiva de riesgos e innovación digital. La clave está en:

Flexibilidad: Adaptar modelos a cambios económicos mediante actualizaciones frecuentes.

Transparencia: Mejorar la comunicación con clientes para estabilizar patrones financieros.

Colaboración: Alianzas con actores tecnológicos y regulatorios para anticipar desafíos.

EXTRACCION DE SEÑALES Y MODELO ARIMA SECTOR FINANCIERO

Blanca Nathalia Gomez y Sharon Dayana Solano

2025-03-20

INTRODUCCION

3. PRONOSTICO POR MODELO ARIMA

Ahora probamos estacionariedad en la serie diferenciada ( en nivel y logaritmo)

Identificación manual de p y q

Estimación del modelo identificado (4,1,3)

Identificación automática del mejor modelo ARIMA