Introducción

El sector azucarero colombiano desempeña un papel relevante dentro de la economía nacional, tanto por su aporte al desarrollo agroindustrial como por su incidencia en las exportaciones del país. Analizar el comportamiento de variables como la producción de azúcar, el volumen de exportaciones, la participación de estas sobre el total exportado y la Tasa Representativa del Mercado (TRM) resulta fundamental para comprender su evolución en el tiempo y su relación con factores macroeconómicos.

El presente informe tiene como propósito realizar un análisis estadístico descriptivo de dichas variables, utilizando información mensual comprendida entre enero de 2012 y diciembre de 2024, obtenida de fuentes oficiales como el DANE, el Banco de la República y Asocaña. Como herramienta central, se emplea un modelo ARIMA (AutoRegressive Integrated Moving Average) sobre la serie de producción de azúcar, con el fin de extraer señales, identificar patrones y generar proyecciones a corto plazo que puedan resultar útiles para la toma de decisiones empresariales.

Se espera que los hallazgos generados a partir de este estudio sirvan de insumo para que empresas del sector, como Incauca, puedan diseñar estrategias informadas y anticipar posibles escenarios futuros.

Objetivo: Analizar estadísticamente el comportamiento de variables clave del sector azucarero en Colombia entre 2012 y 2024, aplicando un modelo ARIMA a la serie de producción de azúcar para generar proyecciones a corto plazo que apoyen la toma de decisiones estratégicas.

TRM <- ts(data_col$TRM, start = c(2012, 1), frequency = 12) #TRM
p_azucar <- ts(data_col$AZUCAR, start = c(2012, 1), frequency = 12) #Producción de azucar en toneladas
exp_azucar <- ts(data_col$X_AZU, start = c(2012, 1), frequency = 12) #Exportaciones de azucar y confitería en miles de dólares
peso_exportaciones <- ts(data_col$`% X`, start = c(2012, 1), frequency = 12) #Peso (%) de las exportaciones de azúcar en las exportaciones totales "X"

Estadística Descriptiva

Figura 1. Tabla resumen variables

variable Max Min Media Mediana Desvest CoefVar
Exportaciones 93815 16219 51709 50746 14825 0.2867
Producción 263434 11041 180922 185521 42495 0.2349
% Exportaciones 0.0326 0.005097 0.01406 0.01357 0.004108 0.2922
TRM 4921 1768 3135 3111 864.9 0.2758

Figura 2. Matriz de correlaciones

Figura 3. Tabla de significancia

## Call:corr.p(r = correlacion, n = 156, minlength = 4)
## Correlation matrix 
##          TRM AZUCAR X_AZU     X
## TRM     1.00  -0.10 -0.13 -0.27
## AZUCAR -0.10   1.00  0.21 -0.08
## X_AZU  -0.13   0.21  1.00  0.47
## X      -0.27  -0.08  0.47  1.00
## Sample Size 
## [1] 156
## Probability values (Entries above the diagonal are adjusted for multiple tests.) 
##         TRM AZUCAR X_AZU    X
## TRM    0.00   0.42  0.29 0.00
## AZUCAR 0.21   0.00  0.03 0.42
## X_AZU  0.10   0.01  0.00 0.00
## X      0.00   0.31  0.00 0.00
## 
##  To see confidence intervals of the correlations, print with the short=FALSE option
  TRM AZUCAR X_AZU X
TRM 0 0.4224 0.2913 0.004073
AZUCAR 0.2112 0 0.02929 0.4224
X_AZU 0.0971 0.007322 0 2.917e-09
X 0.0008146 0.3149 4.861e-10 0

El análisis descriptivo revela que la industria azucarera en Colombia presenta un comportamiento moderadamente volátil, con coeficientes de variación que oscilan entre el 20% y el 30% en las variables analizadas. Las exportaciones de azúcar muestran una mediana de 50 millones de dólares y una media ligeramente superior de 51,7 millones, lo que sugiere la presencia de valores extremos en la cola superior de la distribución. En contraste, la producción de azúcar se posiciona como la variable más estable, con un coeficiente de variación del 23% y valores promedio y mediano cercanos, de aproximadamente 180 mil y 185 mil toneladas, respectivamente.

Por su parte, la proporción que representan las exportaciones de azúcar sobre el total exportado por el país se ha mantenido relativamente constante, con una media del 1,4%, alcanzando picos de hasta el 3% y mínimos cercanos al 0,5%. En cuanto a la Tasa Representativa del Mercado (TRM), el promedio durante el periodo analizado ha sido de 3.135 pesos colombianos por dólar, con una desviación estándar de 865 pesos.

Por último, la matriz de correlación muestra que no se presentan relaciones fuertes entre las variables (es decir, mayores al 50%). Sin embargo, sí se identifican correlaciones estadísticamente significativas en varios casos (con niveles de significancia menores al 5%). En particular, no se observa una relación fuerte entre la TRM y la producción o exportación de azúcar, aunque sí se evidencia una correlación negativa y significativa con el total exportado. La producción de azúcar presenta una correlación positiva y moderada con las exportaciones, lo cual resulta lógico. La relación más destacada es la que existe entre las exportaciones absolutas de azúcar y el total exportado, lo cual respalda la coherencia interna de los datos analizados.

Gráficos variables

Impacto de las variables en la empresa

Los patrones de evolución observados en el sector azucarero sugieren que la estabilidad en la producción facilita una planificación operativa eficiente, mientras que la volatilidad en las exportaciones exige estrategias de cobertura ante un entorno externo incierto. La relación moderada entre producción y exportaciones indica sensibilidad a la demanda internacional, y la dependencia del tipo de cambio resalta la necesidad de no basar el crecimiento solo en la TRM. Finalmente, la consistencia interna de los datos respalda decisiones estratégicas confiables y basadas en evidencia.

Extracción de señales

*Muchas series de tiempo son una combinación de varias influencias. Es por eso que, separar la tendencia, la estacionalidad y los componentes aleatorios permite entender mejor qué está impulsando los cambios en la serie.

Los modelos de pronóstico funcionan mejor cuando las señales subyacentes están bien definidas. Por ejemplo, si eliminamos la estacionalidad de una serie, los modelos predictivos pueden enfocarse en la tendencia real y reducir errores. *Detectar cambios inesperados en la serie es más fácil cuando se eliminan componentes predecibles. Ejemplo: Si hay una caída abrupta en la variable podemos verificar si es una anomalía (ruido) o un cambio estructural en la economía.

En conclusión, la descomposición de series de tiempo permite comprender mejor los datos, mejorar predicciones y tomar decisiones más estratégicas. Es una herramienta clave en la analítica de negocios, especialmente en entornos donde las fluctuaciones en los datos pueden afectar inversiones, políticas económicas y estrategias empresariales.

Extracción señales variable 1: Producción de azúcar

Extracción señales variable 2: Exportaciones de azúcar

Extracción señales variable 3: pesos exportaciones de azúcar en exportaciones totales

Extracción señales variable 4: TRM

En conjunto el análisis de las variables ajustadas sugiere que el sector azucarero en Colombia se mantuvo estable en el último año, con una tendencia alcista particularmente evidente en la producción durante 2024. No obstante, la TRM muestra señales de aumento, y dado que su correlación con las exportaciones de azúcar es negativa, este comportamiento podría afectar el dinamismo exportador del sector. De hecho, en las gráficas se percibe una leve tendencia descendente en las exportaciones, tanto en términos absolutos como relativos, lo cual podría anticipar una posible contracción en la producción si la demanda externa se debilita.

Después de la descomposición temporal, se extrae la variable ajustada por estacionalidad para graficarla junto con la serie original:

Se crea las variable ajustada por estacionalidad

Gráficos serie original VS ajustada Variable 1

Vemos que las variables (a excepción de la TRM que es una serie financiera) son bastante estacionarias, lo que es normal dentro de variables de la industria agrícola.

Ahora graficamos serie original vs tendencia en la variable que pronosticaremos: Producción de azúcar (en toneladas)

  • La extracción de la tendencia permite centrarse en los cambios estructurales de la serie.

  • Analizar la tendencia ayuda a prever escenarios futuros y anticipar posibles crisis o oportunidades en el sector o variable de análisis

Primero se debe obtener la tendencia de cada variable y luego graficarla

Tendencia Variable 1: Producción

Se aprecia una tendencia alcista a corto plazo producto de la recuperación ante la caída que hubo en pandemia y 2021 (paro nacional).

Ahora calculamos la tasa de crecimiento de la serie original vs tendencia:

Tasa de crecimiento de la serie de tendencia y original para la variable 1

## [1] 144
## [1] 144
## [1] 144

Gráfico variable original y tendencia variable 1: tasa de crecimiento anual

## [1] 31
## [1] 31
## [1] 31

Gráfico últimos 2 años

¿Qué modelo funciona mejor?

Modelo Arima Manual

Un modelo ARIMA (Autoregressive Integrated Moving Average) es una herramienta estadística utilizada para analizar y predecir series de tiempo. En términos simples, es como una “bola de cristal matemática” que usa datos pasados para estimar valores futuros, especialmente útil en finanzas para preveer precios, ventas o ingresos.

A continuación se aplica el test ADF para validar estacionariedad en el conjunto de entrenamiento de la variable 1, que es la elegida para pronosticar:

## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_ts
## Dickey-Fuller = -4.0768, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

El test ADF en la variable 1 arrojó un p-value igual a 0.01, este valor es menor a 0.05, por tanto la serie es estacionaria. De ese modo se debe ejecutar el código siguiente para diferenciar la variable 1 y luego volver a aplicar el test ADF a esa serie diferenciada:

## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_diff
## Dickey-Fuller = -5.5854, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

En el test ADF se muestra que el valor que puede tomar d=1:

El p-value ya es menor a 0.05 con una primera diferencia. Por tanto el valor que puede tomar d es igual a 1

Identificación manual de p y q

¿Qué hacen estos gráficos?

ACF (Autocorrelation Function)

Muestra la correlación de la serie con sus rezagos.

Ayuda a determinar el parámetro q en un modelo ARIMA(p, d, q).

PACF (Partial Autocorrelation Function)

Muestra la correlación parcial entre la serie y un rezago específico, eliminando el efecto de rezagos intermedios.

Ayuda a determinar el parámetro p en un modelo ARIMA(p, d, q).

Recordemos El eje X representa los rezagos (lags). El eje Y muestra la autocorrelación parcial en cada rezago. Las líneas azules punteadas son los intervalos de confianza (aproximadamente 95%). Si una barra sobrepasa estos límites, indica una autocorrelación significativa. Si las barras caen dentro de los límites, no son significativamente diferentes de cero

En el código siguiente se crean los correlogramas para determinar los posibles valores que puedeo tomar el parámetro p y q:

Interpretación correlogramas

Se puede observar que los valores que podrian tomar p y q serian:

p=2 p=3 p=4 p= 5 p= 6 q=2 q=3 q=6

El modelo óptimo para esta variable es (3,1,6).

Estimación del modelo identificado (3,2,6)

## Series: train_ts 
## ARIMA(3,1,6) 
## 
## Coefficients:
##           ar1      ar2     ar3      ma1     ma2      ma3      ma4      ma5
##       -0.2284  -0.3159  0.4568  -0.1292  0.0813  -1.1531  -0.2230  -0.1088
## s.e.   0.1317   0.1108  0.1295   0.1065  0.0936   0.1104   0.1054   0.1030
##          ma6
##       0.6319
## s.e.  0.0893
## 
## sigma^2 = 973492836:  log likelihood = -1765.27
## AIC=3550.53   AICc=3552.11   BIC=3580.64
## 
## Training set error measures:
##                     ME     RMSE      MAE       MPE     MAPE     MASE       ACF1
## Training set -363.5901 30150.01 23396.29 -9.912806 21.24104 1.153667 0.04843609

Estimación del modelo identificado (3,1,2)

## Series: train_ts 
## ARIMA(3,1,2) 
## 
## Coefficients:
##           ar1     ar2      ar3     ma1     ma2
##       -0.3011  0.3395  -0.3594  0.0244  -0.969
## s.e.   0.0784  0.0812   0.0776  0.0301   0.030
## 
## sigma^2 = 1.191e+09:  log likelihood = -1780.38
## AIC=3572.76   AICc=3573.35   BIC=3590.83
## 
## Training set error measures:
##                     ME     RMSE      MAE       MPE     MAPE     MASE
## Training set -435.2287 33816.18 26385.12 -12.75208 25.24733 1.301046
##                     ACF1
## Training set -0.02495074

AIC y BIC: Se usan para comparar modelos; cuanto más bajos, mejor.

Mean Absolute Error (MAE)

Representa el error absoluto promedio entre las predicciones del modelo y los valores reales.

Root Mean Squared Error (RMSE)

Similar al MAE, pero da más peso a los errores grandes, porque eleva las diferencias al cuadrado antes de promediarlas.

Comparación con MAE: El RMSE es ligeramente mayor que el MAE, es posible que haya algunos errores grandes que estén influyendo más en el RMSE, pero no son muy significativos.

Mean Absolute Percentage Error (MAPE)

Expresa el error en términos relativos, como porcentaje del valor real.

Regla general: MAPE < 10% → Muy buen modelo ✅ 10%-20% → Modelo aceptable 👍 20%-50% → Modelo pobre ⚠️ 50% → Modelo muy malo ❌

En este caso, ambos modelos tienen un MAPE mayor al 20% sugiere un modelo aceptable para pronostico.

Usaremos el modelo con menor MAPE y menores AIC y BIC, en este caso es el modelo arima (3,1,6)

Significancia de coeficientes

## 
## z test of coefficients:
## 
##      Estimate Std. Error  z value  Pr(>|z|)    
## ar1 -0.228416   0.131724  -1.7340 0.0829096 .  
## ar2 -0.315853   0.110753  -2.8519 0.0043462 ** 
## ar3  0.456809   0.129508   3.5273 0.0004199 ***
## ma1 -0.129168   0.106527  -1.2125 0.2253064    
## ma2  0.081314   0.093602   0.8687 0.3850020    
## ma3 -1.153056   0.110391 -10.4452 < 2.2e-16 ***
## ma4 -0.222972   0.105401  -2.1155 0.0343899 *  
## ma5 -0.108762   0.102999  -1.0560 0.2909908    
## ma6  0.631854   0.089329   7.0733 1.512e-12 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Interpretación significancia coeficientes

ar2, ar3 y ma3 y ma6, son altamente significativos (***), lo que significa que estos coeficientes tiene un impacto importante en el modelo. Como ambos componentes son significativos, entonces continuo con la validación de residuos del modelo.

Validación de residuos del modelo estimado manual

La validación de residuos es crucial para determinar si el modelo ARIMA es adecuado o si necesita mejoras. El objetivo es verificar que los residuos (errores de predicción) se comporten como ruido blanco, es decir, sin patrones detectables.

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(3,1,6)
## Q* = 117.38, df = 15, p-value < 2.2e-16
## 
## Model df: 9.   Total lags used: 24

1. Serie de residuos (gráfico superior)

Muestra cómo se comportan los errores a lo largo del tiempo. Idealmente, deberían oscilar alrededor de cero sin tendencias evidentes ni grandes acumulaciones de error.

Función de Autocorrelación (gráfico inferior izquierdo, ACF de residuos)

Si el modelo es adecuado, los residuos no deben mostrar correlaciones significativas en el tiempo.

Histograma de residuos con ajuste normal (gráfico inferior derecho)

Sirve para verificar si los errores siguen una distribución normal, lo cual es un supuesto clave en ARIMA.

Resumen Modelo ARIMA Manual

✅ El modelo ARIMA (3,1,6) no parece ser bueno ya que presenta picos en el gráfico superior, muchos de los residuos tienen altas correlaciones y el histrograma no sigue una distribución normal clara. Veamos el gráfico del test de prueba que pronostica los últimos 5 periodos (desde agosto hasta dic de 2024)

Métricas de evaluación del modelo manual dentro del periodo de prueba

## MAE Manual:  22717.19
## RMSE Manual:  30583.17

MAE (Mean Absolute Error) Indica el error promedio en unidades de la variable, es decir, producción de azúcar en toneladas

RMSE (Root Mean Squared Error) Penaliza más los errores grandes debido a la elevación al cuadrado antes de calcular la raíz.

Según el gráfico el modelo ARIMA (3,1,6) captura bien la tendencia de la producción por lo que este modelo puede funcionar para pronosticar la variable, sin embargo vamos a continuar con los otros modelos, para comparar sus métricas y escoger el que mejor funcione para hacer la proyección

##     Tiempo Observado Pronosticado
## 1 2024.583  219000.1     209767.3
## 2 2024.667  226383.5     218080.3
## 3 2024.750  211029.5     150290.5
## 4 2024.833  169151.2     141253.5
## 5 2024.917  189902.3     182488.9

Ahora pronosticamos fuera del periodo de análisis: enero 2025

Es decir, le sumamos al periodo de prueba (agos,sep,oct,nov y dic 2024) una observación más (ene 2025). Es decir, se estan pronosticando 6 observaciones o meses:

##     Tiempo Pronostico
## 1 2024.583   209767.3
## 2 2024.667   218080.3
## 3 2024.750   150290.5
## 4 2024.833   141253.5
## 5 2024.917   182488.9
## 6 2025.000   156976.6

Pronóstico de la producción de azúcar según el modelo Arima manual para enero de 2025:

## [1] "Pronóstico para enero 2025: 2025 = 156976.611034153"

Modelo ARIMA automático

Usa la función auto.arima() de forecast en R para seleccionar automáticamente los mejores parámetros (p,d,q).

✅ Ventajas:

✔ Optimización automática: Encuentra los valores óptimos de ARIMA sin intervención manual. ✔ Ahorra tiempo: Útil cuando hay muchas series a modelar. ✔ Evita sesgo humano: Reduce el riesgo de elegir un modelo incorrecto por falta de experiencia. ✔ Incluye corrección por estacionalidad si se usa con seasonal = TRUE. ✔ Suele funcionar bien en la mayoría de los casos, ya que usa criterios como AIC/BIC para optimizar.

❌ Desventajas: ❌ Puede no ser el mejor modelo posible, ya que depende del criterio de selección. ❌ Menos interpretabilidad: No siempre es claro por qué eligió ciertos parámetros. ❌ Puede ignorar conocimiento experto sobre la serie o factores externos.

Identificación automática del modelo ARIMA automático

## Series: train_ts 
## ARIMA(1,0,2) with non-zero mean 
## 
## Coefficients:
##           ar1     ma1     ma2        mean
##       -0.8261  1.4360  0.6082  180123.835
## s.e.   0.1303  0.1106  0.0622    4775.791
## 
## sigma^2 = 1.28e+09:  log likelihood = -1795.84
## AIC=3601.68   AICc=3602.09   BIC=3616.76
## 
## Training set error measures:
##                   ME     RMSE      MAE       MPE     MAPE     MASE       ACF1
## Training set 71.5075 35300.48 29102.21 -12.63619 26.49381 1.435025 0.03602882

El modelo automático identificado es (1,0,2). Si se compara el AIC o BIC de este modelo frente el modelo manual (3,1,6), se obtiene un valor más alto en el AIC y BIC en este modelo automático. Además el MAPE es también mayor en este modelo (26.4%) frente al modelo manual (21.2%)

## 
## z test of coefficients:
## 
##              Estimate  Std. Error z value  Pr(>|z|)    
## ar1       -8.2611e-01  1.3034e-01  -6.338 2.328e-10 ***
## ma1        1.4360e+00  1.1064e-01  12.979 < 2.2e-16 ***
## ma2        6.0823e-01  6.2159e-02   9.785 < 2.2e-16 ***
## intercept  1.8012e+05  4.7758e+03  37.716 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Series: train_ts 
## ARIMA(1,0,2) with non-zero mean 
## 
## Coefficients:
##           ar1     ma1     ma2        mean
##       -0.8261  1.4360  0.6082  180123.835
## s.e.   0.1303  0.1106  0.0622    4775.791
## 
## sigma^2 = 1.28e+09:  log likelihood = -1795.84
## AIC=3601.68   AICc=3602.09   BIC=3616.76
## 
## Training set error measures:
##                   ME     RMSE      MAE       MPE     MAPE     MASE       ACF1
## Training set 71.5075 35300.48 29102.21 -12.63619 26.49381 1.435025 0.03602882

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,0,2) with non-zero mean
## Q* = 176.61, df = 21, p-value < 2.2e-16
## 
## Model df: 3.   Total lags used: 24

Resumen Modelo ARIMA Automático

Pronóstico modelo Arima (1,0,2)

Con este gráfico se comprueba que el modelo ARIMA automático (1,0,2) sin ajuste por estacionalidad no funciona en la variable producción de azúcar

Modelo SARIMA automático

Este modelo podria ser una solución o mejora al modelo arima tradicional ya que recoge el efecto estacional de las variables, es recomendable por tanto para datos que si tienen un componente estacional fuerte.

Un SARIMA (Seasonal ARIMA) es un modelo que combina:

✅ Un modelo ARIMA tradicional para capturar relaciones entre valores pasados y errores. ✅ Un componente estacional, útil cuando los datos muestran patrones repetitivos en el tiempo (por ejemplo, ventas trimestrales, datos mensuales de temperatura, etc.).

Básicamente, es como un ARIMA mejorado que puede manejar ciclos estacionales.

## Series: train_ts 
## ARIMA(3,0,2)(1,1,1)[12] with drift 
## 
## Coefficients:
##          ar1     ar2     ar3      ma1     ma2     sar1     sma1      drift
##       1.2713  -0.564  0.0685  -0.9912  0.5807  -0.1671  -0.8258  -135.6006
## s.e.  0.3229   0.284  0.1592   0.2998  0.1623   0.1079   0.1128    86.0246
## 
## sigma^2 = 338503411:  log likelihood = -1566.92
## AIC=3151.84   AICc=3153.24   BIC=3178.25
## Series: train_ts 
## ARIMA(3,0,2)(1,1,1)[12] 
## 
## Coefficients:
##          ar1      ar2     ar3      ma1     ma2     sar1     sma1
##       1.2096  -0.5091  0.0912  -0.9248  0.5452  -0.1789  -0.7843
## s.e.  0.2964   0.2921  0.1645   0.2773  0.1823   0.1074   0.0980
## 
## sigma^2 = 345804596:  log likelihood = -1567.93
## AIC=3151.86   AICc=3152.97   BIC=3175.34
## 
## Training set error measures:
##                     ME     RMSE      MAE       MPE     MAPE      MASE
## Training set -781.9471 17386.57 12215.34 -6.246177 12.42633 0.6023364
##                     ACF1
## Training set 0.002875614

Las métricas de error de este modelo son considerablemente inferiores a las de los demás. Presenta un AIC de 3.151 y un BIC de 3.175, mientras que los otros modelos superan los 3.550 y 3.580, respectivamente. Además, el MAPE de este modelo es del 12%, lo que representa una mejora significativa frente al 21% del modelo manual, reflejando una mayor precisión en la capacidad predictiva

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(3,0,2)(1,1,1)[12]
## Q* = 27.082, df = 17, p-value = 0.05687
## 
## Model df: 7.   Total lags used: 24

Resumen Modelo SARIMA

Métricas de evaluación del modelo manual dentro del periodo de prueba

## MAE manual:  22717.19
## RMSE manual:  30583.17 
## 
## MAE Sarima:  15977.78
## RMSE Sarima:  17837.32

Ambas métricas presentan una mejora significativa en los errores dentro del período de prueba frente al modelo manual, si hubo una mayor precisión para pronosticar los últimos 5 meses, el modelo es más confiable para pronosticar el próximo mes que los demás

##     Tiempo Pronostico
## 1 2024.583   209931.6
## 2 2024.667   211163.5
## 3 2024.750   195930.7
## 4 2024.833   138204.6
## 5 2024.917   180347.1
## 6 2025.000   164670.1

Pronóstico de la producción de azúcar según el modelo SARIMA para enero de 2025:

## [1] "Pronóstico para enero 2025: 2025 = 164670.097228887"

Conclusión

El modelo que mejor desempeño tiene es el modelo Arima automático con ajuste por estacionalidad, es decir, el modelo SARIMA (3,0,2) (1,1,1). Este logró capturar con precisión la dinámica de la serie en los últimos cinco meses, con un MAPE del 12% y un error promedio cercano a las 16.000 toneladas. El pronóstico para enero de 2025 anticipa una desaceleración en la producción, estimada en 164.670 toneladas, lo cual es coherente con el análisis previo de las variables relacionadas, que mostraba que debido a las correlaciones de las variables (exportaciones y TRM), y su tendencia ajustada por estacionalidad, la producción presentaba signos de disminuir a corto plazo.

Según los datos reportados por Asocaña, la producción real de azúcar en enero de 2025 fue de 170.559 toneladas. Esto confirma la tendencia descendente pronosticada y demuestra que el modelo ofreció una estimación cercana y confiable frente al valor observado.

Este tipo de pronósticos puede ser de gran utilidad para Incauca, ya que le permite anticiparse a caídas en la producción y planificar con mayor precisión sus operaciones, inventarios y estrategias comerciales. Además, fortalece la toma de decisiones basada en datos, optimizando la asignación de recursos en momentos de alta incertidumbre.