Este informe analiza el comportamiento del sector agrícola colombiano, enfocándose en la industria azucarera, una actividad clave en regiones como el Valle del Cauca. Para ello, se usa como ejemplo la empresa ficticia Ingenio Azucarero del Valle S.A.S., que depende directamente de la producción de caña, su procesamiento y las condiciones del mercado exterior.
Se seleccionaron tres variables mensuales entre enero de 2012 y diciembre de 2024 para estudiar la dinámica del sector:
Estas variables permiten entender la operación, el desempeño comercial y la relación entre producción e internacionalización del sector.
Cargar base de datos
El análisis se realizó mediante herramientas estadísticas de series temporales, usando principalmente tres enfoques:
Descomposición STL (Seasonal-Trend-Loess)
Se usó para dividir cada serie en tres componentes:
Tasa de crecimiento anual
Se calculó la tasa de crecimiento año a año, comparando la serie
original con su componente de tendencia. Esto ayuda a detectar periodos
de aceleración, desaceleración o crisis.
Modelo SARIMA
Se aplicó un modelo ARIMA con estacionalidad (SARIMA) para hacer
pronósticos sobre la producción de azúcar. Este modelo fue seleccionado
automáticamente con base en criterios estadísticos y por su buen ajuste
visual y técnico.
PASO INDISPENSABLE: Declarar la (s) variable (s) como serie (s) temporal (es):
Producción de Azúcar
Molienda de Caña de Azúcar
Exportaciones de azúcares y confitería
Gráfico inicial de la Producción de Azúcar
Esta serie evidencia que el sector azucarero opera bajo una estructura cíclica, donde los meses de mayor y menor producción tienden a repetirse cada año.
Los cambios abruptos (como los observados en 2020) deben ser investigados a fondo, pues pueden tener impactos significativos en la planeación financiera.
Extracción señales Producción de Azúcar
La serie muestra una fuerte estacionalidad, con picos regulares cada año. La tendencia tiene tres fases claras: crecimiento (2012–2015), estabilidad (2016–2020) y ligera caída hasta 2023, con recuperación en 2024.
Extracción señales Molienda de caña de azúcar
También presenta una marcada estacionalidad anual. La tendencia muestra crecimiento al inicio, estabilidad posterior y repunte en 2024. La fuerte similitud con la producción confirma la relación directa entre ambas variables.
Extracción señales Exportaciones de azúcares y confiteria
Hay alta volatilidad en la serie original, con menos estacionalidad visible. La tendencia muestra una caída sostenida hasta 2018, seguida de una recuperación clara desde 2019. La menor regularidad implica que factores externos como comercio internacional influyen más que ciclos agrícolas.
Después de la descomposición temporal de cada variable, se extrae la variable ajustada por estacionalidad para graficarla junto con la serie original:
Se crea la variable1 ajustada por estacionalidad
Se crea la variable2 ajustada por estacionalidad
Se crea la variable3 ajustada por estacionalidad
Ahora si se puede graficar las series originales versus la ajustada por estacionalidad
Gráfico serie original VS ajustada Producción de Azúcar
La serie ajustada permite observar claramente la evolución estructural, sin el “ruido” estacional. Se observa una leve caída reciente, pero con recuperación hacia 2024.
Gráfico serie original VS ajustada Molienda de caña de azúcar
La serie ajustada revela que, aunque hay estacionalidad, la molienda se mantiene relativamente constante con una reciente mejora.
Gráfico serie original VS ajustada Exportaciones de azúcares y confiteria
Hay mucha más irregularidad; la estacionalidad no es tan fuerte. La serie ajustada permite ver una recuperación estructural reciente en exportaciones.
Ahora graficamos serie original vs tendencia
Tendencia Producción de Azúcar
La tendencia muestra una curva clara de crecimiento, estancamiento y luego repunte reciente. Ideal para identificar ciclos de expansión o ajuste productivo.
Tendencia Molienda de caña de azúcar
Similar a producción, con una recuperación clara hacia el final. Permite validar que la capacidad operativa sigue el ritmo productivo.
Tendencia Exportaciones de azúcares y confiteria
La tendencia refleja una importante recuperación desde 2019 tras varios años de caída. Es crucial para analizar estrategia de comercio exterior.
Al separar las series en tendencia y estacionalidad, se hizo evidente que:
La estacionalidad explica una gran parte del comportamiento de las tres variables.
Analizar la serie ajustada por estacionalidad permite ver con mayor claridad el comportamiento real del sector (ya que se elimina la parte que se repite cada año).
Tasa de crecimiento de la serie de tendencia y original para la Producción de Azúcar
*Gráfico variable original y tendencia Producción de Azúcar: tasa de crecimiento anual**
En general, tasa cercana a 0% hasta 2022. Desde 2023, la tendencia muestra crecimiento sostenido, lo cual es alentador para el sector.
Tasa de crecimiento de la serie original vs tendencia: Molienda de caña de azúcar
Comportamiento muy similar a la producción, con leve crecimiento estructural a partir de 2023.
Tasa de crecimiento de la serie original vs tendencia: Exportaciones de azúcares y confiteria
Mucho más volátil, con picos y caídas abruptas. La tendencia suavizada muestra mejora progresiva hasta 2023, y una caída leve posterior.
En general, la tasa de crecimiento es positiva en los primeros años, pero muestra caídas en momentos específicos, lo que puede reflejar impactos económicos o climáticos.
La producción y molienda tienen tasas muy similares, reafirmando su relación directa.
Las exportaciones muestran más altibajos, indicando mayor exposición a condiciones externas.
División en conjunto de entrenamiento y prueba para la Producción de Azúcar que es la elegida para pronosticar
Esta variable fue seleccionada para el pronóstico por ser la más representativa del sector.
El código siguiente divide una serie temporal (variable1_ts) en dos subconjuntos:
Conjunto de entrenamiento (train): Datos desde enero de 2012 hasta septiembre de 2024. Conjunto de prueba (test): Datos desde octubre de 2024 hasta diciembre de 2024.
Esto se hace para evaluar el desempeño de modelos de predicción en datos no vistos.
El modelo que se presenta a continuación es sin tener en cuenta el factor estacional.
Identificación automática del modelo ARIMA
## Series: train_ts
## ARIMA(2,0,1) with non-zero mean
##
## Coefficients:
## ar1 ar2 ma1 mean
## 1.0236 -0.4696 -0.4409 180678.547
## s.e. 0.1952 0.0973 0.2155 3609.854
##
## sigma^2 = 1.291e+09: log likelihood = -1820.2
## AIC=3650.4 AICc=3650.81 BIC=3665.55
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set 44.19856 35461.41 28352.91 -13.45831 27.26131 1.407163 -0.01636981
Estimación del modelo identificado automatico y validación de Significancia de coeficientes
##
## z test of coefficients:
##
## Estimate Std. Error z value Pr(>|z|)
## ar1 1.0236e+00 1.9516e-01 5.2451 1.562e-07 ***
## ar2 -4.6957e-01 9.7281e-02 -4.8270 1.386e-06 ***
## ma1 -4.4094e-01 2.1554e-01 -2.0457 0.04078 *
## intercept 1.8068e+05 3.6099e+03 50.0515 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Series: train_ts
## ARIMA(2,0,1) with non-zero mean
##
## Coefficients:
## ar1 ar2 ma1 mean
## 1.0236 -0.4696 -0.4409 180678.547
## s.e. 0.1952 0.0973 0.2155 3609.854
##
## sigma^2 = 1.291e+09: log likelihood = -1820.2
## AIC=3650.4 AICc=3650.81 BIC=3665.55
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set 44.19856 35461.41 28352.91 -13.45831 27.26131 1.407163 -0.01636981
Validación de residuales o errores del modelo
##
## Ljung-Box test
##
## data: Residuals from ARIMA(2,0,1) with non-zero mean
## Q* = 173.02, df = 21, p-value < 2.2e-16
##
## Model df: 3. Total lags used: 24
Pronóstico modelo ARIMA automático dentro de muestra o en el set de prueba
Interpretación modelo automatico (2,0,1):El modelo muestra una caída continua en la producción, pero en los datos reales se observa una recuperación. Esto indica que no logra captar el comportamiento estacional de la serie. Por esta razón, se optó por utilizar el modelo SARIMA, que sí considera la estacionalidad y mejora la precisión del pronóstico.
Pronóstico automático dentro del set de prueba como tabla
## Tiempo Observado Pronosticado
## 1 2024.750 211029.5 203222.3
## 2 2024.833 169151.2 182293.7
## 3 2024.917 189902.3 171746.0
Ahora pronosticamos con el modelo automatico fuera del periodo de análisis, es decir enero 2025
Es decir, le sumamos al periodo de prueba una observación más. Es decir, se estan pronosticando 4 observaciones o trimestres.
## Tiempo Pronostico
## 1 2024.750 203222.3
## 2 2024.833 182293.7
## 3 2024.917 171746.0
## 4 2025.000 170776.3
## [1] "Pronóstico para enero 2025: 2025 = 170776.301662718"
Este modelo podria ser una solución o mejora al modelo arima tradicional ya que recoge el efecto estacional de las variables, es recomendable por tanto para datos que si tienen un componente estacional fuerte.
El modelo ajustado en este ejemplo es un SARIMA(3,0,2)(1,1,1)[12], lo que significa:
(3,0,2): Parte ARIMA no estacional: 2 términos autorregresivos (AR). 0 diferenciación (d), lo que indica que la serie no fue diferenciada. 1 término de media móvil (MA).
(1,1,1)[12]: Parte estacional con periodicidad 12 (mensual si los datos son mensuales): 1 término autorregresivo estacional (SAR). 0 diferenciaciones estacionales. 0 términos de media móvil estacionales (SMA).
El modelo SARIMA(3,0,2)(1,1,1)[12] sugiere que:
Identificación automática del modelo SARIMA
## Series: train_ts
## ARIMA(3,0,2)(1,1,1)[12] with drift
##
## Coefficients:
## ar1 ar2 ar3 ma1 ma2 sar1 sma1 drift
## 1.2492 -0.5393 0.0609 -0.9689 0.5619 -0.1805 -0.8113 -120.5336
## s.e. 0.3221 0.2869 0.1633 0.3016 0.1710 0.1060 0.1057 84.7997
##
## sigma^2 = 337485123: log likelihood = -1588.89
## AIC=3195.79 AICc=3197.16 BIC=3222.32
A continuación, se crea el objeto darima para luego poder graficar los valores reales y observados:
## Series: train_ts
## ARIMA(3,0,2)(1,1,1)[12]
##
## Coefficients:
## ar1 ar2 ar3 ma1 ma2 sar1 sma1
## 1.1998 -0.4946 0.0816 -0.9148 0.5334 -0.1885 -0.7787
## s.e. 0.3047 0.2977 0.1655 0.2868 0.1883 0.1060 0.0962
##
## sigma^2 = 342601106: log likelihood = -1589.72
## AIC=3195.45 AICc=3196.54 BIC=3219.04
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set -649.8222 17322.12 12184.05 -6.115283 12.32966 0.604698
## ACF1
## Training set 0.004093373
Validación de residuales del modelo automatico SARIMA
##
## Ljung-Box test
##
## data: Residuals from ARIMA(3,0,2)(1,1,1)[12]
## Q* = 26.594, df = 17, p-value = 0.06429
##
## Model df: 7. Total lags used: 24
Al revisar los errores del modelo, vemos que están distribuidos de forma equilibrada alrededor de cero. Lo cual nos indica que el modelo funciona bien y que los resultados que genera son confiables.
Pronóstico con el modelo SARIMA dentro del set de prueba-Gráfico líneas
El modelo sí anticipa correctamente el comportamiento en “V” de la producción al cierre de 2024. Las diferencias entre lo estimado y lo real son pequeñas, lo que valida la elección del modelo SARIMA.
El modelo funcionó correctamente. Al comparar los valores reales y los estimados en el conjunto de prueba, las dos líneas del gráfico están muy cerca, lo que indica que el modelo sí logró capturar bien el comportamiento de la producción.
También se revisaron los errores del modelo y no mostraron patrones raros, lo cual es buena señal.
Pronóstico del modelo automático SARIMA en el set de prueba-Tabla
## Tiempo Observado Pronosticado
## 1 2024.750 211029.5 201666.3
## 2 2024.833 169151.2 144767.3
## 3 2024.917 189902.3 184203.1
El modelo proyecta que en enero de 2025, la producción de azúcar estará dentro del rango normal para ese mes, siguiendo el mismo patrón estacional que se ha observado en años anteriores.
## Tiempo Pronostico
## 1 2024.750 201666.3
## 2 2024.833 144767.3
## 3 2024.917 184203.1
## 4 2025.000 166162.7
## [1] "Pronóstico para enero 2025: 2025 = 166162.742652186"
Con base en el análisis, estas son algunas acciones que podría tomar la empresa Ingenio Azucarero del Valle S.A.S.:
Planificación de recursos
Usar el pronóstico para organizar la producción y preparar el personal y
maquinaria antes de los picos de actividad.
Aprovechar el ciclo exportador
Planear las exportaciones en los meses donde hay más producción y
mejores condiciones de mercado.
Prepararse ante cambios económicos
La tasa de crecimiento permite detectar señales de alerta (como
desaceleraciones). La empresa puede anticiparse y tomar decisiones
preventivas.
Incluir pronósticos en la gestión
Los modelos como SARIMA deberían integrarse a los procesos de planeación
financiera, logística y comercial de forma continua.
La industria azucarera colombiana tiene una dinámica estacional muy clara, con relaciones estrechas entre producción, molienda y exportaciones. El análisis con STL, tasa de crecimiento y modelo SARIMA permite entender mejor cómo funciona el sector y anticipar comportamientos futuros. Esto ofrece ventajas clave para una empresa que quiera planear de forma estratégica y reducir incertidumbre.