Este informe presenta un análisis predictivo enfocado en la producción de café en Colombia. Para este análisis se tomaron las series mensuales de producción de café (PNCAFE), precio interno base de compra del café colombiano (PICAFE) y exportaciones de café (XCAF) para el periodo enero de 2012 a diciembre de 2025. A partir de estas series se identificaron tres señales principales: tendencia, estacionalidad y componente irregular.
La elección de PNCAFE, PICAFE y XCAF permite estudiar el sector cafetero de manera integral. PNCAFE es la variable principal, porque mide directamente la producción y es el centro del ejercicio predictivo. PICAFE es relevante porque refleja las condiciones económicas que enfrentan los productores y funciona como una señal del mercado interno. XCAF, por su parte, permite observar la dinámica comercial del sector en el frente externo. Analizadas en conjunto, estas variables ayudan a entender mejor el comportamiento histórico del café en Colombia y aportan una base más sólida para interpretar sus tendencias y proyectar su evolución.
Gráfico inicial de la produccion de cafe en niveles - Original
Extracción señales de la produccion de cafe
PNCAFE (producción de café): presenta una tendencia positiva de largo plazo. Sin embargo, su comportamiento no es lineal: sube con fuerza al inicio, luego se estabiliza, cae entre 2021 y 2023 y finalmente se recupera, aunque en 2025 muestra un leve cambio de tendencia. Esto sugiere que la oferta cafetera ha mejorado frente a años previos, pero todavía no entra en una senda de crecimiento sostenido y estable.
Tiene una estacionalidad muy marcada. Sus picos y valles se repiten de forma bastante estable cada año. Esto significa que buena parte de sus subidas y bajadas mensuales responden al ciclo propio del café y no necesariamente a una mejora o deterioro del sector.
En cuanto al componente irregular, aunque hay meses atípicos, gran parte de su comportamiento sí se explica por su tendencia y por su estacionalidad.
Extracción señales del precio del cafe
PICAFE (precio interno): es la variable con la señal más fuerte. Su tendencia crece de manera sostenida, mostrando un impulso mucho más claro que la producción.
Tiene una estacionalidad moderada. El patrón se repite claramente cada año, hay meses que empujan el precio hacia arriba y otros hacia abajo, pero aun así el precio también está muy influido por la tendencia y por choques de mercado.
PICAFE tiene más componente irregular, lo que sugiere que el precio es más sensible a choques del mercado.
Extracción señales de la exportacion de cafe
XCAF (exportaciones): también tiene una tendencia positiva importante, especialmente fuerte al final del periodo.
Presenta una estacionalidad alta, ya que sus picos y valles se repiten de manera clara a lo largo del tiempo; sin embargo, este componente no parece ser tan dominante como en la producción de café, donde el patrón estacional es aún más fuerte.
También presenta bastante irregularidad, probablemente por factores externos y comerciales.
Gráfico serie original VS ajustada - produccion
Gráfico serie original VS ajustada - Precio
Gráfico serie original VS ajustada Variable 3
Ahora graficamos serie original vs tendencia
Tendencia produccion de cafe
Tendencia Variable 2
Tendencia Variable 3
Ahora calculamos la tasa de crecimiento de la serie original vs tendencia
Gráfico variable original y tendencia - produccion: tasa de crecimiento anual
La lectura general es que el sector cafetero colombiano muestra una dinámica favorable, aunque no del todo uniforme. Tanto el precio interno del café como las exportaciones reflejan una señal claramente positiva, con una tendencia creciente y un mayor impulso en la parte reciente del periodo, lo que sugiere un entorno comercial sólido. La producción de café también mantiene una tendencia positiva de largo plazo, pero su respuesta es más lenta y está mucho más marcada por la estacionalidad, por lo que sus variaciones mensuales no deben interpretarse de forma aislada como señales de mejora o deterioro.
Vistas en conjunto, las tres variables confirman que el sector se ha venido fortaleciendo, pero no todas avanzan al mismo ritmo. PICAFE y XCAF son las que muestran un comportamiento más alineado y una recuperación más clara, mientras que PNCAFE acompaña esa tendencia de fondo, aunque con mayor rezago. Esto sugiere que una mejora en precios y exportaciones no se traduce automáticamente en un aumento inmediato de la producción, ya que la oferta responde de manera más gradual y depende del ciclo propio del sector.
En ese sentido, la señal global puede considerarse positiva, pero mixta. Positiva porque no estamos viendo un deterioro general del sector, al contrario, hay crecimiento de fondo. Y mixta porque ese crecimiento no se refleja con la misma intensidad entre ellas. La data histórica deja una idea importante, el sector puede verse fuerte desde lo comercial antes de que esa fortaleza se refleje plenamente en la producción.
División en conjunto de entrenamiento y prueba para la produccion de cafe que es la variable elegida para pronosticar
Identificación automática del modelo ARIMA
## Series: train_ts
## ARIMA(0,1,2)
##
## Coefficients:
## ma1 ma2
## -0.3025 -0.4979
## s.e. 0.0786 0.0773
##
## sigma^2 = 29051: log likelihood = -996.22
## AIC=1998.44 AICc=1998.6 BIC=2007.51
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set 14.79646 168.763 133.6028 -0.4502639 12.9936 0.797852 -0.02653252
Estimación del modelo identificado automatico y validación de Significancia de coeficientes
##
## z test of coefficients:
##
## Estimate Std. Error z value Pr(>|z|)
## ma1 -0.302466 0.078576 -3.8494 0.0001184 ***
## ma2 -0.497857 0.077269 -6.4432 1.17e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Series: train_ts
## ARIMA(0,1,2)
##
## Coefficients:
## ma1 ma2
## -0.3025 -0.4979
## s.e. 0.0786 0.0773
##
## sigma^2 = 29051: log likelihood = -996.22
## AIC=1998.44 AICc=1998.6 BIC=2007.51
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set 14.79646 168.763 133.6028 -0.4502639 12.9936 0.797852 -0.02653252
Validación de residuales o errores del modelo
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,1,2)
## Q* = 92.19, df = 22, p-value = 1.449e-10
##
## Model df: 2. Total lags used: 24
Pronóstico modelo ARIMA automático dentro de muestra o en el set de prueba
Pronóstico automático dentro del set de prueba como tabla
## Tiempo Observado Pronosticado
## 1 2024.750 1339.1550 1069.374
## 2 2024.833 1761.4095 1031.733
## 3 2024.917 1798.2306 1031.733
## 4 2025.000 1355.7672 1031.733
## 5 2025.083 1361.3928 1031.733
## 6 2025.167 1063.9384 1031.733
## 7 2025.250 702.8167 1031.733
## 8 2025.333 818.6413 1031.733
## 9 2025.417 909.1030 1031.733
## 10 2025.500 1373.3560 1031.733
## 11 2025.583 1242.7417 1031.733
## 12 2025.667 1142.4126 1031.733
## 13 2025.750 1208.0865 1031.733
## 14 2025.833 1266.0696 1031.733
## 15 2025.917 1233.4232 1031.733
Ahora pronosticamos con el modelo automatico fuera del periodo de análisis, es decir enero 2026
Es decir, le sumamos al periodo de prueb auna observación más. Es decir, se estan pronosticando 4 observaciones o trimestres.
## Tiempo Pronostico
## 1 2024.750 1069.374
## 2 2024.833 1031.733
## 3 2024.917 1031.733
## 4 2025.000 1031.733
## 5 2025.083 1031.733
## 6 2025.167 1031.733
## 7 2025.250 1031.733
## 8 2025.333 1031.733
## 9 2025.417 1031.733
## 10 2025.500 1031.733
## 11 2025.583 1031.733
## 12 2025.667 1031.733
## 13 2025.750 1031.733
## 14 2025.833 1031.733
## 15 2025.917 1031.733
## 16 2026.000 1031.733
## [1] "Pronostico para enero 2026: 2026 = 1031.73275916496"
El modelo ARIMA no fue suficiente para esta serie, porque la producción de café tiene una estacionalidad muy marcada y el modelo no logró recogerla bien. Aunque siguió de manera general la dirección de la serie, terminó generando pronósticos demasiado suavizados, subestimando los picos y sobreestimando los meses bajos. Para la empresa, esto significa que no era una base confiable para planear operación, inventarios o compromisos comerciales, ya que podía llevar a decisiones desalineadas con la realidad. El principal riesgo era prepararse mal frente a meses de alta o baja producción. Más que servir como modelo final, el ARIMA fue útil para mostrar que la serie necesitaba un enfoque estacional y que no bastaba con proyectarla solo a partir de su comportamiento pasado inmediato.
Este modelo podria ser una solución o mejora al modelo arima tradicional ya que recoge el efecto estacional de las variables, es recomendable por tanto para datos que si tienen un componente estacional fuerte.
El modelo ajustado en este ejemplo es un SARIMA(0,1,1)(0,0,2)[12], lo que significa:
(0,1,1): Parte ARIMA no estacional: 0 términos autorregresivos (AR). 1 diferenciación (d), lo que indica que la serie fue diferenciada una vez para hacerla estacionaria. 1 término de media móvil (MA).
(0,0,2)[12]: Parte estacional con periodicidad 12 (mensual si los datos son mensuales): 0 término autorregresivo estacional (SAR). 0 diferenciaciones estacionales. 2 términos de media móvil estacionales (SMA).
A continuación, se crea el objeto darima para luego poder graficar los valores reales y observados:
## Series: train_ts
## ARIMA(0,1,1)(0,0,2)[12]
##
## Coefficients:
## ma1 sma1 sma2
## -0.7806 0.4151 0.2751
## s.e. 0.0736 0.0866 0.0667
##
## sigma^2 = 27046: log likelihood = -991.83
## AIC=1991.66 AICc=1991.93 BIC=2003.76
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set 11.08051 162.2922 127.6937 -0.8575352 12.54207 0.7625637 0.2768606
Validación de residuales del modelo automatico SARIMA
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,1,1)(0,0,2)[12]
## Q* = 50.544, df = 21, p-value = 0.0003063
##
## Model df: 3. Total lags used: 24
Pronóstico con el modelo SARIMA dentro del set de prueba-Gráfico líneas
Pronóstico del modelo automático SARIMA en el set de prueba - Tabla
## Tiempo Observado Pronosticado
## 1 2024.750 1339.1550 1184.6571
## 2 2024.833 1761.4095 1246.8854
## 3 2024.917 1798.2306 1187.5596
## 4 2025.000 1355.7672 1106.4340
## 5 2025.083 1361.3928 1117.9802
## 6 2025.167 1063.9384 1052.6846
## 7 2025.250 702.8167 988.4413
## 8 2025.333 818.6413 1132.0831
## 9 2025.417 909.1030 1198.8676
## 10 2025.500 1373.3560 1197.6842
## 11 2025.583 1242.7417 1130.5762
## 12 2025.667 1142.4126 1163.9376
## 13 2025.750 1208.0865 1223.7196
## 14 2025.833 1266.0696 1245.5769
## 15 2025.917 1233.4232 1242.9915
Pronóstico del modelo automático SARIMA fuera de muestra, es decir, en enero 2026
Es decir, le sumamos al periodo de prueba una observación más. Es decir, se estan pronosticando 4 observaciones o meses.
## Tiempo Pronostico
## 1 2024.750 1184.6571
## 2 2024.833 1246.8854
## 3 2024.917 1187.5596
## 4 2025.000 1106.4340
## 5 2025.083 1117.9802
## 6 2025.167 1052.6846
## 7 2025.250 988.4413
## 8 2025.333 1132.0831
## 9 2025.417 1198.8676
## 10 2025.500 1197.6842
## 11 2025.583 1130.5762
## 12 2025.667 1163.9376
## 13 2025.750 1223.7196
## 14 2025.833 1245.5769
## 15 2025.917 1242.9915
## 16 2026.000 1174.3997
## [1] "Pronostico para enero 2025: 2026 = 1174.39966933846"
El modelo SARIMA resultó más adecuado porque sí incorporó la estacionalidad propia de la producción de café. Su desempeño fue mejor que el del ARIMA: logró seguir la trayectoria general de la serie y captó parte importante del patrón estacional, aunque todavía tuvo dificultades para reflejar con precisión los extremos. Para la empresa, este pronóstico sí puede servir como una guía de planeación, especialmente para organizar inventarios, logística, capacidad operativa y flujo de caja. La decisión más razonable sería usarlo como escenario base, pero sin tomarlo como una cifra exacta, sino como una referencia flexible. El principal riesgo sigue siendo confiar demasiado en meses atípicos, pero la gran oportunidad es anticiparse mejor al ciclo del negocio y prepararse con más orden para el corto plazo.
Pensando en el mes proyectado, la empresa debía prepararse para una caída de la producción frente a los niveles excepcionalmente altos del cierre de 2024. Tanto ARIMA como SARIMA apuntaban a un enero de 2025 alrededor de 1.100, muy por debajo de noviembre y diciembre, por lo que no era recomendable planear operación, compras e inventarios como si el pico fuera a continuar. La decisión más acertada era entrar al mes con una estrategia prudente: menor acumulación de inventario, compromisos comerciales más selectivos, control de caja y foco en rentabilidad más que en volumen. Dado que el precio interno y las exportaciones seguían fuertes, la oportunidad no estaba en crecer agresivamente, sino en aprovechar mejor el margen en un mes con oferta más moderada.
En términos generales, el sector cafetero colombiano muestra una señal favorable. Las variables de precio interno y exportaciones indican un entorno comercial más fuerte, mientras que la producción mantiene una tendencia positiva, aunque con una respuesta más lenta y marcada por la estacionalidad. Esto sugiere que el sector no está en una fase de debilidad, pero sí en un escenario donde el impulso comercial va por delante de la oferta productiva.
Hacia adelante, la tendencia más probable es de continuidad en esa fortaleza, aunque con variaciones de corto plazo asociadas al ciclo productivo del café. Por eso, la empresa debería reaccionar con una planeación flexible: usar el pronóstico como guía, anticiparse a los meses de mayor y menor producción, y monitorear de cerca el precio interno y las exportaciones, ya que estas variables ofrecen señales clave para la toma de decisiones comerciales, operativas y financieras.