Introduccion

Este informe presenta un análisis predictivo enfocado en la producción de café en Colombia. Para este análisis se tomaron las series mensuales de producción de café (PNCAFE), precio interno base de compra del café colombiano (PICAFE) y exportaciones de café (XCAF) para el periodo enero de 2012 a diciembre de 2025. A partir de estas series se identificaron tres señales principales: tendencia, estacionalidad y componente irregular.

La elección de PNCAFE, PICAFE y XCAF permite estudiar el sector cafetero de manera integral. PNCAFE es la variable principal, porque mide directamente la producción y es el centro del ejercicio predictivo. PICAFE es relevante porque refleja las condiciones económicas que enfrentan los productores y funciona como una señal del mercado interno. XCAF, por su parte, permite observar la dinámica comercial del sector en el frente externo. Analizadas en conjunto, estas variables ayudan a entender mejor el comportamiento histórico del café en Colombia y aportan una base más sólida para interpretar sus tendencias y proyectar su evolución.

Extracción de señales

Gráfico inicial de la produccion de cafe en niveles - Original

Extracción señales de la produccion de cafe

PNCAFE (producción de café): presenta una tendencia positiva de largo plazo. Sin embargo, su comportamiento no es lineal: sube con fuerza al inicio, luego se estabiliza, cae entre 2021 y 2023 y finalmente se recupera, aunque en 2025 muestra un leve cambio de tendencia. Esto sugiere que la oferta cafetera ha mejorado frente a años previos, pero todavía no entra en una senda de crecimiento sostenido y estable.

Tiene una estacionalidad muy marcada. Sus picos y valles se repiten de forma bastante estable cada año. Esto significa que buena parte de sus subidas y bajadas mensuales responden al ciclo propio del café y no necesariamente a una mejora o deterioro del sector.

En cuanto al componente irregular, aunque hay meses atípicos, gran parte de su comportamiento sí se explica por su tendencia y por su estacionalidad.

Extracción señales del precio del cafe

PICAFE (precio interno): es la variable con la señal más fuerte. Su tendencia crece de manera sostenida, mostrando un impulso mucho más claro que la producción.

Tiene una estacionalidad moderada. El patrón se repite claramente cada año, hay meses que empujan el precio hacia arriba y otros hacia abajo, pero aun así el precio también está muy influido por la tendencia y por choques de mercado.

PICAFE tiene más componente irregular, lo que sugiere que el precio es más sensible a choques del mercado.

Extracción señales de la exportacion de cafe

XCAF (exportaciones): también tiene una tendencia positiva importante, especialmente fuerte al final del periodo.

Presenta una estacionalidad alta, ya que sus picos y valles se repiten de manera clara a lo largo del tiempo; sin embargo, este componente no parece ser tan dominante como en la producción de café, donde el patrón estacional es aún más fuerte.

También presenta bastante irregularidad, probablemente por factores externos y comerciales.

Gráfico serie original VS ajustada - produccion

Gráfico serie original VS ajustada - Precio

Gráfico serie original VS ajustada Variable 3

Ahora graficamos serie original vs tendencia

Tendencia produccion de cafe

Tendencia Variable 2

Tendencia Variable 3

Ahora calculamos la tasa de crecimiento de la serie original vs tendencia

Gráfico variable original y tendencia - produccion: tasa de crecimiento anual

La lectura general es que el sector cafetero colombiano muestra una dinámica favorable, aunque no del todo uniforme. Tanto el precio interno del café como las exportaciones reflejan una señal claramente positiva, con una tendencia creciente y un mayor impulso en la parte reciente del periodo, lo que sugiere un entorno comercial sólido. La producción de café también mantiene una tendencia positiva de largo plazo, pero su respuesta es más lenta y está mucho más marcada por la estacionalidad, por lo que sus variaciones mensuales no deben interpretarse de forma aislada como señales de mejora o deterioro.

Vistas en conjunto, las tres variables confirman que el sector se ha venido fortaleciendo, pero no todas avanzan al mismo ritmo. PICAFE y XCAF son las que muestran un comportamiento más alineado y una recuperación más clara, mientras que PNCAFE acompaña esa tendencia de fondo, aunque con mayor rezago. Esto sugiere que una mejora en precios y exportaciones no se traduce automáticamente en un aumento inmediato de la producción, ya que la oferta responde de manera más gradual y depende del ciclo propio del sector.

En ese sentido, la señal global puede considerarse positiva, pero mixta. Positiva porque no estamos viendo un deterioro general del sector, al contrario, hay crecimiento de fondo. Y mixta porque ese crecimiento no se refleja con la misma intensidad entre ellas. La data histórica deja una idea importante, el sector puede verse fuerte desde lo comercial antes de que esa fortaleza se refleje plenamente en la producción.

Modelo ARIMA

División en conjunto de entrenamiento y prueba para la produccion de cafe que es la variable elegida para pronosticar

Modelo ARIMA automático normal (sin tener en cuenta el factor estacional)

Identificación automática del modelo ARIMA

## Series: train_ts 
## ARIMA(0,1,2) 
## 
## Coefficients:
##           ma1      ma2
##       -0.3025  -0.4979
## s.e.   0.0786   0.0773
## 
## sigma^2 = 29051:  log likelihood = -996.22
## AIC=1998.44   AICc=1998.6   BIC=2007.51
## 
## Training set error measures:
##                    ME    RMSE      MAE        MPE    MAPE     MASE        ACF1
## Training set 14.79646 168.763 133.6028 -0.4502639 12.9936 0.797852 -0.02653252

Estimación del modelo identificado automatico y validación de Significancia de coeficientes

## 
## z test of coefficients:
## 
##      Estimate Std. Error z value  Pr(>|z|)    
## ma1 -0.302466   0.078576 -3.8494 0.0001184 ***
## ma2 -0.497857   0.077269 -6.4432  1.17e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## Series: train_ts 
## ARIMA(0,1,2) 
## 
## Coefficients:
##           ma1      ma2
##       -0.3025  -0.4979
## s.e.   0.0786   0.0773
## 
## sigma^2 = 29051:  log likelihood = -996.22
## AIC=1998.44   AICc=1998.6   BIC=2007.51
## 
## Training set error measures:
##                    ME    RMSE      MAE        MPE    MAPE     MASE        ACF1
## Training set 14.79646 168.763 133.6028 -0.4502639 12.9936 0.797852 -0.02653252

Validación de residuales o errores del modelo

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,1,2)
## Q* = 92.19, df = 22, p-value = 1.449e-10
## 
## Model df: 2.   Total lags used: 24

Pronóstico modelo ARIMA automático dentro de muestra o en el set de prueba

Pronóstico automático dentro del set de prueba como tabla

##      Tiempo Observado Pronosticado
## 1  2024.750 1339.1550     1069.374
## 2  2024.833 1761.4095     1031.733
## 3  2024.917 1798.2306     1031.733
## 4  2025.000 1355.7672     1031.733
## 5  2025.083 1361.3928     1031.733
## 6  2025.167 1063.9384     1031.733
## 7  2025.250  702.8167     1031.733
## 8  2025.333  818.6413     1031.733
## 9  2025.417  909.1030     1031.733
## 10 2025.500 1373.3560     1031.733
## 11 2025.583 1242.7417     1031.733
## 12 2025.667 1142.4126     1031.733
## 13 2025.750 1208.0865     1031.733
## 14 2025.833 1266.0696     1031.733
## 15 2025.917 1233.4232     1031.733

Ahora pronosticamos con el modelo automatico fuera del periodo de análisis, es decir enero 2026

Es decir, le sumamos al periodo de prueb auna observación más. Es decir, se estan pronosticando 4 observaciones o trimestres.

##      Tiempo Pronostico
## 1  2024.750   1069.374
## 2  2024.833   1031.733
## 3  2024.917   1031.733
## 4  2025.000   1031.733
## 5  2025.083   1031.733
## 6  2025.167   1031.733
## 7  2025.250   1031.733
## 8  2025.333   1031.733
## 9  2025.417   1031.733
## 10 2025.500   1031.733
## 11 2025.583   1031.733
## 12 2025.667   1031.733
## 13 2025.750   1031.733
## 14 2025.833   1031.733
## 15 2025.917   1031.733
## 16 2026.000   1031.733
## [1] "Pronostico para enero 2026: 2026 = 1031.73275916496"

El modelo ARIMA no fue suficiente para esta serie, porque la producción de café tiene una estacionalidad muy marcada y el modelo no logró recogerla bien. Aunque siguió de manera general la dirección de la serie, terminó generando pronósticos demasiado suavizados, subestimando los picos y sobreestimando los meses bajos. Para la empresa, esto significa que no era una base confiable para planear operación, inventarios o compromisos comerciales, ya que podía llevar a decisiones desalineadas con la realidad. El principal riesgo era prepararse mal frente a meses de alta o baja producción. Más que servir como modelo final, el ARIMA fue útil para mostrar que la serie necesitaba un enfoque estacional y que no bastaba con proyectarla solo a partir de su comportamiento pasado inmediato.

Modelo SARIMA automático

Este modelo podria ser una solución o mejora al modelo arima tradicional ya que recoge el efecto estacional de las variables, es recomendable por tanto para datos que si tienen un componente estacional fuerte.

El modelo ajustado en este ejemplo es un SARIMA(0,1,1)(0,0,2)[12], lo que significa:

(0,1,1): Parte ARIMA no estacional: 0 términos autorregresivos (AR). 1 diferenciación (d), lo que indica que la serie fue diferenciada una vez para hacerla estacionaria. 1 término de media móvil (MA).

(0,0,2)[12]: Parte estacional con periodicidad 12 (mensual si los datos son mensuales): 0 término autorregresivo estacional (SAR). 0 diferenciaciones estacionales. 2 términos de media móvil estacionales (SMA).

A continuación, se crea el objeto darima para luego poder graficar los valores reales y observados:

## Series: train_ts 
## ARIMA(0,1,1)(0,0,2)[12] 
## 
## Coefficients:
##           ma1    sma1    sma2
##       -0.7806  0.4151  0.2751
## s.e.   0.0736  0.0866  0.0667
## 
## sigma^2 = 27046:  log likelihood = -991.83
## AIC=1991.66   AICc=1991.93   BIC=2003.76
## 
## Training set error measures:
##                    ME     RMSE      MAE        MPE     MAPE      MASE      ACF1
## Training set 11.08051 162.2922 127.6937 -0.8575352 12.54207 0.7625637 0.2768606

Validación de residuales del modelo automatico SARIMA

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(0,1,1)(0,0,2)[12]
## Q* = 50.544, df = 21, p-value = 0.0003063
## 
## Model df: 3.   Total lags used: 24

Pronóstico con el modelo SARIMA dentro del set de prueba-Gráfico líneas

Pronóstico del modelo automático SARIMA en el set de prueba - Tabla

##      Tiempo Observado Pronosticado
## 1  2024.750 1339.1550    1184.6571
## 2  2024.833 1761.4095    1246.8854
## 3  2024.917 1798.2306    1187.5596
## 4  2025.000 1355.7672    1106.4340
## 5  2025.083 1361.3928    1117.9802
## 6  2025.167 1063.9384    1052.6846
## 7  2025.250  702.8167     988.4413
## 8  2025.333  818.6413    1132.0831
## 9  2025.417  909.1030    1198.8676
## 10 2025.500 1373.3560    1197.6842
## 11 2025.583 1242.7417    1130.5762
## 12 2025.667 1142.4126    1163.9376
## 13 2025.750 1208.0865    1223.7196
## 14 2025.833 1266.0696    1245.5769
## 15 2025.917 1233.4232    1242.9915

Pronóstico del modelo automático SARIMA fuera de muestra, es decir, en enero 2026

Es decir, le sumamos al periodo de prueba una observación más. Es decir, se estan pronosticando 4 observaciones o meses.

##      Tiempo Pronostico
## 1  2024.750  1184.6571
## 2  2024.833  1246.8854
## 3  2024.917  1187.5596
## 4  2025.000  1106.4340
## 5  2025.083  1117.9802
## 6  2025.167  1052.6846
## 7  2025.250   988.4413
## 8  2025.333  1132.0831
## 9  2025.417  1198.8676
## 10 2025.500  1197.6842
## 11 2025.583  1130.5762
## 12 2025.667  1163.9376
## 13 2025.750  1223.7196
## 14 2025.833  1245.5769
## 15 2025.917  1242.9915
## 16 2026.000  1174.3997
## [1] "Pronostico para enero 2025: 2026 = 1174.39966933846"

El modelo SARIMA resultó más adecuado porque sí incorporó la estacionalidad propia de la producción de café. Su desempeño fue mejor que el del ARIMA: logró seguir la trayectoria general de la serie y captó parte importante del patrón estacional, aunque todavía tuvo dificultades para reflejar con precisión los extremos. Para la empresa, este pronóstico sí puede servir como una guía de planeación, especialmente para organizar inventarios, logística, capacidad operativa y flujo de caja. La decisión más razonable sería usarlo como escenario base, pero sin tomarlo como una cifra exacta, sino como una referencia flexible. El principal riesgo sigue siendo confiar demasiado en meses atípicos, pero la gran oportunidad es anticiparse mejor al ciclo del negocio y prepararse con más orden para el corto plazo.

Recomendacion para la empresa

Pensando en el mes proyectado, la empresa debía prepararse para una caída de la producción frente a los niveles excepcionalmente altos del cierre de 2024. Tanto ARIMA como SARIMA apuntaban a un enero de 2025 alrededor de 1.100, muy por debajo de noviembre y diciembre, por lo que no era recomendable planear operación, compras e inventarios como si el pico fuera a continuar. La decisión más acertada era entrar al mes con una estrategia prudente: menor acumulación de inventario, compromisos comerciales más selectivos, control de caja y foco en rentabilidad más que en volumen. Dado que el precio interno y las exportaciones seguían fuertes, la oportunidad no estaba en crecer agresivamente, sino en aprovechar mejor el margen en un mes con oferta más moderada.

Conclusión:

En términos generales, el sector cafetero colombiano muestra una señal favorable. Las variables de precio interno y exportaciones indican un entorno comercial más fuerte, mientras que la producción mantiene una tendencia positiva, aunque con una respuesta más lenta y marcada por la estacionalidad. Esto sugiere que el sector no está en una fase de debilidad, pero sí en un escenario donde el impulso comercial va por delante de la oferta productiva.

Hacia adelante, la tendencia más probable es de continuidad en esa fortaleza, aunque con variaciones de corto plazo asociadas al ciclo productivo del café. Por eso, la empresa debería reaccionar con una planeación flexible: usar el pronóstico como guía, anticiparse a los meses de mayor y menor producción, y monitorear de cerca el precio interno y las exportaciones, ya que estas variables ofrecen señales clave para la toma de decisiones comerciales, operativas y financieras.