El cultivo de coco representa una importante fuente de ingresos y sustento económico en diversas regiones del país. Analizar su comportamiento productivo y su rendimiento a lo largo del tiempo permite identificar tendencias, variaciones estacionales y posibles factores que afectan su desempeño. En este informe se realiza un análisis de series de tiempo aplicando modelos ARIMA, con el propósito de describir y predecir el comportamiento de la Producción Nacional de Coco y del Rendimiento del Cultivo de Coco.
El conjunto de datos utilizado corresponde a la Producción Nacional de Coco (toneladas) y al Rendimiento del Cultivo de Coco (toneladas por hectárea) registrados a nivel nacional durante el periodo analizado. Ambas variables reflejan la evolución temporal del sector cocotero en el país, siendo indicadores clave del comportamiento agrícola y de la eficiencia productiva.
Para el análisis, se construyeron dos series de tiempo anuales con frecuencia 1, donde el tiempo se representa por el año de observación. La serie de producción nacional muestra la cantidad total de coco cosechado en cada año, mientras que la serie de rendimiento mide la productividad media obtenida por hectárea cultivada. Estas series permiten estudiar la dinámica temporal del cultivo, identificar tendencias y determinar si las variaciones observadas responden a factores estructurales o estacionales.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 1.090 2.755 7.692 6.827 58.080
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 4.980 6.505 6.890 9.440 16.330
Según el análisis descriptivo, la producción nacional de coco presenta un promedio de aproximadamente 7.692 toneladas, con valores que van desde 0 hasta 58.080 toneladas, lo que evidencia una alta variabilidad entre los años analizados. Por su parte, el rendimiento del cultivo muestra una media cercana a 6.89 ton/ha, con un rango entre 0 y 16.33 ton/ha, indicando diferencias notables en la productividad a lo largo del tiempo. En general, ambas variables reflejan una marcada dispersión, lo que sugiere fluctuaciones importantes en la producción y eficiencia del cultivo a nivel nacional.
A continuación, se observan las gráficas que representan el comportamiento histórico de la producción nacional de coco y el rendimiento del cultivo (ton/ha) en Colombia durante el periodo comprendido entre 2007 y 2024. Estas visualizaciones permiten identificar las tendencias generales, variaciones interanuales y posibles patrones en el desarrollo del cultivo a nivel nacional.
En la primera gráfica, correspondiente a la producción nacional de coco, se aprecia una marcada variabilidad a lo largo del tiempo, con picos de producción en años como 2010 y 2016, seguidos de descensos en periodos posteriores. Esto sugiere que la producción ha estado influenciada por factores externos como el clima, los precios del mercado o las condiciones del cultivo.
En la segunda gráfica, que muestra el rendimiento del cultivo de coco (ton/ha), se evidencia una tendencia relativamente estable, aunque con algunos años atípicos en los que el rendimiento aumenta considerablemente, como en 2019. En general, la productividad se mantiene dentro de un rango medio, reflejando cierta consistencia en la eficiencia agrícola del cultivo a lo largo del tiempo.
Las gráficas muestran la distribución de la producción nacional y el rendimiento del cultivo de coco en Colombia. En la primera, se observa que la mayoría de las observaciones de producción se concentran en valores bajos, lo que indica que muchos departamentos tienen una producción reducida, mientras que solo unos pocos alcanzan volúmenes altos. En la segunda gráfica, la distribución del rendimiento (ton/ha) revela que la mayor parte de los cultivos se encuentra entre 5 y 8 toneladas por hectárea, evidenciando un rendimiento promedio estable. En conjunto, ambas gráficas reflejan que, aunque el rendimiento del coco se mantiene en niveles moderados, la producción total varía considerablemente entre regiones, probablemente por diferencias en el área cultivada o en las condiciones productivas.
## [1] 0.117852
El coeficiente de correlación de Pearson entre la producción nacional de coco y el rendimiento (ton/ha) es de 0.1178, lo que indica una relación positiva muy débil entre ambas variables. Esto significa que, aunque existe una ligera tendencia a que los años con mayores rendimientos presenten también una mayor producción, esta relación no es significativa ni linealmente fuerte. En otras palabras, los cambios en la producción nacional parecen depender más de otros factores —como el área cultivada o las condiciones climáticas— que del rendimiento promedio por hectárea.
Para verificar la estacionariedad de las series, se aplicaron las pruebas Augmented Dickey-Fuller (ADF) y Kwiatkowski–Phillips–Schmidt–Shin (KPSS).
Hipótesis del test:
H₀ (hipótesis nula): la serie no es estacionaria (tiene raíz unitaria).
H₁ (hipótesis alternativa): la serie es estacionaria.
Nivel de significancia: α = 0.05
##
## Augmented Dickey-Fuller Test
##
## data: prod_ts
## Dickey-Fuller = -9.3945, Lag order = 6, p-value = 0.01
## alternative hypothesis: stationary
##
## KPSS Test for Level Stationarity
##
## data: prod_ts
## KPSS Level = 0.16844, Truncation lag parameter = 4, p-value = 0.1
##
## Augmented Dickey-Fuller Test
##
## data: rend_ts
## Dickey-Fuller = -6.3652, Lag order = 6, p-value = 0.01
## alternative hypothesis: stationary
##
## KPSS Test for Level Stationarity
##
## data: rend_ts
## KPSS Level = 1.2247, Truncation lag parameter = 4, p-value = 0.01
En el caso de la Producción Nacional de Coco, la prueba ADF arrojó un p-value de 0.01, lo que permite rechazar la hipótesis nula de no estacionariedad, indicando que la serie es estacionaria. De manera complementaria, la prueba KPSS presentó un p-value de 0.1, superior al nivel de significancia del 5%, por lo que no se rechaza la hipótesis nula de estacionariedad. Ambos resultados son consistentes y confirman que la serie de producción es estacionaria.
En contraste, para la serie del Rendimiento del Cultivo de Coco, la prueba ADF también mostró un p-value de 0.01, sugiriendo estacionariedad; sin embargo, la prueba KPSS arrojó un p-value de 0.01, inferior al nivel de significancia del 5%, por lo que se rechaza la hipótesis nula de estacionariedad. Esto indica cierta contradicción entre las pruebas, y en este caso se considera que la serie no es completamente estacionaria, lo que justifica la aplicación de una diferenciación (d = 1) en el modelo ARIMA ajustado posteriormente.
Las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF) de la producción nacional de coco muestran un comportamiento típico de una serie estacionaria con dependencia de corto plazo. En la ACF se observa un pico significativo en el primer rezago que decae rápidamente hacia cero, lo que indica que los valores de producción dependen principalmente del año inmediato anterior. En la PACF, los coeficientes parciales se mantienen dentro de los límites de significancia después del primer rezago, confirmando que no hay una estructura autorregresiva fuerte más allá del primer orden. En conjunto, estos resultados sugieren que la serie puede ser bien representada por un modelo AR(1) o un ARIMA con un componente autorregresivo simple.
Las gráficas de la Función de Autocorrelación (ACF) y la Función de Autocorrelación Parcial (PACF) para el rendimiento del cultivo de coco muestran que existe una autocorrelación significativa en el rezago 1, lo cual indica que el rendimiento de un periodo depende ligeramente del rendimiento del periodo anterior. Sin embargo, las correlaciones para los rezagos posteriores se encuentran dentro de los límites de confianza, lo que sugiere que no hay una relación persistente en el tiempo. En la PACF, se observan algunos picos aislados, pero sin un patrón claramente significativo, lo que refuerza la idea de que la serie presenta una estructura temporal débil y podría comportarse de manera casi aleatoria tras eliminar una posible dependencia de corto plazo.
El modelo seleccionado por la función auto.arima() para la serie de Producción Nacional de Coco fue un ARIMA(1,0,1) con media distinta de cero. Este modelo indica que la producción depende tanto de su valor anterior como de los errores pasados. En términos técnicos, el componente AR(1) (con coeficiente positivo) sugiere una relación directa entre la producción actual y la del periodo anterior, mientras que el componente MA(1) (con signo negativo) refleja un ajuste correctivo respecto a los errores de predicción previos.
## Series: prod_ts
## ARIMA(1,0,1) with non-zero mean
##
## Coefficients:
## ar1 ma1 mean
## 0.6295 -0.8840 7.7583
## s.e. 0.0688 0.0347 0.2484
##
## sigma^2 = 141.6: log likelihood = -910.18
## AIC=1828.37 AICc=1828.54 BIC=1842.19
El hecho de que el parámetro de diferenciación sea d = 0 confirma que la serie es estacionaria, es decir, no presenta una tendencia marcada a lo largo del tiempo. La presencia de una media constante (≈ 7.76) señala que la producción nacional de coco tiende a mantenerse alrededor de un nivel promedio estable, con fluctuaciones moderadas en los diferentes periodos. En conjunto, este modelo representa un comportamiento estable y predecible de la producción, con variaciones que no implican cambios estructurales significativos en la tendencia general.
En el caso del rendimiento del cultivo de coco, la función auto.arima() seleccionó un ARIMA(1,1,2) con término de deriva (drift). Este resultado indica que fue necesario aplicar una primera diferencia (d = 1) para lograr la estacionariedad, lo cual implica que la serie original presentaba una tendencia en el tiempo. Los componentes autorregresivo (AR(1)) y de media móvil (MA(1) y MA(2)) reflejan una combinación de dependencia temporal y corrección de errores pasados.
## Series: rend_ts
## ARIMA(1,1,2) with drift
##
## Coefficients:
## ar1 ma1 ma2 drift
## 0.5896 -1.7981 0.8077 -0.0094
## s.e. 0.1093 0.0772 0.0758 0.0050
##
## sigma^2 = 9.081: log likelihood = -587.64
## AIC=1185.29 AICc=1185.55 BIC=1202.54
El parámetro de deriva (drift = -0.0094) sugiere una ligera tendencia negativa en el rendimiento del cultivo a lo largo del periodo analizado. En otras palabras, el rendimiento promedio del coco ha mostrado una leve disminución con el paso del tiempo. Este resultado puede estar relacionado con factores externos como variaciones climáticas, cambios en las prácticas agrícolas o condiciones económicas que afectan la productividad.
El modelo ARIMA(1,1,2) describe adecuadamente el comportamiento del rendimiento del cultivo, capturando su tendencia descendente y permitiendo realizar proyecciones con base en la estructura temporal de los datos.
Después de ajustar los modelos ARIMA a las series de Producción y Rendimiento del cultivo de coco, es fundamental realizar un diagnóstico para comprobar la validez estadística de los resultados. Este análisis se centra principalmente en los residuos del modelo, los cuales deben comportarse como ruido blanco: sin correlación, con media cero y varianza constante.
##
## Ljung-Box test
##
## data: Residuals from ARIMA(1,0,1) with non-zero mean
## Q* = 17.441, df = 8, p-value = 0.02583
##
## Model df: 2. Total lags used: 10
El modelo ajustado corresponde a un ARMA(1,1), dado que el parámetro de diferenciación es \(d = 0\). Este tipo de modelo combina un componente autorregresivo (AR(1)) y uno de media móvil (MA(1)), permitiendo capturar tanto la dependencia entre los valores pasados de la serie como los efectos de los errores previos.
El diagnóstico de los residuos muestra que éstos se distribuyen alrededor de la media cero sin evidenciar tendencias marcadas, lo que sugiere que el modelo logró describir adecuadamente la dinámica principal de la serie. Sin embargo, se observan algunos picos en la gráfica de residuos que podrían asociarse a fluctuaciones periódicas no completamente explicadas.
En el correlograma (ACF), la mayoría de las autocorrelaciones se encuentran dentro de los límites de confianza, aunque se observan ligeras dependencias en algunos rezagos. El histograma de los residuos presenta una forma aproximadamente simétrica, con pocos valores extremos, lo cual indica que la distribución es cercana a la normalidad esperada para un buen ajuste.
La prueba de Ljung-Box arrojó un estadístico \(Q^* = 17.44\) con un \(p\)-valor de \(0.0258\). Dado que este valor es ligeramente inferior al umbral de \(0.05\), se infiere que persiste una leve autocorrelación en los residuos. Esto sugiere que el modelo ARMA(1,1) describe de manera aceptable el comportamiento de la producción nacional de coco, aunque podría mejorarse incorporando un componente estacional o ajustando los parámetros del modelo para capturar mejor las variaciones periódicas observadas.
##
## Ljung-Box test
##
## data: Residuals from ARIMA(1,1,2) with drift
## Q* = 9.8125, df = 7, p-value = 0.1995
##
## Model df: 3. Total lags used: 10
El modelo ajustado para el rendimiento del cultivo de coco corresponde a un ARIMA(1,1,2) con término de deriva (drift). En este caso, el parámetro de diferenciación \(d = 1\) indica que fue necesario aplicar una primera diferencia para lograr estacionariedad en la serie. Este modelo combina un componente autorregresivo (AR(1)), dos componentes de media móvil (MA(1) y MA(2)), y un término de deriva que capta la tendencia general del rendimiento a lo largo del tiempo.
El análisis de los residuos muestra que éstos se distribuyen aleatoriamente alrededor de la media cero, sin patrones visibles de tendencia o estacionalidad. Esto sugiere que el modelo logró capturar adecuadamente la estructura temporal de la serie. El correlograma (ACF) de los residuos confirma esta observación, ya que la mayoría de las autocorrelaciones se mantienen dentro de los límites de confianza, evidenciando independencia temporal.
El histograma de los residuos, junto con la curva normal superpuesta, muestra una distribución aproximadamente simétrica y centrada en cero, lo que indica un comportamiento cercano a la normalidad.
La prueba de Ljung-Box reportó un estadístico \(Q^* = 9.81\) con un \(p\)-valor de \(0.1995\). Dado que este valor es mayor que el nivel de significancia habitual de \(0.05\), no se rechaza la hipótesis nula de independencia, lo cual implica que no existe autocorrelación significativa en los residuos.
En conclusión, el modelo ARIMA(1,1,2) con deriva presenta un ajuste adecuado para describir el comportamiento del rendimiento del cultivo de coco, cumpliendo con los supuestos de independencia y normalidad de los residuos, y permitiendo obtener proyecciones confiables sobre su evolución futura.
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## 2241 15.461165 0.2137872 30.70854 -7.857687 38.78002
## 2242 12.607525 -3.1256583 28.34071 -11.454303 36.66935
## 2243 10.811058 -5.1105568 26.73267 -13.538950 35.16107
## 2244 9.680118 -6.3155605 25.67580 -14.783161 34.14340
## 2245 8.968151 -7.0567851 24.99309 -15.539874 33.47618
## 2246 8.519943 -7.5165740 24.55646 -16.005793 33.04568
## 2247 8.237780 -7.8033242 24.27888 -16.294972 32.77053
## 2248 8.060148 -7.9827734 24.10307 -16.475383 32.59568
## 2249 7.948323 -8.0953191 23.99197 -16.588310 32.48496
## 2250 7.877925 -8.1660026 23.92185 -16.659145 32.41500
## 2251 7.833607 -8.2104338 23.87765 -16.703636 32.37085
## 2252 7.805707 -8.2383784 23.84979 -16.731604 32.34302
El gráfico de pronóstico muestra que la producción nacional de coco tiende a mantenerse estable en los próximos periodos, con pequeñas fluctuaciones alrededor de su media histórica.
El intervalo de confianza, representado por las bandas grises, evidencia una incertidumbre moderada, lo que indica que el modelo captura bien la variabilidad natural de la producción sin grandes desviaciones esperadas. Este comportamiento coincide con la interpretación previa del modelo ARMA(1,1), el cual reflejaba una serie estacionaria y sin tendencia definida.
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## 2241 6.628948 2.767120 10.490777 0.72279138 12.53511
## 2242 6.109006 2.164171 10.053840 0.07590219 12.14211
## 2243 5.798588 1.829551 9.767626 -0.27153100 11.86871
## 2244 5.611713 1.636523 9.586902 -0.46781473 11.69124
## 2245 5.497681 1.521396 9.473967 -0.58352285 11.57889
## 2246 5.426601 1.450274 9.402927 -0.65466647 11.50787
## 2247 5.380845 1.404431 9.357259 -0.70055576 11.46225
## 2248 5.350021 1.373260 9.326782 -0.73190969 11.43195
## 2249 5.328002 1.350661 9.305343 -0.75481657 11.41082
## 2250 5.311174 1.333087 9.289261 -0.77278564 11.39513
## 2251 5.297407 1.318466 9.276348 -0.78785798 11.38267
## 2252 5.285445 1.305584 9.265306 -0.80122733 11.37212
El pronóstico del modelo ARIMA(1,1,2) con deriva sugiere una ligera tendencia negativa en el rendimiento para los periodos futuros, manteniendo sin embargo una trayectoria relativamente estable. Los intervalos de confianza muestran un rango de variación moderado, lo cual refleja que las proyecciones son razonablemente precisas dentro del horizonte de predicción considerado.
Este resultado está en concordancia con el parámetro de deriva negativo identificado en el modelo, indicando que el rendimiento del cultivo podría experimentar una leve disminución sostenida en el corto plazo, posiblemente asociada a factores productivos o ambientales.
El análisis de series de tiempo aplicado a la Producción y al Rendimiento del cultivo de coco permitió identificar los patrones temporales y modelar su comportamiento mediante modelos ARIMA. A partir de la prueba de estacionariedad y el proceso de ajuste automático (auto.arima()), se obtuvieron modelos estadísticamente significativos y con capacidad predictiva aceptable para ambas variables analizadas.
En el caso de la Producción Nacional de Coco, el modelo identificado fue un ARMA(1,1), el cual refleja un comportamiento estacionario, con fluctuaciones alrededor de un promedio constante y sin una tendencia definida. Los resultados del diagnóstico mostraron residuos con media cercana a cero y autocorrelaciones poco significativas, lo que confirma la adecuación del modelo. Los pronósticos derivados de este modelo indican que la producción tenderá a mantenerse estable en los próximos periodos, con variaciones moderadas dentro de un rango previsible.
Por otro lado, el Rendimiento del Cultivo de Coco fue representado adecuadamente mediante un ARIMA(1,1,2) con término de deriva. Este modelo requirió una diferenciación para alcanzar la estacionariedad, lo que evidencia la existencia de una tendencia temporal. El término de deriva negativo sugiere una leve disminución del rendimiento a lo largo del tiempo, posiblemente asociada a factores ambientales, tecnológicos o de manejo del cultivo. Los resultados de diagnóstico confirmaron que los residuos se comportan como ruido blanco, respaldando la validez del modelo.
En conjunto, ambos modelos ofrecen una base confiable para comprender la evolución temporal de la producción y el rendimiento del coco en el país. Asimismo, los pronósticos obtenidos pueden servir como herramienta de apoyo en la toma de decisiones agrícolas y en la planificación de estrategias productivas orientadas a mejorar la eficiencia y sostenibilidad del cultivo.
Ministerio de Agricultura y Desarrollo Rural. (2024). Agronet: Estadísticas del sector agropecuario colombiano. Recuperado de https://www.agronet.gov.co/estadistica/Paginas/home.aspx?cod=1