1. Planteamiento del Problema

1.1 Contexto general

La producción de maíz en Colombia constituye uno de los pilares fundamentales de la seguridad alimentaria nacional y representa un elemento estratégico en la política agrícola del país. A lo largo de las últimas tres décadas, el sector maicero colombiano ha experimentado una transformación estructural profunda, caracterizada por la coexistencia de dos sistemas productivos con dinámicas radicalmente distintas en donde el maíz tecnificado, basado en el uso intensivo de maquinaria, semillas mejoradas y fertilizantes industriales, y el maíz tradicional, cultivado bajo prácticas campesinas convencionales muy poca incorporación tecnológica.

Esta dualidad productiva ha generado trayectorias históricas que plantean interrogantes de gran relevancia tanto para el análisis estadístico como para la formulación de políticas públicas. La entrada en vigencia del Tratado de Libre Comercio (TLC) entre Colombia y los Estados Unidos en 2012, los fenómenos climáticos extremos y el abandono progresivo del campo ylos cambios en la estructura de precios internacionales son algunos de los factores que han modulado el comportamiento de cada serie de manera diferenciada.

Desde el punto de vista del análisis de series de tiempo, ambas series presentan características que las hacen especialmente relevantes para el estudio de la dinámica temporal, ya que si tienen presencia de tendencia determinista o estocástica, posibles que tengan quiebres estructurales, no estacionariedad e, y patrones de dependencia serial que requieren la aplicación de modelos ARIMA para su modelado y pronóstico adecuados.

1.2 Pregunta problema

¿Es posible modelar adecuadamente las dinámicas históricas de la producción de maíz tecnificado y maíz tradicional en Colombia durante el período 1990–2023 mediante modelos ARIMA, identificar los patrones de tendencia, estacionariedad y quiebres estructurales presentes en cada serie, y generar pronósticos estadísticamente confiables para el periodo 2024–2030 que permitan anticipar la evolución futura del sector maicero colombiano?

1.3 Justificación del enfoque de series de tiempo

El análisis de series de tiempo es el enfoque metodológico apropiado para este estudio por las siguientes razones: (i) los datos son observaciones anuales de una misma variable a lo largo del tiempo, lo que introduce dependencia temporal que invalida los supuestos de independencia de los métodos estadísticos clásicos; (ii) el objetivo final del análisis incluye la generación de previsiones, tarea para la que los modelos ARIMA de Box y Jenkins (1976) proporcionan el marco teórico y computacional más consolidado en la literatura estadística; (iii) la presencia de tendencias, posibles cambios estructurales y patrones de autocorrelación hace necesario el uso de herramientas específicas de análisis temporal como las funciones de autocorrelación, las pruebas de raíz unitaria y la descomposición por componentes.


2. Datos y Contexto

Tabla 1. Producción anual de maíz en Colombia (toneladas), 1990–2023
Año Maíz Tecnificado (ton) Maíz Tradicional (ton)
1,990 523,000 950,000
1,991 612,000 820,000
1,992 587,000 1,050,000
1,993 720,000 780,000
1,994 698,000 1,100,000
1,995 810,000 860,000
1,996 775,000 980,000
1,997 900,000 700,000
1,998 845,000 1,020,000
1,999 760,000 890,000
2,000 980,000 650,000
2,001 1,050,000 870,000
2,002 870,000 750,000
2,003 1,120,000 910,000
2,004 1,350,000 680,000
2,005 1,280,000 820,000
2,006 1,420,000 590,000
2,007 1,180,000 760,000
2,008 1,560,000 640,000
2,009 1,390,000 800,000
2,010 1,050,000 560,000
2,011 1,720,000 700,000
2,012 1,650,000 620,000
2,013 1,480,000 580,000
2,014 1,810,000 660,000
2,015 1,140,000 480,000
2,016 1,690,000 610,000
2,017 1,870,000 540,000
2,018 1,600,000 590,000
2,019 1,750,000 510,000
2,020 1,420,000 460,000
2,021 1,950,000 520,000
2,022 2,100,000 490,000
2,023 1,830,000 430,000

Fuente de los datos

La información utilizada en este estudio proviene del boletín técnico Datos al Grano 2024 B, elaborado por el Departamento Económico de la Federación Nacional de Cultivadores de Cereales, Leguminosas y Soya (FENALCE). Los registros históricos de importaciones fueron obtenidos de la Revista Sobordos hasta 1990 y de la Dirección de Impuestos y Aduanas Nacionales (DIAN) desde 1991.

Los datos corresponden a la producción anual de maíz en Colombia entre 1990 y 2023, separando dos sistemas productivos con dinámicas marcadamente distintas: el maíz tecnificado, basado en maquinaria, semillas mejoradas y fertilizantes industriales, y el maíz tradicional, cultivado mediante prácticas campesinas convencionales. El período de 34 años que fue seleccionado por presentar la mayor variabilidad interanual en ambas series, lo que enriquece el análisis estadístico y permite identificar patrones, tendencias y quiebres estructurales de interés.


3. Análisis Descriptivo

3.1 Estadísticos Resumen

Tabla 2. Estadísticos descriptivos — producción de maíz (toneladas)
N Media Mediana Desv. Est. Mínimo Máximo CV (%) Asimetría Curtosis
Tecnificado 34 1,249,706 1,230,000 449,545 523,000 2,100,000 35.97 0.0914 -1.3054
Tradicional 34 716,765 690,000 182,586 430,000 1,100,000 25.47 0.3536 -0.9720

El Maíz Tecnificado presenta una media de producción significativamente mayor que el Maíz Tradicional (≈1.25 millones vs. ≈716 mil toneladas), evidenciando una mayor escala productiva. Sin embargo, su variabilidad relativa es elevada (CV ≈ 35.97%), lo que indica fluctuaciones importantes en la producción a lo largo del periodo analizado.

El Maíz Tradicional, aunque con una media menor, muestra una variabilidad relativamente más moderada (CV ≈ 25.47%), sugiriendo un comportamiento más estable en comparación con el tecnificado en términos relativos.

En cuanto a la forma de las distribuciones, el Maíz Tecnificado presenta una ligera asimetría positiva (0.0914), lo que sugiere la presencia de algunos años con producciones inusualmente altas que elevan levemente el promedio respecto a la mediana. Por su parte, el Maíz Tradicional muestra asimetría positiva moderada (0.3536), indicando una mayor concentración de años con valores por debajo del promedio, aunque sin una distorsión extrema en la distribución.

Por ultimo, ambas series presentan curtosis negativa (Tecnificado: -1.3054; Tradicional: -0.9720), lo que sugiere distribuciones más aplanadas que la normal, con menor concentración de valores extremos pronunciados.

3.2 Evolución histórica

La gráfica evidencia de manera clara la divergencia entre ambos sistemas productivos a lo largo del período analizado. El Maíz Tecnificado describe una trayectoria ascendente, interrumpida por momentos de alta volatilidad. El Maíz Tradicional, por el contrario, muestra un descenso sostenido que no presenta señales de reversión. La curva LOESS confirma que estas tendencias no son artefactos de años aislados, sino patrones estructurales persistentes. La separación progresiva entre ambas series sugiere una profunda transformación del sector maicero colombiano, con el sistema tecnificado ganando participación relativa mientras el tradicional se contrae de manera continua.

3.3 Cambios interanuales

Tabla 3. Producción y variación interanual por tipo de maíz
Año Tecnificado (ton) Δ% Tec. Tradicional (ton) Δ% Trad.
1991 612,000 +14.5% 820,000 -15.9%
1992 587,000 -4.3% 1,050,000 +21.9%
1993 720,000 +18.5% 780,000 -34.6%
1994 698,000 -3.2% 1,100,000 +29.1%
1995 810,000 +13.8% 860,000 -27.9%
1996 775,000 -4.5% 980,000 +12.2%
1997 900,000 +13.9% 700,000 -40%
1998 845,000 -6.5% 1,020,000 +31.4%
1999 760,000 -11.2% 890,000 -14.6%
2000 980,000 +22.4% 650,000 -36.9%
2001 1,050,000 +6.7% 870,000 +25.3%
2002 870,000 -20.7% 750,000 -16%
2003 1,120,000 +22.3% 910,000 +17.6%
2004 1,350,000 +17% 680,000 -33.8%
2005 1,280,000 -5.5% 820,000 +17.1%
2006 1,420,000 +9.9% 590,000 -39%
2007 1,180,000 -20.3% 760,000 +22.4%
2008 1,560,000 +24.4% 640,000 -18.8%
2009 1,390,000 -12.2% 800,000 +20%
2010 1,050,000 -32.4% 560,000 -42.9%
2011 1,720,000 +39% 700,000 +20%
2012 1,650,000 -4.2% 620,000 -12.9%
2013 1,480,000 -11.5% 580,000 -6.9%
2014 1,810,000 +18.2% 660,000 +12.1%
2015 1,140,000 -58.8% 480,000 -37.5%
2016 1,690,000 +32.5% 610,000 +21.3%
2017 1,870,000 +9.6% 540,000 -13%
2018 1,600,000 -16.9% 590,000 +8.5%
2019 1,750,000 +8.6% 510,000 -15.7%
2020 1,420,000 -23.2% 460,000 -10.9%
2021 1,950,000 +27.2% 520,000 +11.5%
2022 2,100,000 +7.1% 490,000 -6.1%
2023 1,830,000 -14.8% 430,000 -14%

El gráfico de variaciones interanuales revela patrones de comportamiento distintos en cada sistema. El Maíz Tecnificado alterna años de fuerte crecimiento con años de contracción pronunciada, sin una dirección que sea dominante en los cambios de corto plazo. Esta oscilación se vuelve más irregular a partir de 2012. El Maíz Tradicional muestra una mayor proporción de variaciones negativas en los años más recientes, lo que refuerza que es de un declive estructural y no meramente cíclico. La tabla de variaciones permite identificar los años de mayor impacto en cada serie, útil como referencia para contextualizar los modelos que se ajustarán posteriormente.

3.4 Distribución de la producción

El diagrama de caja confirma las diferencias distribucionales entre ambas series. La caja correspondiente al Maíz Tecnificado se ubica en un rango de producción más alto y presenta mayor amplitud intercuartílica, reflejando la alta variabilidad interanual de este sistema. Los valores atípicos superiores corresponden a los años de producción récord. La caja del Maíz Tradicional, aunque más compacta, se sitúa en rangos significativamente menores y está sesgada hacia los valores más bajos del período, coherente con la tendencia decreciente que caracteriza a esta serie.

3.5 Histogramas y densidad estimada

El Maíz Tecnificado presenta una distribución con asimetría positiva moderada y una cola derecha extendida, asi como lo indico el estadístico de asimetría calculado en la sección anterior. Esto indica que la mayoría de los años se concentran en rangos medios de producción, con unos pocos años de cosecha excepcionalmente alta. El Maíz Tradicional muestra una distribución con mayor concentración en valores intermedios y una cola izquierda más pronunciada, producto de los años recientes de producción reducida. En ambos casos, la curva de densidad kernel estimada acompaña de forma razonable el histograma.

3.6 Relación entre las dos series

El diagrama de dispersión muestra la relación entre ambas series a lo largo del tiempo. La correlación negativa entre las dos variables refleja que mientras el Maíz Tecnificado aumentaba su producción, el Tradicional disminuía en su producion, describiendo un proceso de sustitución gradual entre sistemas. Esta relación inversa no implica necesariamente causalidad directa, sino que ambas series responden a un proceso de transformación estructural del sector agrícola colombiano, en el que la expansión del modelo industrial ha coexistido con el retroceso del modelo campesino.

3.7 Producción promedio por quinquenio

Tabla 4. Producción promedio por quinquenio (toneladas)
Período Maíz Tecnificado (ton) Maíz Tradicional (ton) Diferencia (ton)
1990–94 628,000 940,000 -312,000
1995–99 818,000 890,000 -72,000
2000–04 1,074,000 772,000 302,000
2005–09 1,366,000 722,000 644,000
2010–14 1,542,000 624,000 918,000
2015–19 1,610,000 546,000 1,064,000
2020–23 1,825,000 475,000 1,350,000

En el primer quinquenio (1990–1994), ambas series presentaban niveles de producción comparables, con el Maíz Tradicional incluso por encima del Tecnificado. A partir de los primeros años del siglo XXI, la diferencia se amplía consistentemente, ya que Maiz el Tecnificado más que duplica su producción promedio en el período analizado, mientras el Tradicional la reduce a menos de la mitad. Esta evolución quinquenal confirma que la divergencia entre sistemas no es un fenómeno reciente ni circunstancial, sino el resultado acumulado de decisiones de política agrícola, condiciones de mercado y transformaciones sociodemográficas que se sostienen a lo largo de tres décadas.


4. Análisis Formal de Tendencia

4.1 Regresión de tendencia: modelos lineal y cuadrático

Tabla 5. Modelos de regresión de tendencia
Serie Modelo Intercepto β (tiempo) F p-valor F
Tecnificado Lineal 522,471 41,556 0.8474 177.71 <0.001
Tecnificado Cuadrático 463,383 51,404 0.8504 88.10 <0.001
Tradicional Lineal 990,214 -15,626 0.7263 84.91 <0.001
Tradicional Cuadrático 975,909 -13,242 0.7273 41.35 <0.001

Los resultados de los modelos de regresión de tendencia evidencian la presencia de dinámicas temporales estadísticamente significativas en ambas series de producción. En el caso del Maíz Tecnificado, el coeficiente asociado al componente temporal es positivo y altamente significativo (p < 0.001), lo que indica la existencia de una tendencia creciente sostenida en el periodo analizado, estimada en aproximadamente 41,556 toneladas anuales bajo el modelo lineal. La especificación cuadrática no genera mejoras sustanciales en el ajuste del modelo, aunque se observa un incremento marginal del coeficiente de determinación (R² de 0.8474 a 0.8504), lo cual sugiere únicamente leves desviaciones respecto a la linealidad sin alterar la estructura general de crecimiento.

Por su parte, el Maíz Tradicional presenta un coeficiente de tendencia negativo y estadísticamente significativo (p < 0.001), consistente con un proceso de decrecimiento estructural estimado en aproximadamente 15,626 toneladas anuales. Al igual que en el caso anterior, la inclusión de un término cuadrático no mejora de manera relevante la capacidad explicativa del modelo (R² de 0.7263 a 0.7273), lo que indica que la dinámica descendente puede ser adecuadamente caracterizada mediante una especificación lineal.

En ambos casos, los estadísticos F confirman la significancia global de los modelos (p < 0.001), lo cual respalda la existencia de tendencias determinísticas robustas en las series analizadas y sugiere que el componente temporal constituye un factor estructural determinante en la evolución de la producción agrícola estudiada.


4.2 Gráfico de tendencias ajustadas

En el caso del Maíz Tecnificado, la tendencia cuadrática se ajusta mejor a los datos que la lineal, particularmente en los extremos del período, donde la producción crece con mayor rapidez hacia el final que al inicio. En el Maíz Tradicional, ambos modelos capturan el declive de forma razonablemente similar, aunque la curva cuadrática refleja con mayor fidelidad la suavización de la caída en los últimos años. En ambas series, los residuos respecto a las tendencias son considerables, lo que anticipa la necesidad de emplear modelos ARIMA para capturar la dinámica temporal residual.

4.3 Detección de cambio estructural en el Maíz Tecnificado

El gráfico CUSUM evalúa la estabilidad de los coeficientes de la regresión de tendencia a lo largo del tiempo. Cuando la trayectoria del proceso supera las bandas de confianza representadas por las líneas punteadas, se dispone de evidencia estadística de inestabilidad o cambio estructural. Para el Maíz Tecnificado, la señal de inestabilidad observada alrededor del período 2012–2015 en su medidad dado por el impacto del TLC con Estados Unidos y los fenómenos climáticos extremos de esos años, lo que sugiere que la dinámica productiva experimentó una ruptura estadísticamente relevante en ese momento. Para el Maíz Tradicional, el proceso CUSUM indica una aceleración del declive desde los primeros años de la década de 2000, período en el que la competencia de las importaciones y el abandono del campo comenzaron a intensificarse. El análisis de puntos de quiebre mediante la función breakpoints confirma estos hallazgos con una identificación formal del momento de mayor discontinuidad en cada serie.


5. Construcción de las Series de Tiempo

La serie del Maíz Tecnificado y la del Maíz Tradicional quedan definidas para el período 1990–2023, con 34 observaciones cada una. Este tamaño muestral es suficiente para aplicar los modelos ARIMA que se desarrollarán en secciones posteriores, aunque impone la restricción de trabajar con órdenes de rezago moderados para preservar grados de libertad adecuados.


6. Descomposición: Tendencia y Residuos mediante Media Móvil

La descomposición mediante media móvil de cinco años permite separar la componente de tendencia suavizada de las fluctuaciones de corto plazo en cada serie. La media móvil elimina el ruido interanual y revela la trayectoria subyacente de largo plazo con mayor claridad que la serie original. Los residuos aditivos es decir, la diferencia entre la serie real y la tendencia estimada muestran las desviaciones en toneladas respecto a la tendencia, mientras que el índice multiplicativo expresa esas desviaciones como proporción de la tendencia. En el Maíz Tecnificado, los residuos presentan oscilaciones de magnitud creciente con el tiempo, lo que podría indicar heterocedasticidad condicional. En el Maíz Tradicional, los residuos son relativamente más estables en magnitud, aunque el índice multiplicativo evidencia años de desviación relativa considerable. Ambas observaciones tienen implicaciones para la especificación de los modelos ARIMA que se ajustarán en las secciones siguientes.


7. Pruebas de Hipótesis: Estacionariedad

Para evaluar la estacionariedad de las series de tiempo se aplicaron las pruebas: - Dickey-Fuller Aumentado (ADF) - KPSS - Phillips-Perron (PP)

Se trabajó con un nivel de significancia:

\[ \alpha = 0.05 \]


7.1 Test Dickey-Fuller Aumentado (ADF)

Formulación de hipótesis

\[ \left\{ \begin{array}{l} H_0:\ \text{La serie presenta raíz unitaria, por lo tanto no es estacionaria} \\ \\ H_1:\ \text{La serie no presenta raíz unitaria, por lo tanto es estacionaria} \end{array} \right. \]

Estadístico de prueba

\[ ADF = \frac{\hat{\rho}-1}{SE(\hat{\rho})} \]

Regla de decisión

\[ \left\{ \begin{array}{l} \text{Si } p\text{-valor} < \alpha \Rightarrow \text{Se rechaza } H_0 \\ \\ \text{Si } p\text{-valor} \geq \alpha \Rightarrow \text{No se rechaza } H_0 \end{array} \right. \]

Conclusión estadística

\[ \left\{ \begin{array}{l} \text{Rechazar } H_0 \Rightarrow \text{La serie es estacionaria} \\ \\ \text{No rechazar } H_0 \Rightarrow \text{La serie no es estacionaria} \end{array} \right. \]


7.2 Test KPSS

Formulación de hipótesis

\[ \left\{ \begin{array}{l} H_0:\ \text{La serie es estacionaria} \\ \\ H_1:\ \text{La serie no es estacionaria} \end{array} \right. \]

Estadístico de prueba

\[ KPSS = \frac{1}{T^2}\sum_{t=1}^{T} S_t^2 \Big/ \hat{\sigma}^2 \]

Regla de decisión

\[ \left\{ \begin{array}{l} \text{Si } p\text{-valor} < \alpha \Rightarrow \text{Se rechaza } H_0 \\ \\ \text{Si } p\text{-valor} \geq \alpha \Rightarrow \text{No se rechaza } H_0 \end{array} \right. \]

Conclusión estadística

\[ \left\{ \begin{array}{l} \text{Rechazar } H_0 \Rightarrow \text{La serie no es estacionaria} \\ \\ \text{No rechazar } H_0 \Rightarrow \text{La serie es estacionaria} \end{array} \right. \]


7.3 Test Phillips-Perron (PP)

Formulación de hipótesis

\[ \left\{ \begin{array}{l} H_0:\ \text{La serie presenta raíz unitaria, por lo tanto no es estacionaria} \\ \\ H_1:\ \text{La serie no presenta raíz unitaria, por lo tanto es estacionaria} \end{array} \right. \]

Estadístico de prueba

\[ PP = Z_{\alpha} \]

Regla de decisión

\[ \left\{ \begin{array}{l} \text{Si } p\text{-valor} < \alpha \Rightarrow \text{Se rechaza } H_0 \\ \\ \text{Si } p\text{-valor} \geq \alpha \Rightarrow \text{No se rechaza } H_0 \end{array} \right. \]

Conclusión estadística

\[ \left\{ \begin{array}{l} \text{Rechazar } H_0 \Rightarrow \text{La serie es estacionaria} \\ \\ \text{No rechazar } H_0 \Rightarrow \text{La serie no es estacionaria} \end{array} \right. \] ## 7.4 Tabla consolidada de pruebas de estacionariedad

Tabla 6. Consolidado de tests de estacionariedad (α = 0.05)
Test Serie H0 Estad Pvalor Decision estado_simple
ADF Tecnificado Tiene raíz unitaria -3.6079 0.047 Se rechaza H₀ : Estacionaria Estacionaria
ADF Tradicional Tiene raíz unitaria -6.1221 0.010 Se rechaza H₀ : Estacionaria Estacionaria
KPSS Tecnificado Es estacionaria 0.9411 0.010 Se rechaza H₀ : No estacionaria No estacionaria
KPSS Tradicional Es estacionaria 0.9340 0.010 Se rechaza H₀ : No estacionaria No estacionaria
PP Tecnificado Tiene raíz unitaria -37.5181 0.010 Se rechaza H₀ : Estacionaria Estacionaria
PP Tradicional Tiene raíz unitaria -51.4402 0.010 Se rechaza H₀ : Estacionaria Estacionaria

Los resultados no muestran convergencia total entre pruebas. Tanto ADF como PP rechazan la hipótesis nula de raíz unitaria para las series tecnificada y tradicional (p < 0.05), sugiriendo evidencia de estacionariedad en niveles. Sin embargo, la prueba KPSS rechaza la hipótesis nula de estacionariedad en ambas series (p < 0.05), indicando posible no estacionariedad. Esta discrepancia sugiere que las series podrían encontrarse en una situación límite de estacionariedad o verse afectadas por tendencias determinísticas, cambios estructurales o persistencia temporal, por lo que se recomienda complementar el análisis mediante inspección gráfica y funciones de autocorrelación antes de decidir transformaciones adicionales.

7.5 Primera diferencia: verificación de estacionariedad

Tabla 7. Tests de estacionariedad tras primera diferenciación
Serie Test p-valor Decisión (α = 0.05) Orden de integración
Tecnificado (1ª dif.) ADF 0.01 Estacionaria I(1)
Tecnificado (1ª dif.) PP 0.01 Estacionaria I(1)
Tradicional (1ª dif.) ADF 0.01 Estacionaria I(1)
Tradicional (1ª dif.) PP 0.01 Estacionaria I(1)

Tras aplicar la primera diferenciación, tanto la prueba Dickey-Fuller Aumentada (ADF) como Phillips-Perron (PP) rechazan la hipótesis nula de presencia de raíz unitaria (p = 0.01 < 0.05) en ambas series. Estos resultados indican que una sola diferenciación es suficiente para alcanzar estacionariedad, por lo que las series tecnificada y tradicional se clasifican como integradas de orden uno, I(1). En consecuencia, los modelos ARIMA a estimar deberán incorporar un orden de diferenciación d=1, condición fundamental para garantizar una especificación adecuada del modelo y mejorar la precisión de los pronósticos.


8. Análisis de la Función de Autocorrelación y Autocorrelación Parcial

8.1 Series originales

Las funciones de autocorrelación de las series originales muestran un decaimiento muy lento y persistente en todos los rezagos evaluados, lo cual constituye un patrón diagnóstico inequívoco de no estacionariedad, de acuerco con los resultados de las pruebas formales de raíz unitaria. La FACP presenta un coeficiente dominante en el primer rezago con un descenso rápido posterior, patrón típico de un proceso AR(1) con componente de tendencia. Estos patrones confirman que trabajar con las series originales no es apropiado para el ajuste de modelos ARIMA y que la diferenciación es indispensable.

8.2 Series diferenciadas

Tras realizar la diferenciación, los correlogramas presentan un panorama considerablemente más informativo para la identificación de la estructura ARIMA. En el Maíz Tecnificado diferenciado, la FAC muestra un pico significativo en el rezago 1 con una caída brusca posterior, lo que sugiere una componente de media móvil; la FACP, por su parte, también presenta rezagos significativos en los primeros órdenes, apuntando a una posible componente autorregresiva. Este patrón mixto orienta hacia modelos ARIMA(p,1,q) con p y q de orden bajo. Para el Maíz Tradicional diferenciado, la estructura residual es más parsimoniosa, tanto asi que la FAC y la FACP decaen rápidamente sin rezagos significativos más allá del segundo orden, lo que es compatible con especificaciones de orden reducido.

9. Ajuste y Selección de Modelos ARIMA

9.1 Modelos candidatos — Maíz Tecnificado

Tabla 8. Comparación de modelos ARIMA candidatos — Maíz Tecnificado (ordenado por AICc)
Modelo AIC BIC AICc RMSE (ton) MAE (ton) Log-Lik Nº Parámetros
ARIMA(0,1,1) 913.08 916.07 913.48 227,321 182,791 -454.54 1
ARIMA(1,1,1) 914.17 918.66 915.00 223,875 179,903 -454.09 2
ARIMA(1,1,0) 916.52 919.51 916.92 239,919 190,242 -456.26 1
Nota: La fila resaltada corresponde al modelo con menor AICc (preferido). RMSE y MAE expresados en toneladas.

Para el Maíz Tecnificado, el modelo ARIMA(0,1,1) fue seleccionado como el más adecuado al presentar el menor AICc, ofreciendo el mejor equilibrio entre ajuste y parsimonia. Aunque el modelo ARIMA(1,1,1) mostró errores ligeramente menores (RMSE y MAE), estas diferencias fueron mínimas y se lograron con una mayor complejidad. Por ello, se priorizó el modelo más simple para reducir el riesgo de sobreajuste y mejorar la capacidad de pronóstico. En términos de dinámica temporal, el modelo sugiere que, tras una primera diferenciación (d=1), la serie está influenciada principalmente por choques recientes de corto plazo más que por dependencia de valores pasados. ## 9.2 Modelos candidatos — Maíz Tradicional

Tabla 9. Comparación de modelos ARIMA candidatos — Maíz Tradicional (ordenado por AICc)
Modelo AIC BIC AICc RMSE (ton) MAE (ton) Log-Lik Nº Parámetros
ARIMA(0,1,2) 856.46 860.95 857.28 91,112 69,028 -425.23 2
ARIMA(1,1,0) 858.35 861.34 858.75 98,192 74,636 -427.17 1
ARIMA(0,1,1) 870.44 873.43 870.84 118,689 95,340 -433.22 1
Nota: La fila resaltada corresponde al modelo con menor AICc (preferido). RMSE y MAE expresados en toneladas.

Para el Maíz Tradicional, el modelo ARIMA(0,1,2) fue seleccionado como el más adecuado al presentar el menor AICc, así como los menores valores de RMSE y MAE, indicando un mejor equilibrio entre ajuste y capacidad predictiva. Esto sugiere que, tras una primera diferenciación (d=1), la dinámica de la producción está influenciada principalmente por choques recientes de corto plazo, más que por una dependencia directa de valores pasados. La coincidencia entre los criterios de selección refuerza la solidez del modelo elegido.

9.3 Selección del modelo final mediante auto.arima()

9.3.1 Tabla de resultados auto.arima — Maíz Tecnificado

Tabla 10A. Resultados del modelo auto.arima() — Maíz Tecnificado
Concepto Valor
Modelo seleccionado ARIMA(4,1,0)
AIC 894.01
AICc (criterio de selección) 897.24
BIC 902.99
Log-Verosimilitud -441
Varianza del error (σ²) 25,475,068,871
RMSE (ajuste dentro de muestra) 144,843
MAE (ajuste dentro de muestra) 116,314
Coeficiente: ar1 -0.9236 (SE = 0.1314)
Coeficiente: ar2 -1.0083 (SE = 0.1783)
Coeficiente: ar3 -0.662 (SE = 0.1803)
Coeficiente: ar4 -0.6375 (SE = 0.1287)
Coeficiente: drift 41622.0651 (SE = 6415.1547)
Nota: SE = Error estándar del coeficiente estimado. AICc es el criterio principal de selección para muestras pequeñas (n = 34).

El procedimiento auto.arima() mediante búsqueda exhaustiva (stepwise = FALSE) seleccionó el modelo ARIMA(4,1,0) para el Maíz Tecnificado, reorientando la selección manual inicial. Este modelo presentó un AICc considerablemente menor y mejores indicadores de ajuste, sugiriendo un mejor desempeño para fines de modelación y pronóstico. La presencia de d=1 confirma que la serie requiere una diferenciación para alcanzar estacionariedad, mientras que la estructura autorregresiva (AR(4)) indica que la producción está influenciada principalmente por valores observados en periodos anteriores. Además, el término drift sugiere una tendencia promedio en la evolución temporal de la serie.

9.3.2 Tabla de resultados auto.arima — Maíz Tradicional

Tabla 10B. Resultados del modelo auto.arima() — Maíz Tradicional
Concepto Valor
Modelo seleccionado ARIMA(4,1,0)
AIC 848.76
AICc (criterio de selección) 852
BIC 857.74
Log-Verosimilitud -418.38
Varianza del error (σ²) 6,535,436,097
RMSE (ajuste dentro de muestra) 73,363
MAE (ajuste dentro de muestra) 57,322
Coeficiente: ar1 -1.4474 (SE = 0.1599)
Coeficiente: ar2 -1.1699 (SE = 0.2559)
Coeficiente: ar3 -0.9298 (SE = 0.2489)
Coeficiente: ar4 -0.4291 (SE = 0.1634)
Coeficiente: drift -14687.9877 (SE = 2754.4916)
Nota: SE = Error estándar del coeficiente estimado. Si el modelo incluye ‘intercept’, este actúa como término de deriva en la serie diferenciada, capturando la tendencia lineal determinista. AICc es el criterio principal de selección.

Para el Maíz Tradicional, el modelo ARIMA(4,1,0) fue seleccionado automáticamente mediante auto.arima() como la mejor alternativa según el criterio AICc. La presencia de d=1 confirma que la serie requiere una diferenciación para alcanzar estacionariedad, mientras que la estructura autorregresiva de orden 4 indica que la producción está influenciada por el comportamiento observado en años anteriores. Además, el término drift negativo sugiere una tendencia promedio decreciente en la producción, coherente con el patrón histórico observado. En conjunto, el modelo ofrece un buen equilibrio entre ajuste y parsimonia para fines de análisis y pronóstico.


10. Desarrollo Matemático de los Modelos Seleccionados

Esta sección presenta el proceso algebraico completo de cada modelo ganador por auto.arima, desde el operador de retardo hasta la ecuación final en términos de la variable observada. Los coeficientes utilizados provienen directamente del ajuste computacional.

10.1 Modelo ganador — Maíz Tecnificado

Desarrollo algebraico — ARIMA(4,1,0) — Maíz Tecnificado

Sea \(Y_t\) la producción de Maíz Tecnificado en el año \(t\) (en toneladas) y sea \(B\) el operador de retardo tal que \(B^k Y_t = Y_{t-k}\).

Paso 1 — Representación general del proceso ARIMA\((p, d, q)\):

\[\Phi(B)\,(1 - B)^d\,Y_t \;=\; \Theta(B)\,\varepsilon_t\]

donde \(\Phi(B)\) es el polinomio autorregresivo, \((1-B)^d\) es el operador de diferenciación de orden \(d\), \(\Theta(B)\) es el polinomio de media móvil, y \(\varepsilon_t \sim \text{RB}(0, \sigma^2_\varepsilon)\).

Paso 2 — Transformación mediante primera diferencia:

\[W_t = (1 - B)\,Y_t = Y_t - Y_{t-1}\]

Esta transformación elimina la tendencia estocástica confirmada por ADF, KPSS y PP, convirtiendo la serie original I(1) en un proceso estacionario I(0).

Paso 3 — Ecuación del proceso diferenciado:

\[\Phi(B)\,W_t \;=\; \Theta(B)\,\varepsilon_t\]

\[ (1 + 0.9236 B^{1} + 1.0083 B^{2} + 0.662 B^{3} + 0.6375 B^{4}) \, W_t \;=\; 1 \, \varepsilon_t\]

Paso 4 — Expansión en términos de \(W_t\):

\[ W_t + 0.9236 W_{t-1} + 1.0083 W_{t-2} + 0.662 W_{t-3} + 0.6375 W_{t-4} \;=\; \varepsilon_t \]

Paso 5 — Ecuación final en términos de \(Y_t\):

\[ Y_t \;=\; Y_{t-1} - 0.9236(Y_{t-1} - Y_{t-2}) - 1.0083(Y_{t-2} - Y_{t-3}) - 0.662(Y_{t-3} - Y_{t-4}) - 0.6375(Y_{t-4} - Y_{t-5}) + \varepsilon_t \]

con \(\varepsilon_t \sim \text{RB}(0,\; 25,475,068,871 )\)


10.2 Modelo ganador — Maíz Tradicional

Desarrollo algebraico — ARIMA(4,1,0) — Maíz Tradicional

Sea \(Z_t\) la producción de Maíz Tradicional en el año \(t\) (en toneladas) y sea \(B\) el operador de retardo tal que \(B^k Z_t = Z_{t-k}\).

Paso 1 — Representación general con término de deriva:

\[\Phi(B)\,(1 - B)^d\,Z_t \;=\; \delta + \Theta(B)\,\varepsilon_t\]

donde \(\delta\) es el término de deriva, incluido si la serie presenta tendencia determinista residual tras la diferenciación.

Paso 2 — Transformación mediante primera diferencia:

\[V_t = (1 - B)\,Z_t = Z_t - Z_{t-1}\]

Paso 3 — Ecuación del proceso diferenciado:

\[ (1 + 1.4474 B^{1} + 1.1699 B^{2} + 0.9298 B^{3} + 0.4291 B^{4}) \, V_t \;=\; 1 \, \varepsilon_t\]

Paso 4 — Expansión en términos de \(V_t\):

\[ V_t + 1.4474 V_{t-1} + 1.1699 V_{t-2} + 0.9298 V_{t-3} + 0.4291 V_{t-4} \;=\; \varepsilon_t \]

Paso 5 — Ecuación final en términos de \(Z_t\):

\[ Z_t \;=\; Z_{t-1} - 1.4474(Z_{t-1} - Z_{t-2}) - 1.1699(Z_{t-2} - Z_{t-3}) - 0.9298(Z_{t-3} - Z_{t-4}) - 0.4291(Z_{t-4} - Z_{t-5}) + \varepsilon_t \]

con \(\varepsilon_t \sim \text{RB}(0,\; 6,535,436,097 )\)

Tabla 11. Coeficientes estimados de los modelos ARIMA con error estándar y p-valor aproximado
Serie Modelo Parámetro Estimado Error Estándar t-estadístico p-valor (aprox.)
Maíz Tecnificado ARIMA(4,1,0) ar1 -0.9236 0.1314 -7.029 0.0000
Maíz Tecnificado ARIMA(4,1,0) ar2 -1.0083 0.1783 -5.656 0.0000
Maíz Tecnificado ARIMA(4,1,0) ar3 -0.6620 0.1803 -3.671 0.0002
Maíz Tecnificado ARIMA(4,1,0) ar4 -0.6375 0.1287 -4.951 0.0000
Maíz Tecnificado ARIMA(4,1,0) drift 41622.0651 6415.1547 6.488 0.0000
Maíz Tradicional ARIMA(4,1,0) ar1 -1.4474 0.1599 -9.054 0.0000
Maíz Tradicional ARIMA(4,1,0) ar2 -1.1699 0.2559 -4.572 0.0000
Maíz Tradicional ARIMA(4,1,0) ar3 -0.9298 0.2489 -3.735 0.0002
Maíz Tradicional ARIMA(4,1,0) ar4 -0.4291 0.1634 -2.626 0.0086
Maíz Tradicional ARIMA(4,1,0) drift -14687.9877 2754.4916 -5.332 0.0000

Los resultados muestran que todos los coeficientes estimados en los modelos ARIMA(4,1,0) para Maíz Tecnificado y Maíz Tradicional son estadísticamente significativos (p<0.05), lo que indica que cada término autorregresivo aporta información relevante para explicar la dinámica temporal de las series. En ambos casos, la significancia de los parámetros AR(1)–AR(4) evidencia dependencia de corto plazo entre las variaciones de producción. Además, el término drift resulta significativo en ambas series, siendo positivo para el Maíz Tecnificado sugiriendo una tendencia promedio creciente y negativo para el Maíz Tradicional, coherente con una tendencia decreciente en la producción observada históricamente.


11. Diagnóstico de los Residuos

11.1 Residuos del modelo Maíz Tecnificado

Tabla 12. Diagnóstico de residuos — Modelo Maíz Tecnificado
Test Hipótesis nula (H₀) Estadístico p-valor Resultado
X-squared Ljung-Box (lag 10) H₀: No autocorrelación en residuos 2.6686 0.9882 Sin autocorrelación residual
Jarque-Bera H₀: Residuos normales (asimetría y curtosis = 0) 1.1824 0.5537 Normalidad no rechazada
W Shapiro-Wilk H₀: Residuos provienen de distribución normal 0.9760 0.6430 Normalidad no rechazada

El diagnóstico de residuos del modelo para el Maíz Tecnificado evalúa tres criterios fundamentales para validar la especificación. La prueba de Ljung-Box verifica si los residuos son ruido blanco, es decir, si el modelo ha capturado toda la estructura de dependencia temporal de la serie. Un p-valor superior a 0.05 indica que no existe autocorrelación residual significativa hasta el rezago 10, lo que respalda la adecuación del modelo. Las pruebas de Jarque-Bera y Shapiro-Wilk evalúan la normalidad de los residuos, condición que, aunque no es estrictamente necesaria para la consistencia del estimador, es deseable para que los intervalos de confianza del pronóstico sean válidos. El gráfico de residuos al cuadrado permite detectar posibles episodios de heterocedasticidad condicional que el modelo ARIMA no contemplaría.

11.2 Residuos del modelo Maíz Tradicional

Tabla 13. Diagnóstico de residuos — Modelo Maíz Tradicional
Test Hipótesis nula (H₀) Estadístico p-valor Resultado
X-squared Ljung-Box (lag 10) H₀: No autocorrelación en residuos 5.2986 0.8704 Sin autocorrelación residual
Jarque-Bera H₀: Residuos normales (asimetría y curtosis = 0) 0.4142 0.8129 Normalidad no rechazada
W Shapiro-Wilk H₀: Residuos provienen de distribución normal 0.9785 0.7262 Normalidad no rechazada

El diagnóstico de residuos del modelo para el Maíz Tradicional sigue la misma lógica de validación. La inspección visual del gráfico de residuos en el tiempo permite verificar si existen patrones sistemáticos no capturados, y el gráfico Q-Q evalúa la proximidad a la normalidad. Los correlogramas de los residuos son especialmente informativos: la ausencia de barras significativas en la FAC y FACP confirmaría que el modelo ha absorbido toda la autocorrelación de la serie diferenciada. Un modelo que supera las tres pruebas formales puede considerarse estadísticamente bien especificado, y sus pronósticos, estadísticamente confiables dentro del horizonte de proyección planificado.


12. Previsión a Siete Años (2024–2030)

12.1 Previsión — Maíz Tecnificado

Tabla 14. Previsión de producción — Maíz Tecnificado (2024–2030)
Año Previsión(ton) LI 80% LS 80% LI 95% LS 95%
2,024 1,963,772 1,759,225 2,168,319 1,650,944 2,276,600
2,025 1,851,423 1,646,280 2,056,566 1,537,683 2,165,162
2,026 2,079,538 1,873,763 2,285,314 1,764,831 2,394,245
2,027 2,241,806 2,024,996 2,458,615 1,910,223 2,573,388
2,028 2,027,140 1,809,664 2,244,615 1,694,539 2,359,740
2,029 2,158,528 1,909,800 2,407,256 1,778,131 2,538,925
2,030 2,176,907 1,924,823 2,428,990 1,791,378 2,562,435

La prevision de la producion del Maíz Tecnificado para el período 2024–2030 proyecta una producción en torno al último valor observado, con una amplitud creciente de los intervalos de confianza a medida que se aleja el horizonte de proyección. Esta característica es inherente a los modelos ARIMA: la incertidumbre acumulada hace que los intervalos sean más estrechos en los primeros años proyectados y considerablemente más amplios hacia el final del horizonte. La amplitud de los intervalos al 95% refleja la alta volatilidad histórica de la serie y debe interpretarse como una advertencia sobre los límites de la capacidad predictiva del modelo en el largo plazo. El pronóstico es condicional a que el entorno estructural permanezca estable; cambios en la política comercial, el clima o los precios internacionales podrían llevar la producción fuera de los intervalos proyectados.

12.2 Previsión — Maíz Tradicional

Tabla 15. Previsión de producción — Maíz Tradicional (2024–2030)
Año Previsión (ton) LI 80% LS 80% LI 95% LS 95%
2,024 444,516 340,913 548,119 286,069 602,964
2,025 422,755 309,256 536,254 249,173 596,337
2,026 432,842 309,024 556,661 243,479 622,206
2,027 382,860 258,628 507,092 192,863 572,856
2,028 384,316 246,782 521,851 173,975 594,657
2,029 367,550 229,960 505,141 157,124 577,977
2,030 359,168 220,523 497,814 147,128 571,209

El pronóstico para el Maíz Tradicional refleja la dificultad del modelo para proyectar una tendencia decreciente pronunciada en el corto plazo, dado que el ARIMA sin deriva proyecta en torno al último nivel observado. Los límites inferiores de los intervalos de confianza al 95% sugieren, no obstante, escenarios de caída significativa que son compatibles con la trayectoria histórica. Para un pronóstico que capture explícitamente la tendencia descendente, sería necesario complementar el ARIMA con una componente de deriva o con modelos que incorporen variables exógenas explicativas del declive estructural, como se discute en la sección de soluciones propuestas.

12.3 Proyección combinada de ambas series

La gráfica combinada ofrece una perspectiva integral de la trayectoria de ambas series entre 1990 y el horizonte proyectado de 2030. La separación entre las dos proyecciones es el elemento más relevante de esta visualización: mientras el Maíz Tecnificado se mantiene en niveles elevados con considerable incertidumbre, el Maíz Tradicional continúa en una posición significativamente inferior. La amplitud relativa de los intervalos de confianza también resulta informativa: el Tecnificado presenta bandas más amplias en términos absolutos, coherente con su mayor volatilidad histórica, mientras que la incertidumbre del Tradicional, aunque menor en magnitud absoluta, es igualmente significativa en términos relativos al nivel de producción proyectado.


13. Consolidado de Pruebas de Hipótesis

Tabla 16. Consolidado general de pruebas de hipótesis y p-valores (α = 0.05)
Sección Test H₀ p-valor Conclusión
Tendencia — Tecnificado F-test (tend. lineal) β_t = 0 (sin tendencia) 0.0000 Tendencia lineal significativa
F-test (tend. cuadrát.) β_t = β_t² = 0 0.0000 Tendencia cuadrática significativa
Tendencia — Tradicional F-test (tend. lineal) β_t = 0 (sin tendencia) 0.0000 Tendencia lineal significativa
F-test (tend. cuadrát.) β_t = β_t² = 0 0.0000 Tendencia cuadrática significativa
Estacionariedad — Original ADF (Tec.) Raíz unitaria 0.0470 No estacionaria
ADF (Trad.) Raíz unitaria 0.0100 No estacionaria
KPSS (Tec.) Estacionaria 0.0100 No estacionaria
KPSS (Trad.) Estacionaria 0.0100 No estacionaria
PP (Tec.) Raíz unitaria 0.0100 No estacionaria
PP (Trad.) Raíz unitaria 0.0100 No estacionaria
Estacionariedad — 1ª Dif. ADF (Tec. dif.) Raíz unitaria 0.0100 Estacionaria
ADF (Trad. dif.) Raíz unitaria 0.0100 Estacionaria
PP (Tec. dif.) Raíz unitaria 0.0100 Estacionaria
PP (Trad. dif.) Raíz unitaria 0.0100 Estacionaria
Residuos — Tecnificado Ljung-Box Sin autocorr. 0.9882 Sin autocorrelación en residuos
Jarque-Bera Normalidad 0.5537 Residuos normales
Shapiro-Wilk Normalidad 0.6430 Residuos normales
Residuos — Tradicional Ljung-Box Sin autocorr. 0.8704 Sin autocorrelación en residuos
Jarque-Bera Normalidad 0.8129 Residuos normales
Shapiro-Wilk Normalidad 0.7262 Residuos normales

La tabla consolidada resume las principales decisiones estadísticas del análisis, integrando las pruebas aplicadas, sus hipótesis nulas, p-valores y conclusiones al nivel de significancia del 5%. Los resultados evidencian tendencias lineales y cuadráticas significativas en ambas series, así como evidencia mixta de estacionariedad en niveles, dado que las pruebas ADF y Phillips-Perron sugirieron estacionariedad, mientras que KPSS indicó no estacionariedad. Tras aplicar una primera diferenciación, las pruebas confirmaron estacionariedad en ambas series, justificando su clasificación como procesos I(1). Finalmente, los diagnósticos de residuos mostraron ausencia de autocorrelación y cumplimiento del supuesto de normalidad, lo que respalda la adecuación estadística de los modelos ajustados para análisis y pronóstico.


14. Conclusiones

El análisis de las series de tiempo de producción de maíz en Colombia entre 1990 y 2023 permite identificar patrones estadísticamente significativos y relevantes para comprender la evolución del sector. Los modelos ARIMA seleccionados mediante criterios de información corregidos (AICc) y refinados con auto.arima() representaron adecuadamente la dinámica temporal de ambas series, una vez aplicada la primera diferenciación para alcanzar estacionariedad. Los diagnósticos residuales evidenciaron ausencia de autocorrelación y cumplimiento del supuesto de normalidad, indicando un ajuste estadísticamente adecuado.

En cuanto a la estacionariedad, las pruebas ADF, KPSS y Phillips-Perron presentaron evidencia mixta en niveles, lo que justificó la aplicación de una primera diferenciación. Tras esta transformación, ambas series alcanzaron estacionariedad, clasificándose como procesos integrados de orden uno, I(1), condición necesaria para una modelación ARIMA apropiada.

Respecto a las tendencias históricas, la producción de Maíz Tecnificado mostró un crecimiento estadísticamente significativo, mientras que el Maíz Tradicional presentó una tendencia decreciente persistente. Asimismo, el análisis de estabilidad estructural sugirió posibles cambios en determinados periodos, compatibles con transformaciones del entorno económico y climático del sector agrícola.

Finalmente, las previsiones realizada para el periodo 2024–2030 proporcionan estimaciones puntuales e intervalos de confianza que reflejan la incertidumbre inherente al proceso de predicción, ofreciendo insumos útiles para la planificación y formulación de políticas agrícolas. En conjunto, la evidencia estadística obtenida respalda la consistencia metodológica del estudio y permite concluir que la transformación del sector maicero colombiano durante el periodo analizado ha sido significativa y diferenciada entre los sistemas tecnificado y tradicional.


15. Referencias Bibliográficas

Las referencias incluidas a continuación han sido seleccionadas con base en su pertinencia directa respecto a los contenidos desarrollados en el presente trabajo: análisis de series de tiempo, modelos ARIMA, pruebas de raíz unitaria, cambio estructural, pronóstico estadístico, implementación en R, y contexto institucional de la producción de maíz en Colombia.

Metodología estadística y series de tiempo:

Pruebas de raíz unitaria y cambio estructural:

Econometría aplicada:

Fuentes institucionales sobre producción de maíz en Colombia: