Este informe tiene como objetivo analizar la posible relación entre la producción agrícola departamental y la variación del Índice de Precios al Consumidor (IPC) en Colombia, durante el período 2019–2022. A partir de bases de datos públicas del DANE y la plataforma Colombia en Datos, se exploran patrones territoriales en torno a la capacidad productiva y su posible vínculo con la estabilidad o variación de precios de productos agrícolas. El análisis se orienta por preguntas sociológicas que abordan la concentración de la producción y las limitaciones estructurales en el camino hacia la soberanía alimentaria.
La pregunta de investigación es la siguiente: ¿Existe una relación entre la producción agrícola por departamento y la variación del IPC alimentario en Colombia entre los años 2019 y 2021?
Objetivo general
Explorar si la mayor producción agrícola en los departamentos de Colombia se relaciona con menores variaciones del IPC, como expresión de una posible autonomía alimentaria.
Objetivos especificos
Identificar la distribución territorial de la producción agrícola en Colombia.
Analizar las variaciones del IPC por departamento.
Evaluar la relación entre producción agrícola e IPC mediante herramientas estadísticas exploratorias.
Para consultar las bases de datos utilizadas puede dirigirse a los siguientes links: Datos del UPRA 2019-2023 Base del DANE, IPC
BASE=read.csv("PACUANTI.csv")
colnames(BASE)= c("Departamento","Año_2019","Año_2020","Año_2021","Año_2022","IPC_2019","IPC_2020", "IPC_2021", "IPC_2022")
SUB1<- subset(BASE, select=c(Departamento, Año_2019,IPC_2019,
Año_2020, IPC_2020, Año_2021,IPC_2021))
SUB1promedio_2019<-mean(SUB1$"Año_2019",na.rm =TRUE)
promedio_2020<-mean(SUB1$"Año_2020",na.rm = TRUE)
promedio_2021<-mean(SUB1$`Año_2021`,na.rm = TRUE)
promedios <- data.frame(Año = c("2019","2020", "2021"), Promedio = c (promedio_2019, promedio_2020, promedio_2021))Descripción de la base de datos
La base de datos contiene principalmente tres variables que son de nuestro interés para la solución de la pregunta de investigación, en las filas se encuentran los departamentos en los cuales fue posible encontrar información del IPC (índice de precios al consumidor). La segunda corresponde a las cantidades por tonelada de productos agrícolas (frutas, cereales, verduras, tubérculos) que cada uno de estas regiones produce. Por último el valor de la variación del IPC correspondiente. Las variables antes mencionadas se encuentran rastreadas para los años 2019, 2020, 2021, 2022. La tabla fue creada a partir de dos fuentes de datos gubernamentales, por un lado, el IPC proviene del Dane, el cual tiene un visor de datos por ciudades que permite identificar el valor del aumento o variación. Los valores de los cultivos agrícolas, por otro lado, fueron extraídos de una base de datos encontrada en la página Colombia en datos. Estas dos fuentes fueron integradas manualmente en una tabla única para análisis comparativo.
Definición y operacionalización de las variables
Se emplearon herramientas básicas de estadística descriptiva (media, mediana, desviación estándar), gráficos de dispersión y diagramas de barras. Estas técnicas permitieron explorar patrones de asociación entre la producción agrícola y la variación del IPC.
Valor_minimo2019<-min(SUB1$"Año_2019",na.rm = TRUE)
Valor_minimo2020<-min(SUB1$"Año_2020",na.rm = TRUE)
Valor_minimo2021<-min(SUB1$`Año_2021`,na.rm = TRUE)
##las variaciones no son muchas, San Andres sigue siendo el mas bajo...###
minimos_PA <- data.frame(Año = c("2019","2021"), Minimo_PA= c (Valor_minimo2019, Valor_minimo2021))
# El departamento con menor IPC durante el 2019 fue el Huila
IPCMin2019<-min(SUB1$IPC_2019, na.rm=TRUE)
# El departamento con menor IPC durante el 2020 fue el Tolima
IPCMin2020<-min(SUB1$IPC_2020, na.rm=TRUE)
# El departamento con menor IPC durante el 2021 fue Cundinamarca
IPCMin2021<-min(SUB1$IPC_2021, na.rm=TRUE)
minimos <- data.frame(Año = c("2019","2021"), Minimo_IPC= c (IPCMin2019, IPCMin2021))
# El Valle del Cauca es el mayor productor agricola del pais del periodo 2019-2021
## representa mas del 30% de la producción ##
Max_PA2019<-max(SUB1$`Año_2019`,na.rm = TRUE)
Max_PA2020<-max(SUB1$`Año_2020`,na.rm = TRUE)
Max_PA2021<-max(SUB1$`Año_2021`,na.rm = TRUE)
maximos_PA<- data.frame(Año = c("2019","2021"), Maximo_PA= c (Max_PA2019, Max_PA2021))
## Los valores maximos del IPC varian considerablemente en estos tres años
Max_IPC_2019<-max(SUB1$IPC_2019, na.rm=TRUE) #La Guajira
Max_IPC_2020<-max(SUB1$IPC_2020, na.rm=TRUE) #Norte de Santander
Max_IPC_2021<-max(SUB1$IPC_2021, na.rm=TRUE) #Magdalena
maximos_IPC <- data.frame(Departamento = c("La Guajira", "Norte de Santander", "Magdalena"),
Maximo_IPC= c (Max_IPC_2019, Max_IPC_2020, Max_IPC_2021))
Desviacion_Estandar_2019<-sd(SUB1$Año_2019, na.rm=TRUE)
Desviacion_Estandar_2020<-sd(SUB1$Año_2020, na.rm=TRUE)
Desviacion_Estandar_2021<-sd(SUB1$Año_2021, na.rm=TRUE)
SD_PA<- data.frame(Año = c("2019","2020", "2021"),Desviacion_PA=
c (Desviacion_Estandar_2019, Desviacion_Estandar_2020,Desviacion_Estandar_2021))
Desviacion_Estandar_IPC2019<-sd(SUB1$IPC_2019, na.rm=TRUE)
Desviacion_Estandar_IPC2020<-sd(SUB1$IPC_2020, na.rm=TRUE)
Desviacion_Estandar_IPC2021<-sd(SUB1$IPC_2021, na.rm=TRUE)
SD_IPC <- data.frame(Año = c("2019","2021"), Desviacion_IPC=
c (Desviacion_Estandar_IPC2019,Desviacion_Estandar_IPC2021))
Median_PA2019<-median(SUB1$`Año_2019`,na.rm = TRUE)
Median_PA2020<-median(SUB1$`Año_2020`,na.rm = TRUE)
Median_PA2021<-median(SUB1$`Año_2021`,na.rm = TRUE)
Median_IPC2019<-median(SUB1$`IPC_2019`,na.rm = TRUE) ##3,81%
Median_IPC2021<-median(SUB1$`IPC_2021`,na.rm = TRUE) ##6.52%
Tabla 2
Estos resultados muestran que la producción agrícola en Colombia está fuertemente concentrada en unos pocos departamentos, mientras que la variación del IPC se reparte de forma más equilibrada, aunque también con diferencias importantes.
Por ejemplo, en el año 2019, el Valle del Cauca fue, con mucha diferencia, el departamento que más aportó a la producción agrícola del país: más del 34% del total nacional salió de allí. Le siguen Cauca, Tolima y Antioquia, aunque con cifras mucho más bajas. Esto significa que solo entre tres o cuatro regiones se concentra buena parte de los alimentos que se producen en Colombia. En cambio, departamentos como La Guajira, Vaupés, San Andrés, Guainía y Amazonas tienen una producción casi nula en comparación con los demás. Esto refleja una desigualdad muy marcada entre regiones: mientras algunos departamentos tienen tierras fértiles, tecnología y sistemas de producción desarrollados, otros enfrentan condiciones difíciles, poca inversión o incluso una baja presencialidad del Estado.
Por otro lado, el IPC, que mide cuánto han subido los precios, muestra una variabilidad más moderada entre departamentos. En 2019, la mayoría de los departamentos se movieron entre un 3% y un 4.5% de inflación. Sin embargo, ya en 2021, varios departamentos superaron el 6%, y Magdalena llegó a un pico del 8.99%, el más alto de todos. Aunque se podría pensar que los departamentos con mayor producción tendrían precios más bajos, esto no siempre se cumple. Por ejemplo, Cauca y Antioquia, que producen bastante, también presentaron un IPC alto en algunos años, mientras que otros con baja producción, como Boyacá, mostraron variaciones más estables.
En resumen, los datos dejan claro que producir más no garantiza que los precios se mantengan bajos. Esto puede estar relacionado con otros factores, como la intermediación en el mercado, los costos de transporte o la falta de canales directos de comercialización entre productores y consumidores.Tambien muestran que muchas regiones del pais aun ependen de lo que se produce en otras zonas, lo que pone en duda la idea de una soberanía alimentaria real en el plano territorial.
library(ggplot2)
SUB1[4, 1]="San Ans"
ggplot(SUB1, aes(x = reorder(Departamento, `Año_2019`), y = `Año_2019`)) +
geom_bar(stat = "identity", fill = "aquamarine") +
labs(title = "Porcentaje producción agricola por Departamento en 2019",
x = "Departamento",
y = "Porcentaje 2019") +
theme_minimal()+theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1))
Gráfico 1
La distribución es claramente desigual: Valle del Cauca aporta cerca de un 35% de la producción agrícola nacional en 2019, muy por encima del resto. Le siguen, a gran distancia, Cauca, Antioquia, Meta y Tolima, cada uno con valores aproximados entre 5% y 9%. A partir de ahí, los porcentajes caen rápidamente: más de quince departamentos —incluidos Vaupés, Guainía, San Andrés, Amazonas y La Guajira— se ubican por debajo del 1%, varios prácticamente en cero. En conjunto, apenas un puñado de territorios concentra la mayor parte de la oferta agrícola, mientras la mayoría mantiene una participación mínima o marginal. La mayoría de los departamentos no superan el 3%
SUB1[4, 1]="San Andres"
Subconjunto_largo1 <- SUB1 %>%
pivot_longer(cols = c(`Año_2019`, `Año_2021`), names_to = "Año", values_to = "Valor")
ggplot(Subconjunto_largo1, aes(x = Departamento, y = Valor, fill = Año)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Comparativo porcentaje producción por Departamento: 2019 vs 2021",
x = "Departamento",
y = "Porcentaje") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1))
Gráfico 2
Los datos muestran que la distribución de la producción agrícola por departamento se mantiene prácticamente constante entre 2019 y 2021. El Valle del Cauca sigue siendo, por amplio margen, el departamento con mayor aporte a la producción nacional, superando el 30 % en ambos años. En la mayoría de los departamentos, los cambios entre un año y otro son mínimos o inexistentes. Algunos casos presentan variaciones pequeñas, como Tolima, Santander o Caldas, pero en ningún caso hay transformaciones estructurales en la participación.
En los departamentos con menor producción como Vaupés, Guainía, San Andrés, La Guajira o Amazonas, los niveles continúan siendo casi nulos, sin variaciones relevantes. La estabilidad en la desigualdad regional sugiere que las condiciones estructurales que determinan el acceso a recursos siguen sin modificarse.
SUB1[4, 1]="San Andres"
Subconjunto_largo2 <- SUB1 %>%
pivot_longer(cols = c(`IPC_2019`, `IPC_2021`),
names_to = "Año",
values_to = "Valor") %>%
filter(!is.na(Valor))
ggplot(Subconjunto_largo2, aes(x = Departamento, y = Valor, fill = Año)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Comparativo porcentaje IPC por Departamento: 2019 vs 2021",
x = "Departamento",
y = "Porcentaje") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 90, vjust = 0.5, hjust = 1))
Gráfico 3
Se excluyeron los departamentos con valores poco representativos (menos del 0.5%)
La anterior gráfica de barras muestra cómo se comportó el IPC (Índice de Precios al Consumidor) en cada departamento en dos momentos clave: 2019 (barras rojas) y 2021 (barras azules). En casi todos los departamentos, el IPC aumentó de manera significativa entre esos dos años.
En 2019, los valores del IPC se movían entre el 2.7% y el 4.7% en la mayoría del país. Pero en 2021, en departamentos como Magdalena, Cesar, Bolívar, y Norte de Santander, los valores superan ampliamente el 7%, llegando incluso cerca del 9%. Esto significa que los precios, especialmente los de alimentos y bienes básicos, subieron con fuerza en esas regiones durante ese periodo.
Este aumento no fue uniforme. Algunos departamentos como Boyacá, Tolima, Antioquia y Nariño tuvieron incrementos más moderados, lo que podría indicar una mejor capacidad de contención de precios o diferencias en el acceso a los productos. También es interesante ver que departamentos como Guajira y Vaupés, con poca producción agrícola, registraron un aumento fuerte en el IPC, lo que refuerza la idea de que las regiones que dependen de la compra de alimentos de otras zonas son más vulnerables a la inflación.
En general, este gráfico muestra que la inflación afectó más a unos departamentos que a otros, profundizando las brechas territoriales. También es importante notar que la producción agrícola alta no garantiza una inflación baja. Por ejemplo, Magdalena y Cesar tienen una producción considerable pero también enfrentaron un aumento importante en el IPC. Esto puede deberse a que la intermediación, el transporte, y los canales de comercialización influyen más que la producción en sí sobre los precios finales que pagan las familias.
maximos_IPC <- data.frame(Departamento = c("La Guajira", "Norte de Santander", "Magdalena"),
Maximo_IPC= c (Max_IPC_2019, Max_IPC_2020,Max_IPC_2021),
Año= c ("2019","2020","2021"))
ggplot(maximos_IPC, aes(x = paste(Departamento, "(", Año, ")"),
y = Maximo_IPC, fill = Departamento)) +
geom_bar(stat = "identity", width = 0.5) +
geom_text(aes(label = round(Maximo_IPC, 2)), vjust = -0.3, size = 4)+
labs(title = "Valores máximos del IPC: 2019, 2020 y 2021",
x = "Departamento",
y = "Maximo_IPC") +
scale_fill_manual(values = c("La Guajira" = "darkseagreen3", "Norte de Santander" ="darkgoldenrod2", "Magdalena"="darkorange4")) +
theme(legend.position = "none", plot.title = element_text(hjust = 0.5, face = "bold"))Grafica 4
La grafica muestra el valor maximo del IPC por año e indica el departamento correpondiente
En los datos de este diagrama de barras se observa que Magdalena presentó el valor más alto de variación del IPC entre 2019 y 2021, alcanzando un 8.99%, mientras que La Guajira y Norte de Santander registraron variaciones máximas notablemente menores, con 4.79% y 2.89% respectivamente. Esta diferencia refuerza la idea de una baja relación entre las dos variables en cuestión y permite identificar los departamentos que se puede investigar para descubrir los aspectos que las afectan.
PROM_IPC_2019<-mean(SUB1$IPC_2019, na.rm=TRUE)
PROM_IPC_2020<-mean(SUB1$IPC_2020, na.rm=TRUE)
PROM_IPC_2021<-mean(SUB1$IPC_2021, na.rm=TRUE)
promedios_IPC <- data.frame(Año = c("2019","2020","2021"), Promedio = c (PROM_IPC_2019,PROM_IPC_2020,PROM_IPC_2021))
ggplot(promedios_IPC, aes(x = Año, y = Promedio, fill = Año)) +
geom_bar(stat = "identity", width = 0.5) +
geom_text(aes(label = round(Promedio, 2)), vjust = -0.3, size = 4)+
labs(title = "Comparación del IPC: 2019, 2020 y 2021",
x = "Año",
y = "Promedio") +
scale_fill_manual(values = c("2019" = "aquamarine2", "2020" ="lightgoldenrod1", "2021"="darkorange1")) +
theme(legend.position = "none", plot.title = element_text(hjust = 0.5, face = "bold"))Gráfico 5
Al contrastar este dato con la distribución territorial de la producción agrícola, queda en evidencia que incluso en un año con altos niveles de producción concentrada (como se ve en Valle del Cauca, Cauca o Antioquia), la inflación logró alcanzar niveles elevados a nivel nacional. Esto refuerza lo observado anteriormente: no hay una relación directa ni proporcional entre producción agrícola y control de precios, ni a escala regional ni a escala nacional. Además, en 2020, cuando el IPC fue el más bajo del periodo, no se registraron grandes cambios en la distribución de la producción agrícola, lo cual indica que la producción por sí sola no explica las variaciones de los precios entre años.
El análisis conjunto de los promedios nacionales y los datos por departamento sugiere que la dinámica de precios en Colombia responde a una estructura territorial desigual, en la que pocos departamentos sostienen la oferta agrícola, mientras que los demás dependen de ellos. Aun así, esa concentración no garantiza estabilidad de precios, ni protege a las regiones más productoras de experimentar variaciones inflacionarias fuertes. Por tanto, el sistema alimentario colombiano no muestra mecanismos efectivos de autorregulación territorial frente a la inflación, y las regiones con menor producción —como La Guajira, Guainía o Vaupés— siguen siendo las más vulnerables, tanto en oferta como en precios.
En el momento de encontrar correlaciones, el calculo del indice de Pearsons (correlacion lineal) entre la Produccion Agricola (PA) y el IPC de los años 2019 resultan en: 0.257673, lo que indica una relación estadísticamente débil o nula. Esto sugiere, en terminos territoriales, que la soberania alimentaria no es factible. [Ver Tabla de dispersión]
Gráfico 6
No se identifica una correlación directa. Algunos departamentos con alta producción tienen un IPC similar a otros con producción baja
A pesar de la hipótesis inicial, los resultados muestran que no existe una relación clara entre la producción agrícola departamental y la variación del IPC. Esto permite cuestionar si la capacidad productiva regional tiene realmente un efecto protector frente a la inflación alimentaria. La desconexión entre producción y precio puede deberse a la intermediación, la distribución ineficiente, los monopolios de transporte o el centralismo comercial.
Además, la alta concentración de la producción en pocos departamentos refleja un problema estructural: la desigualdad territorial en las capacidades de producir alimentos. Los principales hallazgos fueron los siguientes: 1)No hay una relación estadística fuerte entre producción y precios, 2)La producción agrícola se concentra en pocos territorios, 3) La inflación de alimentos afecta incluso a regiones con alta capacidad productiva.
Estos hallazgos son relevantes para las políticas públicas orientadas a la justicia alimentaria, la planificación territorial y el fortalecimiento del campo colombiano, así como para cumplir los objetivos de paz y reconciliación que son propios del actual plan de gobierno. Sin un sistema de distribución eficiente y justo, la producción local no se traduce en seguridad alimentaria.
Como lineas futuras de investigacion, proponemos las siguientes: 1)Incluir variables como infraestructura, acceso a vías, nivel de comercialización y participación campesina, 2) Realizar estudios cualitativos sobre percepciones locales del precio de los alimentos y 3)Evaluar el impacto de políticas de subsidios o compras públicas sobre los precios regionales.
En cuanto a la posible agenda investigativa que se desprende de este ejercicio exploratorio sobre la participación agrícola de los diferentes departamentos y su relación con la variación en el Índice de Precios al Consumidor es posible rescatar tres líneas. En primer lugar, una que describa por departamentos las tendencias en los productos y mercados con mayor presencia y cómo esto puede estar relacionado con los resultados de participación en la producción agrícola. En segundo lugar, aquellas que integren al análisis otras variables como el costo del transporte, la infraestructura física y vial de las regiones, el acceso a servicios, etc. Por último, la identificación de patrones en aquellos departamentos que tienen más participación agrícola que permitan comprender las dinámicas de los mercados regionales y, así, las posibilidades de mejoramiento e integración a un modelo que priorice la soberanía alimentaria territorializada.