Antes de iniciar cualquier análisis, es fundamental cargar las herramientas necesarias. Usaremos el ecosistema tidyverse (que incluye dplyr, readr y ggplot2) para la manipulación, limpieza y visualización eficiente de los datos.
Procedemos a cargar la base de datos completa de las Evaluaciones Agropecuarias Municipales (EVA) desde la ruta local. Inmediatamente realizamos un filtro para aislar únicamente las observaciones correspondientes al departamento del Cauca, que es nuestro objeto de estudio.
# Carga de datos desde la ruta local
eva <- read.csv("C:\\Users\\pc\\OneDrive\\Documentos\\GB2\\RSTUDIO\\cuaderno1\\data\\Evaluaciones_Agropecuarias_Municipales_EVA.csv")
# Filtrado exclusivo por departamento
cauca <- eva %>%
filter(DEPARTAMENTO == "CAUCA")
# Vista previa de las primeras filas
kable(head(cauca[, 1:4]), caption = "Tabla 1. Vista previa de los datos")| CÓD…DEP. | DEPARTAMENTO | CÓD..MUN. | MUNICIPIO |
|---|---|---|---|
| 19 | CAUCA | 19.392 | LA SIERRA |
| 19 | CAUCA | 19.392 | LA SIERRA |
| 19 | CAUCA | 19.392 | LA SIERRA |
| 19 | CAUCA | 19.110 | BUENOS AIRES |
| 19 | CAUCA | 19.110 | BUENOS AIRES |
| 19 | CAUCA | 19.513 | PADILLA |
La tabla original contiene columnas con espacios, puntos y caracteres especiales que dificultan la escritura, seleccionamos las variables esenciales y las renombramos a un formato estándar más legible.
# Selección de columnas de interés
cauca %>% dplyr::select("CÓD..MUN." : "ESTADO.FISICO.PRODUCCION") -> eva.tmp
# Renombramiento de variables a formato limpio
new_eva <- eva.tmp %>%
dplyr::rename(
Cod_Mun = "CÓD..MUN.",
Grupo = "GRUPO..DE.CULTIVO",
Subgrupo = "SUBGRUPO..DE.CULTIVO",
Year = "AÑO",
AreaSembrada = "Área.Sembrada..ha.",
AreaCosechada = "Área.Cosechada..ha.",
Produccion = "Producción..t.",
Rendimiento = "Rendimiento..t.ha.",
Sistema = "DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO",
Estado = "ESTADO.FISICO.PRODUCCION"
)
kable(head(new_eva[, 1:4]), caption = "Tabla 2. Vista previa de los datos")| Cod_Mun | MUNICIPIO | Grupo | Subgrupo |
|---|---|---|---|
| 19.392 | LA SIERRA | HORTALIZAS | ACELGA |
| 19.392 | LA SIERRA | HORTALIZAS | ACELGA |
| 19.392 | LA SIERRA | HORTALIZAS | ACELGA |
| 19.110 | BUENOS AIRES | HORTALIZAS | ACELGA |
| 19.110 | BUENOS AIRES | HORTALIZAS | ACELGA |
| 19.513 | PADILLA | HORTALIZAS | ACELGA |
En esta sección consolidaremos la producción total. Primero, nos aseguramos de transformar la variable Produccion a formato numérico para permitir operaciones aritméticas. Posteriormente, filtramos valores en cero y agrupamos las toneladas acumuladas.
# Transformación a tipo numérico
new_eva <- new_eva %>%
dplyr::mutate(Produccion = as.numeric(Produccion))
# Agrupación y ordenamiento de la producción total departamental
new_eva %>%
dplyr::filter(Produccion > 0) %>%
dplyr::group_by(Grupo) %>%
dplyr::summarise(total_produccion = sum(Produccion, na.rm = TRUE)) %>%
dplyr::arrange(dplyr::desc(total_produccion))## # A tibble: 11 × 2
## Grupo total_produccion
## <chr> <dbl>
## 1 TUBERCULOS Y PLATANOS 215876.
## 2 OTROS PERMANENTES 208899.
## 3 FRUTALES 208576.
## 4 CEREALES 167942.
## 5 HORTALIZAS 163167.
## 6 LEGUMINOSAS 72915.
## 7 FIBRAS 15255.
## 8 FLORES Y FOLLAJES 13564
## 9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES 2117
## 10 OLEAGINOSAS 2057.
## 11 OTROS TRANSITORIOS 198
# Almacenamiento en una nueva variable para análisis gráfico
new_eva %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion, na.rm = TRUE)) -> TOTAL_CULTIVOInterpretación:
la tabla resultante nos proporciona de forma inmediata la jerarquía económica del agro en el Cauca. Permite identificar cuáles familias de cultivos representan el verdadero volumen comercial.
Para refinar el análisis visual y evitar que categorías muy pequeñas o marginales saturen los gráficos, realizamos una acotación seleccionando solo los grupos de cultivos cuya producción acumulada supera las 100,000 toneladas. Asimismo, calculamos la participación porcentual (percent) de cada uno sobre el total global.
# Construcción del gráfico de barras base
bp <- ggplot(TOTAL_CULTIVO, aes(x = "", y = percent, fill = Grupo)) +
geom_bar(width = 1, stat = "identity") +
theme_minimal() +
labs(title = "Participación Porcentual por Grupo de Cultivo", x = "", y = "")
# Transformación geométrica a gráfico circular
pie <- bp + coord_polar("y", start = 0)
pieA nivel subregional, resulta estratégico descubrir cuáles municipios actúan como los principales núcleos productivos. El siguiente bloque extrae matemáticamente el grupo de cultivo más fuerte de cada municipio y filtra únicamente a aquellos municipios catalogados como “leaders”.
new_eva %>%
group_by(Grupo, MUNICIPIO) %>%
summarize(total_prod = sum(Produccion, na.rm = TRUE), .groups = 'drop') %>%
group_by(MUNICIPIO) %>%
slice(which.max(total_prod)) -> leaders# Gráfico de barras para los 6 municipios principales
# reorder() coloca automáticamente a EL TAMBO primero por tener la mayor producción
p <- ggplot(data = mein.leaders, aes(x = reorder(MUNICIPIO, -total_prod), y = total_prod, fill = Grupo)) +
geom_bar(stat = "identity", color = "black") +
theme_minimal() +
labs(title = "Principales Municipios Líderes en Producción Agrícola",
x = "Municipio",
y = "Producción Total (Toneladas)",
fill = "Grupo de Cultivo")
p
Se evidencia visualmente que El Tambo lidera con una diferencia abismal
el volumen de producción agrícola en comparación con Guachené, Miranda,
Patía, Silvia y Sotará. Esto confirma que El Tambo actúa como el
principal motor agropecuario del departamento en los sectores
evaluados.
El café no es solamente un indicador económico en el departamento del Cauca, sino un eje fundamental del tejido social y de ordenamiento del territorio. En este apartado realizamos un acercamiento histórico detallado centrándonos de manera exclusiva en el comportamiento de este cultivo en el municipio de Argelia durante una década crítica.
# Aislamiento histórico de datos para café en Argelia
new_eva %>%
filter(MUNICIPIO == "ARGELIA" & CULTIVO == "CAFE") %>%
group_by(Year, CULTIVO) %>%
select(MUNICIPIO, CULTIVO, Produccion, Year) -> CAFE_ARGELIARepresentamos la evolución cronológica del volumen de café (expresado en miles de toneladas para facilitar la lectura visual de la escala) mediante un gráfico de barras temporales
# Gráfico cronológico de barras con color temático
g <- ggplot(aes(x = Year, y = Produccion / 1000), data = CAFE_ARGELIA) +
geom_bar(stat = 'identity') +
theme_minimal() +
labs(title = "Evolución de la Producción de Café en Argelia (2007 - 2018)",
y = 'Producción de Café [Ton x 1000]',
x = 'Año',
caption = "Fuente: Datos EVA (Ministerio de Agricultura y Desarrollo Rural)")
gLas marcadas anomalías en el registro de producción de café en el municipio de Argelia entre los años 2007 y 2018 obedecen a un complejo entramado socioeconómico y geopolítico ligado al conflicto armado en el suroccidente colombiano.
Durante este periodo, la subregión del Cañón del Micay y el municipio de Argelia padecieron una fuerte agudización de confrontaciones entre actores armados ilegales por el control territorial. Esto afectó los datos gubernamentales de dos formas directas.