1. Introducción

Este cuaderno ilustra cómo leer y filtrar datos de estadísticas agrícolas del archivo EVA 2019-2025 proporcionado por UPRA, enfocándose en el departamento del Putumayo y específicamente en el grupo de Cultivos Tropicales Tradicionales para el año 2022.

2. Configuración

Limpiamos la memoria y cargamos las librerías necesarias:

rm(list = ls())
setwd("C:/Users/ASUS/OneDrive/Documents/unal/GB2/proyecto 4")
library(readxl)
library(readr)
library(dplyr)

3. Lectura de datos

Verificamos los archivos disponibles en el directorio de trabajo:

list.files()
## [1] "~$BaseAgricola20192025.xlsx"              
## [2] "BaseAgricola20192025 - Eva 1.xlsx"        
## [3] "BaseAgricola20192025.xlsx"                
## [4] "BaseAgricola20192025.xlsx - BaseSIPRA.csv"
## [5] "Mi_segundo_cuaderno.html"                 
## [6] "Mi_segundo_cuaderno.Rmd"                  
## [7] "put_tropicales_2022.csv"

Revisamos las hojas disponibles en el archivo Excel:

hojas <- excel_sheets("BaseAgricola20192025 - Eva 1.xlsx")
hojas
## [1] "BaseSIPRA"

Leemos la hoja BaseSIPRA:

EVA19_25 <- read_excel("BaseAgricola20192025 - Eva 1.xlsx", sheet = "BaseSIPRA")
head(EVA19_25)

4. Exploración de los datos

Verificamos los nombres de las columnas disponibles:

names(EVA19_25)
##  [1] "codigoDepartamento"    "departamento"          "codigoMunicipio"      
##  [4] "municipio"             "especie"               "nombre_tipo_ciclo"    
##  [7] "grupo_especie"         "anho"                  "Periodo"              
## [10] "AreaSembrada"          "AreaCosechada"         "produccio"            
## [13] "rendimiento"           "cod_cultiv"            "EstadoFisicoProduccio"
## [16] "Clasifica_grupo"

Revisamos los departamentos disponibles en el dataset:

unique(EVA19_25$departamento)
##  [1] "Antioquia"                                               
##  [2] "Atlántico"                                               
##  [3] "Bolívar"                                                 
##  [4] "Boyacá"                                                  
##  [5] "Caldas"                                                  
##  [6] "Caquetá"                                                 
##  [7] "Cauca"                                                   
##  [8] "Cesar"                                                   
##  [9] "Córdoba"                                                 
## [10] "Cundinamarca"                                            
## [11] "Chocó"                                                   
## [12] "Huila"                                                   
## [13] "La Guajira"                                              
## [14] "Magdalena"                                               
## [15] "Meta"                                                    
## [16] "Nariño"                                                  
## [17] "Norte de Santander"                                      
## [18] "Quindío"                                                 
## [19] "Risaralda"                                               
## [20] "Santander"                                               
## [21] "Sucre"                                                   
## [22] "Tolima"                                                  
## [23] "Valle del Cauca"                                         
## [24] "Arauca"                                                  
## [25] "Casanare"                                                
## [26] "Putumayo"                                                
## [27] "Archipiélago de San Andrés, Providencia y Santa Catalina"
## [28] "Amazonas"                                                
## [29] "Guainía"                                                 
## [30] "Guaviare"                                                
## [31] "Vaupés"                                                  
## [32] "Vichada"

5. Filtrado de datos del Putumayo

5.1 Filtrar por departamento

Filtramos los registros correspondientes al departamento del Putumayo:

put19_25 <- dplyr::filter(EVA19_25, departamento == "Putumayo")

El dataset del Putumayo contiene 1386 registros entre 2019 y 2025.

5.2 Filtrar por año

Filtramos únicamente los datos del año 2022:

put_22 <- dplyr::filter(put19_25, anho == 2022)

Para el año 2022 hay 196 registros en el Putumayo.

5.3 Grupos de cultivos disponibles

Revisamos los grupos de cultivos disponibles en el Putumayo para 2022:

unique(put_22$grupo_especie)
## [1] "Cultivos tropicales tradicionales"                          
## [2] "Frutales"                                                   
## [3] "Cereales"                                                   
## [4] "Oleaginosas"                                                
## [5] "Raíces y tubérculos"                                        
## [6] "Leguminosas"                                                
## [7] "Hortalizas"                                                 
## [8] "Cultivos para condimentos, bebidas medicinales y aromáticas"

6. Análisis de Cultivos Tropicales Tradicionales

Filtramos el grupo de Cultivos Tropicales Tradicionales y resumimos la producción máxima por municipio:

put_22 %>%
  group_by(codigoMunicipio, municipio, grupo_especie) %>%
  filter(grupo_especie == 'Cultivos tropicales tradicionales') %>%
  summarize(max_prod = max(produccio, na.rm = TRUE)) %>%
  arrange(desc(max_prod)) -> tropicales2022
## `summarise()` has regrouped the output.
## ℹ Summaries were computed grouped by codigoMunicipio, municipio, and
##   grupo_especie.
## ℹ Output is grouped by codigoMunicipio and municipio.
## ℹ Use `summarise(.groups = "drop_last")` to silence this message.
## ℹ Use `summarise(.by = c(codigoMunicipio, municipio, grupo_especie))` for
##   per-operation grouping (`?dplyr::dplyr_by`) instead.
tropicales2022

El municipio con mayor producción de cultivos tropicales tradicionales en 2022 es Orito con 1.2^{4} toneladas.

7. Guardar los datos

Guardamos los resultados en formato CSV:

write_csv(tropicales2022, "put_tropicales_2022.csv")

# Verificar que se creó
list.files(pattern = "csv")
## [1] "BaseAgricola20192025.xlsx - BaseSIPRA.csv"
## [2] "put_tropicales_2022.csv"

Leemos el archivo para verificar que los datos son correctos:

los_datos22 <- read_csv("put_tropicales_2022.csv")
head(los_datos22)

Convertimos el código de municipio a tipo character:

los_datos22 %>% 
  mutate(codigoMunicipio = as.character(codigoMunicipio)) -> nuevos_datos22
head(nuevos_datos22)

8. Entorno de trabajo

sessionInfo()
## R version 4.6.0 (2026-04-24 ucrt)
## Platform: x86_64-w64-mingw32/x64
## Running under: Windows 11 x64 (build 26200)
## 
## Matrix products: default
##   LAPACK version 3.12.1
## 
## locale:
## [1] LC_COLLATE=Spanish_Colombia.utf8  LC_CTYPE=Spanish_Colombia.utf8   
## [3] LC_MONETARY=Spanish_Colombia.utf8 LC_NUMERIC=C                     
## [5] LC_TIME=Spanish_Colombia.utf8    
## 
## time zone: America/Bogota
## tzcode source: internal
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
## [1] dplyr_1.2.1  readr_2.2.0  readxl_1.5.0
## 
## loaded via a namespace (and not attached):
##  [1] crayon_1.5.3      vctrs_0.7.3       cli_3.6.6         knitr_1.51       
##  [5] rlang_1.2.0       xfun_0.57         generics_0.1.4    jsonlite_2.0.0   
##  [9] bit_4.6.0         glue_1.8.1        htmltools_0.5.9   sass_0.4.10      
## [13] hms_1.1.4         rmarkdown_2.31    cellranger_1.1.0  evaluate_1.0.5   
## [17] jquerylib_0.1.4   tibble_3.3.1      tzdb_0.5.0        fastmap_1.2.0    
## [21] yaml_2.3.12       lifecycle_1.0.5   compiler_4.6.0    pkgconfig_2.0.3  
## [25] rstudioapi_0.18.0 digest_0.6.39     R6_2.6.1          tidyselect_1.2.1 
## [29] parallel_4.6.0    vroom_1.7.1       pillar_1.11.1     magrittr_2.0.5   
## [33] bslib_0.10.0      bit64_4.8.0       tools_4.6.0       cachem_1.1.0

9. Especie destacada: Puerto Leguízamo

El municipio de Puerto Leguízamo es el segundo mayor productor de cultivos tropicales tradicionales en el Putumayo. Su especie más representativa es el plátano, con una producción de 12.042 toneladas en 2022.

Platano, especie más producida en Puerto Leguízamo
Platano, especie más producida en Puerto Leguízamo

El plátano (Musa paradisiaca) es uno de los cultivos más importantes para la seguridad alimentaria y la economía campesina de la región amazónica colombiana. Se cultiva principalmente de forma tradicional por comunidades indígenas y campesinas, quienes lo destinan tanto al autoconsumo como a la comercialización local. Este cultivo se adapta muy bien a las condiciones climáticas de Puerto Leguízamo, caracterizadas por alta precipitación (entre 3.000 y 4.000 mm anuales), temperaturas cálidas que oscilan entre 24°C y 28°C, y suelos con alta humedad propios de la Amazonía colombiana. Además de su valor alimenticio, el plátano cumple un papel importante en los sistemas productivos agroforestales de la región, donde se intercala con otros cultivos como el cacao y la yuca.

Referencias: