Lectura de datos agropecuarios

Para emepezar, vamos a limpiar la memoria del sistema

rm(list = ls())

Ahora vamos a descargar las librerias necesarias

library(readxl)
library(readr)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Ahora podemos leer los datos del archivo EVA 2019_2025

list.files()
##  [1] "BaseAgricola20192025.xlsx" "cacao.jpg"                
##  [3] "cuaderno_2.html"           "cuaderno_2.nb.html"       
##  [5] "cuaderno_2.Rmd"            "Cuaderno3A.nb.html"       
##  [7] "Cuaderno3A.Rmd"            "Datos"                    
##  [9] "eva_2019_2025.csv"         "eva_2019_2025.xlsx"       
## [11] "MGN2023_MPIO_POLITICO"     "MGN2023_MPIO_POLITICO.zip"
## [13] "stder_frutales_2025.csv"
hojas <- excel_sheets("eva_2019_2025.xlsx")
hojas
## [1] "BaseSIPRA"

Sólo hay una página, así que creamos una función que nos permita leerla

EVA2019_2025 <- read_excel("eva_2019_2025.xlsx")
EVA2019_2025

Ahora que pudimos visualizar los datos de Colombia, seleccionaremos los correspondientes a Santander

(stder2019_2025 = dplyr::filter(EVA2019_2025,departamento == "Santander" ))
(stder_2025 = dplyr::filter(stder2019_2025, anho == 2025))
stder_2025 %>% group_by(codigoMunicipio, municipio, grupo_especie) %>% 
  filter(grupo_especie == 'Frutales') %>% 
  summarize(max_prod = max(produccio, na.rm = TRUE)) %>%
  arrange(desc(max_prod)) -> frutales2025
## `summarise()` has regrouped the output.
## ℹ Summaries were computed grouped by codigoMunicipio, municipio, and
##   grupo_especie.
## ℹ Output is grouped by codigoMunicipio and municipio.
## ℹ Use `summarise(.groups = "drop_last")` to silence this message.
## ℹ Use `summarise(.by = c(codigoMunicipio, municipio, grupo_especie))` for
##   per-operation grouping (`?dplyr::dplyr_by`) instead.

Nos interesan los datos sobre el grupo de los frutales

frutales2025

Vamos a leer el archivo que es de Santander, de 2025 y de frutales

write_csv(frutales2025, "stder_frutales_2025.csv")
list.files()
##  [1] "BaseAgricola20192025.xlsx" "cacao.jpg"                
##  [3] "cuaderno_2.html"           "cuaderno_2.nb.html"       
##  [5] "cuaderno_2.Rmd"            "Cuaderno3A.nb.html"       
##  [7] "Cuaderno3A.Rmd"            "Datos"                    
##  [9] "eva_2019_2025.csv"         "eva_2019_2025.xlsx"       
## [11] "MGN2023_MPIO_POLITICO"     "MGN2023_MPIO_POLITICO.zip"
## [13] "stder_frutales_2025.csv"
los_datos2025 <- read_csv("stder_frutales_2025.csv")
## Rows: 86 Columns: 4
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (2): municipio, grupo_especie
## dbl (2): codigoMunicipio, max_prod
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
los_datos2025

Notamos que los códigos municipales son númericos, no es algo común así que los convertimos a caracteres

los_datos2025 %>% mutate(codigoMunicipio = as.character(codigoMunicipio)) ->
nuevos_datos2025

Visualizamos los primeros seis municipios del archivo

head(nuevos_datos2025)