Lectura de datos agropecuarios
Para emepezar, vamos a limpiar la memoria del sistema
rm(list = ls())
Ahora vamos a descargar las librerias necesarias
library(readxl)
library(readr)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Ahora podemos leer los datos del archivo EVA 2019_2025
list.files()
## [1] "BaseAgricola20192025.xlsx" "cacao.jpg"
## [3] "cuaderno_2.html" "cuaderno_2.nb.html"
## [5] "cuaderno_2.Rmd" "Cuaderno3A.nb.html"
## [7] "Cuaderno3A.Rmd" "Datos"
## [9] "eva_2019_2025.csv" "eva_2019_2025.xlsx"
## [11] "MGN2023_MPIO_POLITICO" "MGN2023_MPIO_POLITICO.zip"
## [13] "stder_frutales_2025.csv"
hojas <- excel_sheets("eva_2019_2025.xlsx")
hojas
## [1] "BaseSIPRA"
Sólo hay una página, así que creamos una función que nos permita
leerla
EVA2019_2025 <- read_excel("eva_2019_2025.xlsx")
EVA2019_2025
Ahora que pudimos visualizar los datos de Colombia, seleccionaremos
los correspondientes a Santander
(stder2019_2025 = dplyr::filter(EVA2019_2025,departamento == "Santander" ))
(stder_2025 = dplyr::filter(stder2019_2025, anho == 2025))
stder_2025 %>% group_by(codigoMunicipio, municipio, grupo_especie) %>%
filter(grupo_especie == 'Frutales') %>%
summarize(max_prod = max(produccio, na.rm = TRUE)) %>%
arrange(desc(max_prod)) -> frutales2025
## `summarise()` has regrouped the output.
## ℹ Summaries were computed grouped by codigoMunicipio, municipio, and
## grupo_especie.
## ℹ Output is grouped by codigoMunicipio and municipio.
## ℹ Use `summarise(.groups = "drop_last")` to silence this message.
## ℹ Use `summarise(.by = c(codigoMunicipio, municipio, grupo_especie))` for
## per-operation grouping (`?dplyr::dplyr_by`) instead.
Nos interesan los datos sobre el grupo de los frutales
frutales2025
Vamos a leer el archivo que es de Santander, de 2025 y de
frutales
write_csv(frutales2025, "stder_frutales_2025.csv")
list.files()
## [1] "BaseAgricola20192025.xlsx" "cacao.jpg"
## [3] "cuaderno_2.html" "cuaderno_2.nb.html"
## [5] "cuaderno_2.Rmd" "Cuaderno3A.nb.html"
## [7] "Cuaderno3A.Rmd" "Datos"
## [9] "eva_2019_2025.csv" "eva_2019_2025.xlsx"
## [11] "MGN2023_MPIO_POLITICO" "MGN2023_MPIO_POLITICO.zip"
## [13] "stder_frutales_2025.csv"
los_datos2025 <- read_csv("stder_frutales_2025.csv")
## Rows: 86 Columns: 4
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (2): municipio, grupo_especie
## dbl (2): codigoMunicipio, max_prod
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
los_datos2025
Notamos que los códigos municipales son númericos, no es algo común
así que los convertimos a caracteres
los_datos2025 %>% mutate(codigoMunicipio = as.character(codigoMunicipio)) ->
nuevos_datos2025
Visualizamos los primeros seis municipios del archivo
head(nuevos_datos2025)