En esta sección se estudian las estadisticas agropecuarias del respectivo departamento, en este caso Meta. En base a estos datos, se analiza y se procesa cuales de los cultivos más importantes tienen la mayor producción en el departamento. Durante todo el proceso, se encontrarán miles de datos, los cuales podrán ser filtrados y así, llegar a estudiar solo los datos de interés.
En esta seccion escribimos el codigo para cargar las librerias.
library(tidyverse)
En esta seccion vamos a leer el archivo con los datos de estadísticas agropecuarias municipales y lo describimos.
EVA=read.csv("C:/GB2/CUADERNO_1/EVA.csv")
Revisemos el encabezado de EVA.
head(EVA)
## CÓD...DEP. DEPARTAMENTO CÓD..MUN. MUNICIPIO GRUPO..DE.CULTIVO
## 1 15 BOYACA 15114 BUSBANZA HORTALIZAS
## 2 25 CUNDINAMARCA 25754 SOACHA HORTALIZAS
## 3 25 CUNDINAMARCA 25214 COTA HORTALIZAS
## 4 54 NORTE DE SANTANDER 54405 LOS PATIOS HORTALIZAS
## 5 54 NORTE DE SANTANDER 54518 PAMPLONA HORTALIZAS
## 6 68 SANTANDER 68377 LA BELLEZA HORTALIZAS
## SUBGRUPO..DE.CULTIVO CULTIVO DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO
## 1 ACELGA ACELGA ACELGA
## 2 ACELGA ACELGA ACELGA
## 3 ACELGA ACELGA ACELGA
## 4 ACELGA ACELGA ACELGA
## 5 ACELGA ACELGA ACELGA
## 6 ACELGA ACELGA ACELGA
## AÑO PERIODO Área.Sembrada..ha. Área.Cosechada..ha. Producción..t.
## 1 2006 2006B 2 1 1
## 2 2006 2006B 82 80 1440
## 3 2006 2006B 2 2 26
## 4 2006 2006B 3 3 48
## 5 2006 2006B 1 1 5
## 6 2006 2006B 1 1 6
## Rendimiento..t.ha. ESTADO.FISICO.PRODUCCION NOMBRE..CIENTIFICO
## 1 1.00 FRUTO FRESCO BETA VULGARIS
## 2 18.00 FRUTO FRESCO BETA VULGARIS
## 3 17.33 FRUTO FRESCO BETA VULGARIS
## 4 16.00 FRUTO FRESCO BETA VULGARIS
## 5 10.00 FRUTO FRESCO BETA VULGARIS
## 6 6.00 FRUTO FRESCO BETA VULGARIS
## CICLO.DE.CULTIVO
## 1 TRANSITORIO
## 2 TRANSITORIO
## 3 TRANSITORIO
## 4 TRANSITORIO
## 5 TRANSITORIO
## 6 TRANSITORIO
Revisemos los nombres de los atributos de EVA.
names(EVA)
## [1] "CÓD...DEP."
## [2] "DEPARTAMENTO"
## [3] "CÓD..MUN."
## [4] "MUNICIPIO"
## [5] "GRUPO..DE.CULTIVO"
## [6] "SUBGRUPO..DE.CULTIVO"
## [7] "CULTIVO"
## [8] "DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO"
## [9] "AÑO"
## [10] "PERIODO"
## [11] "Área.Sembrada..ha."
## [12] "Área.Cosechada..ha."
## [13] "Producción..t."
## [14] "Rendimiento..t.ha."
## [15] "ESTADO.FISICO.PRODUCCION"
## [16] "NOMBRE..CIENTIFICO"
## [17] "CICLO.DE.CULTIVO"
Cambiemos los nombres de EVA para una mejor interpretación de los datos.
nombres = c("COD_NDEP", "DEPARTAMENTO", "COD_MUN", "MUNICIPIO", "GRUPO_CULTIVO", "SUB_CULTIVO", "CULTIVO", "DESAG", "YEAR", "PERIODO", "AREA_SIEMBRA", "AREA_COSECHA", "PRODUCCION", "RENDIMIENTO", "ESTADO", "NOMBRE", "CICLO" )
(names(EVA) = nombres)
## [1] "COD_NDEP" "DEPARTAMENTO" "COD_MUN" "MUNICIPIO"
## [5] "GRUPO_CULTIVO" "SUB_CULTIVO" "CULTIVO" "DESAG"
## [9] "YEAR" "PERIODO" "AREA_SIEMBRA" "AREA_COSECHA"
## [13] "PRODUCCION" "RENDIMIENTO" "ESTADO" "NOMBRE"
## [17] "CICLO"
Una vez cambiamos los nombres de los atributos de Eva, el siguiente paso es filtrar los datos a nuestro departamento de interés, que en este caso corresponde al Meta.
meta= dplyr::filter(EVA, DEPARTAMENTO == "META" )
Los datos correspondientes al departamento del Meta son:
head(meta)
## COD_NDEP DEPARTAMENTO COD_MUN MUNICIPIO GRUPO_CULTIVO SUB_CULTIVO
## 1 50 META 50270 EL DORADO FRUTALES AGUACATE
## 2 50 META 50400 LEJANIAS FRUTALES AGUACATE
## 3 50 META 50001 VILLAVICENCIO FRUTALES AGUACATE
## 4 50 META 50313 GRANADA FRUTALES AGUACATE
## 5 50 META 50270 EL DORADO FRUTALES AGUACATE
## 6 50 META 50400 LEJANIAS FRUTALES AGUACATE
## CULTIVO DESAG YEAR PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION
## 1 AGUACATE AGUACATE 2007 2007 64 36 511
## 2 AGUACATE AGUACATE 2007 2007 44 0 0
## 3 AGUACATE AGUACATE 2007 2007 25 0 0
## 4 AGUACATE AGUACATE 2007 2007 4 0 0
## 5 AGUACATE AGUACATE 2008 2008 72 35 490
## 6 AGUACATE AGUACATE 2008 2008 44 0 0
## RENDIMIENTO ESTADO NOMBRE CICLO
## 1 14.19 FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 2 NA FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 3 NA FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 4 NA FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 5 14.00 FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 6 NA FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
meta.tmp <- meta %>% select("COD_MUN": "RENDIMIENTO")
Ya teniendo solo los datos correpondientes al departamento del meta, procedemos a filtrar estos mismo datos, pero ahora solo a las áreas de interés.
head(meta.tmp)
## COD_MUN MUNICIPIO GRUPO_CULTIVO SUB_CULTIVO CULTIVO DESAG YEAR
## 1 50270 EL DORADO FRUTALES AGUACATE AGUACATE AGUACATE 2007
## 2 50400 LEJANIAS FRUTALES AGUACATE AGUACATE AGUACATE 2007
## 3 50001 VILLAVICENCIO FRUTALES AGUACATE AGUACATE AGUACATE 2007
## 4 50313 GRANADA FRUTALES AGUACATE AGUACATE AGUACATE 2007
## 5 50270 EL DORADO FRUTALES AGUACATE AGUACATE AGUACATE 2008
## 6 50400 LEJANIAS FRUTALES AGUACATE AGUACATE AGUACATE 2008
## PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2007 64 36 511 14.19
## 2 2007 44 0 0 NA
## 3 2007 25 0 0 NA
## 4 2007 4 0 0 NA
## 5 2008 72 35 490 14.00
## 6 2008 44 0 0 NA
Podemos observar que los datos filtrados corresponden a distintos periodos de tiempo (años). Para este caso, se requiere unicamente la lectura de los datos mas recientes, por lo que se procede a consultar a que años pertenecen los datos filtrados anteriormente.
unique(meta.tmp$YEAR)
## [1] 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2006
Los datos filtrados correponden a un periodo de tiempo entre el 2006 y el 2018, por lo que el siguiente paso consiste en filtrar los datos para unicamente hacer la lectura de los mas recientes (2018).
meta2018 = dplyr::filter(meta.tmp, YEAR == 2018)
Estadisticas agropecuarias del departamento del Meta correspondientes al 2018.
head (meta2018)
## COD_MUN MUNICIPIO GRUPO_CULTIVO SUB_CULTIVO CULTIVO DESAG YEAR
## 1 50330 MESETAS FRUTALES AGUACATE AGUACATE AGUACATE 2018
## 2 50313 GRANADA FRUTALES AGUACATE AGUACATE AGUACATE 2018
## 3 50683 SAN JUAN DE ARAMA FRUTALES AGUACATE AGUACATE AGUACATE 2018
## 4 50711 VISTA HERMOSA FRUTALES AGUACATE AGUACATE AGUACATE 2018
## 5 50400 LEJANIAS FRUTALES AGUACATE AGUACATE AGUACATE 2018
## 6 50270 EL DORADO FRUTALES AGUACATE AGUACATE AGUACATE 2018
## PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2018 356 356 4984 14
## 2 2018 284 249 3486 14
## 3 2018 258 248 992 4
## 4 2018 201 91 1729 19
## 5 2018 195 185 2035 11
## 6 2018 147 79 316 4
En esta sección se analizan los datos resultantes de todos los procesos de filtro realizados anteriormente. Se estudiará la producción total de los distintos cultivos ubicados en el departamento del Meta.
meta2018 %>%
filter(PRODUCCION > 0) %>%
group_by(CULTIVO) %>%
summarize(total_produccion = sum(PRODUCCION)) %>%
arrange(desc(total_produccion))
## # A tibble: 40 × 2
## CULTIVO total_produccion
## <chr> <int>
## 1 CAÑA AZUCARERA 2315889
## 2 PALMA DE ACEITE 723236
## 3 PLATANO 458395
## 4 MAIZ 308441
## 5 ARROZ 272516
## 6 YUCA 178421
## 7 PIÑA 126800
## 8 SOYA 112040
## 9 CITRICOS 104791
## 10 PATILLA 71284
## # … with 30 more rows
A continuacion, se analizará en que municipios se encuentran los cultivos y cual es su produccion total, partiendo desde la mayor hasta la menor.
meta2018 %>%
group_by(CULTIVO, MUNICIPIO) %>%
summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
slice(which.max(max_prod)) %>%
arrange(desc(max_prod))
## `summarise()` has grouped output by 'CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 41 × 3
## # Groups: CULTIVO [41]
## CULTIVO MUNICIPIO max_prod
## <chr> <chr> <int>
## 1 CAÑA AZUCARERA PUERTO LOPEZ 2315889
## 2 MAIZ PUERTO GAITAN 184534
## 3 PLATANO FUENTE DE ORO 153250
## 4 PALMA DE ACEITE PUERTO GAITAN 111246
## 5 SOYA PUERTO GAITAN 100500
## 6 YUCA FUENTE DE ORO 72259
## 7 PIÑA PUERTO RICO 54675
## 8 ARROZ FUENTE DE ORO 48823
## 9 PATILLA SAN MARTIN 45150
## 10 CITRICOS LEJANIAS 34484
## # … with 31 more rows
Luego de analizar los cultivos y en que municipios se encuentra su producción máxima, se pasará de un cultivo especifico a un grupo de cultivo y de la misma forma se indicará en que municipio se da su producción máxima.
meta2018 %>%
group_by(GRUPO_CULTIVO,MUNICIPIO) %>%
summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
slice(which.max(max_prod)) %>%
arrange(desc(max_prod))
## `summarise()` has grouped output by 'GRUPO_CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 9 × 3
## # Groups: GRUPO_CULTIVO [9]
## GRUPO_CULTIVO MUNICIPIO max_prod
## <chr> <chr> <int>
## 1 OTROS PERMANENTES PUERTO LOPEZ 2315889
## 2 CEREALES PUERTO GAITAN 184534
## 3 TUBERCULOS Y PLATANOS FUENTE DE ORO 153250
## 4 OLEAGINOSAS PUERTO GAITAN 111246
## 5 LEGUMINOSAS PUERTO GAITAN 100500
## 6 FRUTALES PUERTO RICO 54675
## 7 HORTALIZAS SAN MARTIN 6500
## 8 FORESTALES PUERTO LOPEZ 1950
## 9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES ACACIAS 8
A continuación, se procesa y se analizan los datos del grupo del cultivo con mayor producción en el departamento del Meta, en que municipios se encuentran y su respectivo código. Dicha producción se organiza descendentemente.
meta2018 %>%
group_by(COD_MUN, MUNICIPIO, GRUPO_CULTIVO) %>%
filter(GRUPO_CULTIVO =='OTROS PERMANENTES') %>%
summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
arrange(desc(max_prod)) -> OTROS2018
OTROS2018
## # A tibble: 29 × 4
## # Groups: COD_MUN, MUNICIPIO [29]
## COD_MUN MUNICIPIO GRUPO_CULTIVO max_prod
## <int> <chr> <chr> <int>
## 1 50573 PUERTO LOPEZ OTROS PERMANENTES 2315889
## 2 50330 MESETAS OTROS PERMANENTES 1646
## 3 50400 LEJANIAS OTROS PERMANENTES 1430
## 4 50350 LA MACARENA OTROS PERMANENTES 900
## 5 50711 VISTA HERMOSA OTROS PERMANENTES 794
## 6 50313 GRANADA OTROS PERMANENTES 621
## 7 50245 EL CALVARIO OTROS PERMANENTES 600
## 8 50370 LA URIBE OTROS PERMANENTES 520
## 9 50686 SAN JUANITO OTROS PERMANENTES 416
## 10 50223 SAN LUIS DE CUBARRAL OTROS PERMANENTES 408
## # … with 19 more rows
Al igual que con el primer grupo de cultivo, se procesa el segundo grupo, que en este caso es CEREALES, para esto se analizan aspectos como, producción total, municipios en los que se da y su respectivo código.
meta2018 %>%
group_by(COD_MUN, MUNICIPIO, GRUPO_CULTIVO) %>%
filter(GRUPO_CULTIVO =='CEREALES') %>%
summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
arrange(desc(max_prod)) -> CEREALES2018
CEREALES2018
## # A tibble: 27 × 4
## # Groups: COD_MUN, MUNICIPIO [27]
## COD_MUN MUNICIPIO GRUPO_CULTIVO max_prod
## <int> <chr> <chr> <int>
## 1 50568 PUERTO GAITAN CEREALES 184534
## 2 50287 FUENTE DE ORO CEREALES 48823
## 3 50573 PUERTO LOPEZ CEREALES 43209
## 4 50001 VILLAVICENCIO CEREALES 33307
## 5 50313 GRANADA CEREALES 19322
## 6 50226 CUMARAL CEREALES 16388
## 7 50124 CABUYARO CEREALES 14104
## 8 50577 PUERTO LLERAS CEREALES 11291
## 9 50711 VISTA HERMOSA CEREALES 7923
## 10 50606 RESTREPO CEREALES 6617
## # … with 17 more rows
Finalmente se guardan los respectivos datos de los dos grupos de cultivo más relevantes del departamento del Meta.
#write_csv(OTROS2018, "C:/GB2/CUADERNO_1/OTROS2018.csv")
write_csv(CEREALES2018, "C:/GB2/CUADERNO_1/CEREALES2018.csv")
Cuaderno realizado en base a: Lizarazo, I. Reading and processing municipal agricultural statistics for 2020. https://rpubs.com/ials2un/readingEVAv1.
sessionInfo()
## R version 4.2.1 Patched (2022-09-21 r82893 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 22000)
##
## Matrix products: default
##
## locale:
## [1] LC_COLLATE=Spanish_Colombia.utf8 LC_CTYPE=Spanish_Colombia.utf8
## [3] LC_MONETARY=Spanish_Colombia.utf8 LC_NUMERIC=C
## [5] LC_TIME=Spanish_Colombia.utf8
##
## attached base packages:
## [1] stats graphics grDevices utils datasets methods base
##
## other attached packages:
## [1] lubridate_1.9.2 forcats_1.0.0 stringr_1.5.0 dplyr_1.1.0
## [5] purrr_1.0.1 readr_2.1.4 tidyr_1.3.0 tibble_3.2.0
## [9] ggplot2_3.4.1 tidyverse_2.0.0
##
## loaded via a namespace (and not attached):
## [1] bslib_0.4.2 compiler_4.2.1 pillar_1.8.1 jquerylib_0.1.4
## [5] tools_4.2.1 bit_4.0.5 digest_0.6.31 timechange_0.2.0
## [9] jsonlite_1.8.4 evaluate_0.20 lifecycle_1.0.3 gtable_0.3.1
## [13] pkgconfig_2.0.3 rlang_1.1.0 cli_3.6.0 rstudioapi_0.14
## [17] parallel_4.2.1 yaml_2.3.7 xfun_0.37 fastmap_1.1.1
## [21] withr_2.5.0 knitr_1.42 hms_1.1.2 generics_0.1.3
## [25] vctrs_0.6.0 sass_0.4.5 bit64_4.0.5 grid_4.2.1
## [29] tidyselect_1.2.0 glue_1.6.2 R6_2.5.1 fansi_1.0.4
## [33] vroom_1.6.1 rmarkdown_2.20 tzdb_0.3.0 magrittr_2.0.3
## [37] ellipsis_0.3.2 scales_1.2.1 htmltools_0.5.4 colorspace_2.1-0
## [41] utf8_1.2.3 stringi_1.7.12 munsell_0.5.0 cachem_1.0.7
## [45] crayon_1.5.2