En el contenido de este cuaderno encontraremos información estadistica sobre el departamento de Antioquia en donde analizaremos cuales son los cultivos con mayor produccion en el departamento y asi mismo realizar los filtros pertinentes para determinar los datos de nuestro interes.
En esta seccion esbribimos el codigo para cargar las librerias
library(tidyverse)
library(dplyr)
En esta seccion vamos a leer el archivo con los datos de estadisticas agropecuarias y lo describimos
EVA=read.csv("C:/CUADERNO1/EVA.csv")
Revisemos encabezado de EVA
head(EVA)
## CÓD...DEP. DEPARTAMENTO CÓD..MUN. MUNICIPIO GRUPO..DE.CULTIVO
## 1 15 BOYACA 15114 BUSBANZA HORTALIZAS
## 2 25 CUNDINAMARCA 25754 SOACHA HORTALIZAS
## 3 25 CUNDINAMARCA 25214 COTA HORTALIZAS
## 4 54 NORTE DE SANTANDER 54405 LOS PATIOS HORTALIZAS
## 5 54 NORTE DE SANTANDER 54518 PAMPLONA HORTALIZAS
## 6 68 SANTANDER 68377 LA BELLEZA HORTALIZAS
## SUBGRUPO..DE.CULTIVO CULTIVO DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO
## 1 ACELGA ACELGA ACELGA
## 2 ACELGA ACELGA ACELGA
## 3 ACELGA ACELGA ACELGA
## 4 ACELGA ACELGA ACELGA
## 5 ACELGA ACELGA ACELGA
## 6 ACELGA ACELGA ACELGA
## AÑO PERIODO Área.Sembrada..ha. Área.Cosechada..ha. Producción..t.
## 1 2006 2006B 2 1 1
## 2 2006 2006B 82 80 1440
## 3 2006 2006B 2 2 26
## 4 2006 2006B 3 3 48
## 5 2006 2006B 1 1 5
## 6 2006 2006B 1 1 6
## Rendimiento..t.ha. ESTADO.FISICO.PRODUCCION NOMBRE..CIENTIFICO
## 1 1.00 FRUTO FRESCO BETA VULGARIS
## 2 18.00 FRUTO FRESCO BETA VULGARIS
## 3 17.33 FRUTO FRESCO BETA VULGARIS
## 4 16.00 FRUTO FRESCO BETA VULGARIS
## 5 10.00 FRUTO FRESCO BETA VULGARIS
## 6 6.00 FRUTO FRESCO BETA VULGARIS
## CICLO.DE.CULTIVO
## 1 TRANSITORIO
## 2 TRANSITORIO
## 3 TRANSITORIO
## 4 TRANSITORIO
## 5 TRANSITORIO
## 6 TRANSITORIO
revisemos los nombres de los atributos de EVA
names(EVA)
## [1] "CÓD...DEP."
## [2] "DEPARTAMENTO"
## [3] "CÓD..MUN."
## [4] "MUNICIPIO"
## [5] "GRUPO..DE.CULTIVO"
## [6] "SUBGRUPO..DE.CULTIVO"
## [7] "CULTIVO"
## [8] "DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO"
## [9] "AÑO"
## [10] "PERIODO"
## [11] "Área.Sembrada..ha."
## [12] "Área.Cosechada..ha."
## [13] "Producción..t."
## [14] "Rendimiento..t.ha."
## [15] "ESTADO.FISICO.PRODUCCION"
## [16] "NOMBRE..CIENTIFICO"
## [17] "CICLO.DE.CULTIVO"
Cambiemos los nombres de EVA para una mejor interpretación de los datos
nombres=c("COD_DEP","DEP","COD_MUN","MUN","GRUPO_CULTIVO", "SUBGRUPO CULTIVO","CULTIVO","DESAG","YEAR","PERIODO","AREA_SEMBRADA","AREA_COSECHA","PRODUCCION","RENDIMIENTO","ESTADO","NOMBRE","CICLO")
(names(EVA)=nombres)
## [1] "COD_DEP" "DEP" "COD_MUN" "MUN"
## [5] "GRUPO_CULTIVO" "SUBGRUPO CULTIVO" "CULTIVO" "DESAG"
## [9] "YEAR" "PERIODO" "AREA_SEMBRADA" "AREA_COSECHA"
## [13] "PRODUCCION" "RENDIMIENTO" "ESTADO" "NOMBRE"
## [17] "CICLO"
Una vez que hemos cambiado el nombre del atributo Eva, el siguiente paso es filtrar los datos al sector que nos interesa, que en este caso corresponde al departamento de Antioquia.
antioquia = dplyr::filter(EVA, DEP == "ANTIOQUIA")
Los datos correspondientes al departamento de Antioquia son:
head(antioquia)
## COD_DEP DEP COD_MUN MUN GRUPO_CULTIVO SUBGRUPO CULTIVO
## 1 5 ANTIOQUIA 5440 MARINILLA HORTALIZAS ACELGA
## 2 5 ANTIOQUIA 5440 MARINILLA HORTALIZAS ACELGA
## 3 5 ANTIOQUIA 5440 MARINILLA HORTALIZAS ACELGA
## 4 5 ANTIOQUIA 5440 MARINILLA HORTALIZAS ACELGA
## 5 5 ANTIOQUIA 5440 MARINILLA HORTALIZAS ACELGA
## 6 5 ANTIOQUIA 5475 MURINDO TUBERCULOS Y PLATANOS MALANGA
## CULTIVO DESAG YEAR PERIODO AREA_SEMBRADA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 ACELGA ACELGA 2016 2016A 11 11 297 27.00
## 2 ACELGA ACELGA 2016 2016B 11 11 297 27.00
## 3 ACELGA ACELGA 2017 2017A 9 9 243 27.00
## 4 ACELGA ACELGA 2017 2017B 15 15 422 28.10
## 5 ACELGA ACELGA 2018 2018A 10 10 277 27.68
## 6 MALANGA ACHIN 2011 2011 6 6 209 37.40
## ESTADO NOMBRE CICLO
## 1 FRUTO FRESCO BETA VULGARIS TRANSITORIO
## 2 FRUTO FRESCO BETA VULGARIS TRANSITORIO
## 3 FRUTO FRESCO BETA VULGARIS TRANSITORIO
## 4 FRUTO FRESCO BETA VULGARIS TRANSITORIO
## 5 FRUTO FRESCO BETA VULGARIS TRANSITORIO
## 6 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
antioquia.tmp = antioquia %>% select ("COD_MUN":"RENDIMIENTO")
En esta seccion procedemos a filtrar los datos correspondientes al departamento de Antioquia pero soalente las areas de interes.
head(antioquia.tmp)
## COD_MUN MUN GRUPO_CULTIVO SUBGRUPO CULTIVO CULTIVO DESAG YEAR
## 1 5440 MARINILLA HORTALIZAS ACELGA ACELGA ACELGA 2016
## 2 5440 MARINILLA HORTALIZAS ACELGA ACELGA ACELGA 2016
## 3 5440 MARINILLA HORTALIZAS ACELGA ACELGA ACELGA 2017
## 4 5440 MARINILLA HORTALIZAS ACELGA ACELGA ACELGA 2017
## 5 5440 MARINILLA HORTALIZAS ACELGA ACELGA ACELGA 2018
## 6 5475 MURINDO TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN 2011
## PERIODO AREA_SEMBRADA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2016A 11 11 297 27.00
## 2 2016B 11 11 297 27.00
## 3 2017A 9 9 243 27.00
## 4 2017B 15 15 422 28.10
## 5 2018A 10 10 277 27.68
## 6 2011 6 6 209 37.40
Podemos ver que los datos filtrados corresponden a diferentes periodos de tiempo . Para este caso, solo se necesita leer los datos más recientes como lo son los datos del (2018), por lo que continuamos consultando a qué años pertenecen los datos previamente filtrados.
unique(antioquia.tmp$YEAR)
## [1] 2016 2017 2018 2011 2013 2014 2015 2007 2008 2009 2010 2012 2006
En esta seccion filtramos los datos para solo tener los del año (2018)
antioquia2018 = dplyr::filter(antioquia.tmp, YEAR== 2018)
Estadisticas agropecuarias del departamento de Antioquia del año (2018)
head(antioquia2018)
## COD_MUN MUN GRUPO_CULTIVO SUBGRUPO CULTIVO CULTIVO DESAG
## 1 5440 MARINILLA HORTALIZAS ACELGA ACELGA ACELGA
## 2 5148 CARMEN DE VIBORAL FRUTALES FRUTALES EXOTICOS AGRAZ AGRAZ
## 3 5686 SANTA ROSA DE OSOS FRUTALES FRUTALES EXOTICOS AGRAZ AGRAZ
## 4 5264 ENTRERRIOS FRUTALES FRUTALES EXOTICOS AGRAZ AGRAZ
## 5 5647 SAN ANDRES FRUTALES FRUTALES EXOTICOS AGRAZ AGRAZ
## 6 5847 URRAO FRUTALES AGUACATE AGUACATE AGUACATE
## YEAR PERIODO AREA_SEMBRADA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2018 2018A 10 10 277 27.68
## 2 2018 2018 6 3 10 4.00
## 3 2018 2018 4 3 5 1.50
## 4 2018 2018 2 0 0 NA
## 5 2018 2018 2 0 0 NA
## 6 2018 2018 2490 1616 53328 33.00
En esta sección, se analizan los datos resultantes de todos los procedimientos de filtrado realizados anteriormente. Se estudiará la producción total de los diferentes cultivos en el departamento de Antioquia.
antioquia2018 %>%
filter(PRODUCCION > 0) %>%
group_by(CULTIVO) %>%
summarize(TOTAL_PRODUCCION = sum(PRODUCCION)) %>%
arrange(desc(TOTAL_PRODUCCION)) -> CULTIVOS2018
CULTIVOS2018
## # A tibble: 81 × 2
## CULTIVO TOTAL_PRODUCCION
## <chr> <int>
## 1 BANANO 1246012
## 2 PLATANO 471097
## 3 CAÑA PANELERA 180905
## 4 YUCA 170543
## 5 CAFE 141897
## 6 AGUACATE 137293
## 7 TOMATE 115269
## 8 NARANJA 96181
## 9 TOMATE DE ARBOL 89082
## 10 PAPA 79345
## # … with 71 more rows
A continuacion, se analizará en que municipios se encuentran los cultivos y cual es su produccion total, partiendo desde la mayor hasta la menor.
antioquia2018 %>%
group_by(GRUPO_CULTIVO, MUN) %>%
summarize(MAX_PROD = max(PRODUCCION, na.rm = TRUE)) %>%
slice(which.max(MAX_PROD)) %>%
arrange(desc(MAX_PROD))
## `summarise()` has grouped output by 'GRUPO_CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 11 × 3
## # Groups: GRUPO_CULTIVO [11]
## GRUPO_CULTIVO MUN MAX_PROD
## <chr> <chr> <int>
## 1 FRUTALES TURBO 361742
## 2 TUBERCULOS Y PLATANOS TURBO 84968
## 3 HORTALIZAS PEÑOL 32400
## 4 OTROS PERMANENTES YOLOMBO 20880
## 5 CEREALES NECOCLI 9360
## 6 FLORES Y FOLLAJES LA UNION 5320
## 7 OLEAGINOSAS MUTATA 2350
## 8 LEGUMINOSAS SAN VICENTE 1595
## 9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES RIONEGRO 788
## 10 FORESTALES CACERES 560
## 11 FIBRAS URRAO 251
En esta sección se procesa y se analizan los datos del grupo del cultivo con mayor producción en el departamento del Antioquia, en que municipios se encuentran y su respectivo código. Dicha producción se organiza descendentemente.
antioquia2018 %>%
group_by(COD_MUN, MUN, GRUPO_CULTIVO) %>%
filter(GRUPO_CULTIVO=="FRUTALES") %>%
summarize(MAX_PROD = max(PRODUCCION, na.rm = TRUE)) %>%
arrange(desc(MAX_PROD)) -> frutales2018
frutales2018
## # A tibble: 106 × 4
## # Groups: COD_MUN, MUN [106]
## COD_MUN MUN GRUPO_CULTIVO MAX_PROD
## <int> <chr> <chr> <int>
## 1 5837 TURBO FRUTALES 361742
## 2 5147 CAREPA FRUTALES 359795
## 3 5045 APARTADO FRUTALES 350000
## 4 5172 CHIGORODO FRUTALES 125234
## 5 5847 URRAO FRUTALES 53328
## 6 5686 SANTA ROSA DE OSOS FRUTALES 51590
## 7 5034 ANDES FRUTALES 35945
## 8 5282 FREDONIA FRUTALES 28467
## 9 5756 SONSON FRUTALES 20250
## 10 5856 VALPARAISO FRUTALES 19280
## # … with 96 more rows
En esta sección se procesa y se analizan los datos del grupo del segundo cultivo con mayor producción en el departamento del Antioquia, en que municipios se encuentran y su respectivo código. Dicha producción se organiza descendentemente.
antioquia2018 %>%
group_by(COD_MUN, MUN, GRUPO_CULTIVO) %>%
filter(GRUPO_CULTIVO=="TUBERCULOS Y PLATANOS") %>%
summarize(MAX_PROD = max(PRODUCCION, na.rm = TRUE)) %>%
arrange(desc(MAX_PROD)) -> tuberyplat2018
tuberyplat2018
## # A tibble: 118 × 4
## # Groups: COD_MUN, MUN [118]
## COD_MUN MUN GRUPO_CULTIVO MAX_PROD
## <int> <chr> <chr> <int>
## 1 5837 TURBO TUBERCULOS Y PLATANOS 84968
## 2 5893 YONDO TUBERCULOS Y PLATANOS 54000
## 3 5659 SAN JUAN DE URABA TUBERCULOS Y PLATANOS 47560
## 4 5490 NECOCLI TUBERCULOS Y PLATANOS 23090
## 5 5250 EL BAGRE TUBERCULOS Y PLATANOS 18000
## 6 5051 ARBOLETES TUBERCULOS Y PLATANOS 17505
## 7 5756 SONSON TUBERCULOS Y PLATANOS 17160
## 8 5368 JERICO TUBERCULOS Y PLATANOS 16750
## 9 5686 SANTA ROSA DE OSOS TUBERCULOS Y PLATANOS 15500
## 10 5674 SAN VICENTE TUBERCULOS Y PLATANOS 15400
## # … with 108 more rows
En esta sección se guardan los respectivos datos de los dos grupos de cultivo más relevantes del departamento del Antioquia.
#write_csv(frutales2018, "C:/CUADERNO1/frutales2018.csv")
write_csv(tuberyplat2018,"C:/CUADERNO1/tuberyplat2018.csv")
Cuaderno realizado en base a: Lizarazo, I. Reading and processing municipal agricultural statistics for 2020. https://rpubs.com/ials2un/readingEVAv1.
sessionInfo()
## R version 4.2.1 Patched (2022-09-21 r82893 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 22000)
##
## Matrix products: default
##
## locale:
## [1] LC_COLLATE=Spanish_Colombia.utf8 LC_CTYPE=Spanish_Colombia.utf8
## [3] LC_MONETARY=Spanish_Colombia.utf8 LC_NUMERIC=C
## [5] LC_TIME=Spanish_Colombia.utf8
##
## attached base packages:
## [1] stats graphics grDevices utils datasets methods base
##
## other attached packages:
## [1] lubridate_1.9.2 forcats_1.0.0 stringr_1.5.0 dplyr_1.1.0
## [5] purrr_1.0.1 readr_2.1.4 tidyr_1.3.0 tibble_3.2.0
## [9] ggplot2_3.4.1 tidyverse_2.0.0
##
## loaded via a namespace (and not attached):
## [1] bslib_0.4.2 compiler_4.2.1 pillar_1.8.1 jquerylib_0.1.4
## [5] tools_4.2.1 bit_4.0.5 digest_0.6.31 timechange_0.2.0
## [9] jsonlite_1.8.4 evaluate_0.20 lifecycle_1.0.3 gtable_0.3.1
## [13] pkgconfig_2.0.3 rlang_1.1.0 cli_3.6.0 rstudioapi_0.14
## [17] parallel_4.2.1 yaml_2.3.7 xfun_0.37 fastmap_1.1.1
## [21] withr_2.5.0 knitr_1.42 hms_1.1.2 generics_0.1.3
## [25] vctrs_0.6.0 sass_0.4.5 bit64_4.0.5 grid_4.2.1
## [29] tidyselect_1.2.0 glue_1.6.2 R6_2.5.1 fansi_1.0.4
## [33] vroom_1.6.1 rmarkdown_2.20 tzdb_0.3.0 magrittr_2.0.3
## [37] ellipsis_0.3.2 scales_1.2.1 htmltools_0.5.4 colorspace_2.1-0
## [41] utf8_1.2.3 stringi_1.7.12 munsell_0.5.0 cachem_1.0.7
## [45] crayon_1.5.2