Este es el primer cuaderno R Markdown para el curs Geomatica Basica 2022, Tiene como objetivo conocer cuáles son los cultivos agrícolas de mayor producción en el departamento del Choco. Se Usara como fuente principal un archivo excel que contiene las Evaluaciones Agropecuarias Municipales (EVA) producidas por la UPRA para el año 2020.
Esta sera la configuracion utilizada para la lectura y analicis del archivo EVA
library(tidyverse)
## -- Attaching core tidyverse packages ------------------------ tidyverse 2.0.0 --
## v dplyr 1.1.0 v readr 2.1.4
## v forcats 1.0.0 v stringr 1.5.0
## v ggplot2 3.4.1 v tibble 3.2.0
## v lubridate 1.9.2 v tidyr 1.3.0
## v purrr 1.0.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
## i Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
En este espacio vamos a leer el archivo con los datos de estadísticas agropecuarias municipales y lo describimos.
EVA=read.csv("C:/Cuaderno1/EVA.csv")
Revisamos los encabaezados del archivo
head(EVA)
## CÃ.D...DEP. DEPARTAMENTO CÃ.D..MUN. MUNICIPIO GRUPO..DE.CULTIVO
## 1 15 BOYACA 15114 BUSBANZA HORTALIZAS
## 2 25 CUNDINAMARCA 25754 SOACHA HORTALIZAS
## 3 25 CUNDINAMARCA 25214 COTA HORTALIZAS
## 4 54 NORTE DE SANTANDER 54405 LOS PATIOS HORTALIZAS
## 5 54 NORTE DE SANTANDER 54518 PAMPLONA HORTALIZAS
## 6 68 SANTANDER 68377 LA BELLEZA HORTALIZAS
## SUBGRUPO..DE.CULTIVO CULTIVO DESAGREGACIÃ.N.REGIONAL.Y.O.SISTEMA.PRODUCTIVO
## 1 ACELGA ACELGA ACELGA
## 2 ACELGA ACELGA ACELGA
## 3 ACELGA ACELGA ACELGA
## 4 ACELGA ACELGA ACELGA
## 5 ACELGA ACELGA ACELGA
## 6 ACELGA ACELGA ACELGA
## AÃ.O PERIODO Ã.rea.Sembrada..ha. Ã.rea.Cosechada..ha. Producción..t.
## 1 2006 2006B 2 1 1
## 2 2006 2006B 82 80 1440
## 3 2006 2006B 2 2 26
## 4 2006 2006B 3 3 48
## 5 2006 2006B 1 1 5
## 6 2006 2006B 1 1 6
## Rendimiento..t.ha. ESTADO.FISICO.PRODUCCION NOMBRE..CIENTIFICO
## 1 1.00 FRUTO FRESCO BETA VULGARIS
## 2 18.00 FRUTO FRESCO BETA VULGARIS
## 3 17.33 FRUTO FRESCO BETA VULGARIS
## 4 16.00 FRUTO FRESCO BETA VULGARIS
## 5 10.00 FRUTO FRESCO BETA VULGARIS
## 6 6.00 FRUTO FRESCO BETA VULGARIS
## CICLO.DE.CULTIVO
## 1 TRANSITORIO
## 2 TRANSITORIO
## 3 TRANSITORIO
## 4 TRANSITORIO
## 5 TRANSITORIO
## 6 TRANSITORIO
RevisAMOS los nombres de los atributos de EVA.
names(EVA)
## [1] "CÃ.D...DEP."
## [2] "DEPARTAMENTO"
## [3] "CÃ.D..MUN."
## [4] "MUNICIPIO"
## [5] "GRUPO..DE.CULTIVO"
## [6] "SUBGRUPO..DE.CULTIVO"
## [7] "CULTIVO"
## [8] "DESAGREGACIÃ.N.REGIONAL.Y.O.SISTEMA.PRODUCTIVO"
## [9] "AÃ.O"
## [10] "PERIODO"
## [11] "Ã.rea.Sembrada..ha."
## [12] "Ã.rea.Cosechada..ha."
## [13] "Producción..t."
## [14] "Rendimiento..t.ha."
## [15] "ESTADO.FISICO.PRODUCCION"
## [16] "NOMBRE..CIENTIFICO"
## [17] "CICLO.DE.CULTIVO"
Ahora se Cambiaran los nombres de EVA para un mejor manejode los datos.
nombres = c("COD_DEP","DEPARTAMENTO","COD_MUN","MUNICIPIO","GRUPO_CULTIVO","SUB_CULTIVO","CULTIVO","DESAG","YEAR","PERIODO","AREA_SIEMBRA","AREA_COSECHA","PRODUCCION","RENDIMIENTO","ESTADO","NOMBRE","CICLO" )
(names(EVA) = nombres)
## [1] "COD_DEP" "DEPARTAMENTO" "COD_MUN" "MUNICIPIO"
## [5] "GRUPO_CULTIVO" "SUB_CULTIVO" "CULTIVO" "DESAG"
## [9] "YEAR" "PERIODO" "AREA_SIEMBRA" "AREA_COSECHA"
## [13] "PRODUCCION" "RENDIMIENTO" "ESTADO" "NOMBRE"
## [17] "CICLO"
Luego de cambiar los nombres de los atributos de Eva, filtramos los datos de nuestro departamento de interes Choco.
choco= dplyr::filter(EVA, DEPARTAMENTO == "CHOCO")
head(choco)
## COD_DEP DEPARTAMENTO COD_MUN MUNICIPIO GRUPO_CULTIVO
## 1 27 CHOCO 27250 LITORAL DEL SAN JUAN TUBERCULOS Y PLATANOS
## 2 27 CHOCO 27077 BAJO BAUDO TUBERCULOS Y PLATANOS
## 3 27 CHOCO 27430 MEDIO BAUDO TUBERCULOS Y PLATANOS
## 4 27 CHOCO 27150 CARMEN DEL DARIEN TUBERCULOS Y PLATANOS
## 5 27 CHOCO 27372 JURADO TUBERCULOS Y PLATANOS
## 6 27 CHOCO 27745 SIPI TUBERCULOS Y PLATANOS
## SUB_CULTIVO CULTIVO DESAG YEAR PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION
## 1 MALANGA MALANGA ACHIN 2007 2007 170 170 2380
## 2 MALANGA MALANGA ACHIN 2007 2007 138 138 1173
## 3 MALANGA MALANGA ACHIN 2007 2007 130 130 858
## 4 MALANGA MALANGA ACHIN 2007 2007 44 44 299
## 5 MALANGA MALANGA ACHIN 2007 2007 20 20 156
## 6 MALANGA MALANGA ACHIN 2007 2007 10 10 65
## RENDIMIENTO ESTADO NOMBRE CICLO
## 1 14.0 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 2 8.5 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 3 6.6 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 4 6.8 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 5 7.8 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 6 6.5 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
choco.tmp <- choco %>% select("COD_MUN":"RENDIMIENTO")
teniendo exclusivamente los datos correpondientes al departamento del Choco, se filtraran estos mismo datos, pero ahora solo a las áreas de interés.
head(choco.tmp)
## COD_MUN MUNICIPIO GRUPO_CULTIVO SUB_CULTIVO CULTIVO DESAG
## 1 27250 LITORAL DEL SAN JUAN TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 2 27077 BAJO BAUDO TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 3 27430 MEDIO BAUDO TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 4 27150 CARMEN DEL DARIEN TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 5 27372 JURADO TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 6 27745 SIPI TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## YEAR PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2007 2007 170 170 2380 14.0
## 2 2007 2007 138 138 1173 8.5
## 3 2007 2007 130 130 858 6.6
## 4 2007 2007 44 44 299 6.8
## 5 2007 2007 20 20 156 7.8
## 6 2007 2007 10 10 65 6.5
Se observa que los datos filtrados corresponden a distintos periodos de tiempo (años). Para este caso, se requiere unicamente la lectura de los datos mas recientes, por lo que se consultara a que años pertenecen los datos filtrados anteriormente.
unique(choco.tmp$YEAR)
## [1] 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2006
Los datos filtrados correponden a un periodo de tiempo entre el 2006 y el 2018, p el siguiente paso consiste en filtrar los datos para tomar los mas recientes (2018).
choco2018 = dplyr::filter(choco.tmp, YEAR == 2018)
Estadisticas agropecuarias del departamento del Choco correspondientes al 2018.
head (choco2018)
## COD_MUN MUNICIPIO GRUPO_CULTIVO SUB_CULTIVO CULTIVO DESAG
## 1 27250 LITORAL DEL SAN JUAN TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 2 27050 ATRATO TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 3 27150 CARMEN DEL DARIEN TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 4 27450 MEDIO SAN JUAN TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 5 27001 QUIBDO TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## 6 27491 NOVITA TUBERCULOS Y PLATANOS MALANGA MALANGA ACHIN
## YEAR PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2018 2018 500 500 5000 10.0
## 2 2018 2018 190 25 200 8.0
## 3 2018 2018 120 120 984 8.2
## 4 2018 2018 120 120 1200 10.0
## 5 2018 2018 120 120 960 8.0
## 6 2018 2018 100 100 700 7.0
Ahora se analizan los datos resultantes. Se analizara la producción total de los distintos cultivos ubicados en el departamento del Choco.
choco2018 %>%
filter(PRODUCCION>0) %>% group_by(CULTIVO) %>% summarize(total_produccion = sum(PRODUCCION)) %>% arrange(desc(total_produccion))
## # A tibble: 41 x 2
## CULTIVO total_produccion
## <chr> <int>
## 1 PLATANO 286902
## 2 YUCA 87392
## 3 ARROZ 31187
## 4 BANANO 12482
## 5 MALANGA 12060
## 6 MAIZ 10222
## 7 COCO 9408
## 8 ÑAME 8593
## 9 CAÑA PANELERA 7536
## 10 PIÑA 6901
## # ... with 31 more rows
Se analiza en que municipios se encuentran los cultivos y cual es su produccion total,organizando los datos de mayor a menor.
choco2018 %>%
group_by(CULTIVO, MUNICIPIO) %>%
summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
slice(which.max(max_prod)) %>%
arrange(desc(max_prod))
## `summarise()` has grouped output by 'CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 41 x 3
## # Groups: CULTIVO [41]
## CULTIVO MUNICIPIO max_prod
## <chr> <chr> <int>
## 1 PLATANO RIOSUCIO 90460
## 2 YUCA RIOSUCIO 29760
## 3 ARROZ RIOSUCIO 10532
## 4 MAIZ RIOSUCIO 5304
## 5 MALANGA LITORAL DEL SAN JUAN 5000
## 6 CHONTADURO SAN JOSE DEL PALMAR 4280
## 7 ÑAME ACANDI 3000
## 8 COCO MEDIO ATRATO 2700
## 9 CAÑA PANELERA MEDIO BAUDO 2340
## 10 AGUACATE SAN JOSE DEL PALMAR 2225
## # ... with 31 more rows
Luego de analizar los datos de mayor producción, se pasara de un cultivo especifico a un grupo de cultivo y de la misma forma se indicará en que municipio se da su producción máxima.
choco2018 %>%
group_by(GRUPO_CULTIVO,MUNICIPIO) %>%
summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
slice(which.max(max_prod)) %>%
arrange(desc(max_prod))
## `summarise()` has grouped output by 'GRUPO_CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 8 x 3
## # Groups: GRUPO_CULTIVO [8]
## GRUPO_CULTIVO MUNICIPIO max_prod
## <chr> <chr> <int>
## 1 TUBERCULOS Y PLATANOS RIOSUCIO 90460
## 2 CEREALES RIOSUCIO 10532
## 3 FRUTALES SAN JOSE DEL PALMAR 4280
## 4 OTROS PERMANENTES MEDIO BAUDO 2340
## 5 OLEAGINOSAS RIOSUCIO 800
## 6 HORTALIZAS CARMEN DEL ATRATO 450
## 7 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES RIO QUITO 400
## 8 LEGUMINOSAS CARMEN DEL ATRATO 18
Luego, se procesan y se analizan los datos del grupo del cultivo con mayor producción en el departamento del Choco, en que municipios se encuentran y su respectivo código. Dicha producción se organiza de mayor a menor.
choco2018 %>%
group_by(COD_MUN,MUNICIPIO,GRUPO_CULTIVO) %>%
filter(GRUPO_CULTIVO =='TUBERCULOS Y PLATANOS') %>%
summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
arrange(desc(max_prod)) -> TYP2018
## `summarise()` has grouped output by 'COD_MUN', 'MUNICIPIO'. You can override
## using the `.groups` argument.
TYP2018
## # A tibble: 30 x 4
## # Groups: COD_MUN, MUNICIPIO [30]
## COD_MUN MUNICIPIO GRUPO_CULTIVO max_prod
## <int> <chr> <chr> <int>
## 1 27615 RIOSUCIO TUBERCULOS Y PLATANOS 90460
## 2 27150 CARMEN DEL DARIEN TUBERCULOS Y PLATANOS 77726
## 3 27025 ALTO BAUDO TUBERCULOS Y PLATANOS 22050
## 4 27001 QUIBDO TUBERCULOS Y PLATANOS 20790
## 5 27099 BOJAYA TUBERCULOS Y PLATANOS 20120
## 6 27800 UNGUIA TUBERCULOS Y PLATANOS 19520
## 7 27430 MEDIO BAUDO TUBERCULOS Y PLATANOS 6921
## 8 27495 NUQUI TUBERCULOS Y PLATANOS 5865
## 9 27250 LITORAL DEL SAN JUAN TUBERCULOS Y PLATANOS 5000
## 10 27425 MEDIO ATRATO TUBERCULOS Y PLATANOS 4056
## # ... with 20 more rows
Al igual que con el primer grupo de cultivo, se procesa el segundo grupo, que en este caso es CEREALES, para esto se analizan aspectos como, producción total, municipios en los que se da y su respectivo código.
choco2018 %>%
group_by(COD_MUN, MUNICIPIO, GRUPO_CULTIVO) %>%
filter(GRUPO_CULTIVO =='CEREALES') %>%
summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
arrange(desc(max_prod)) -> CEREALES2018
## `summarise()` has grouped output by 'COD_MUN', 'MUNICIPIO'. You can override
## using the `.groups` argument.
CEREALES2018
## # A tibble: 29 x 4
## # Groups: COD_MUN, MUNICIPIO [29]
## COD_MUN MUNICIPIO GRUPO_CULTIVO max_prod
## <int> <chr> <chr> <int>
## 1 27615 RIOSUCIO CEREALES 10532
## 2 27430 MEDIO BAUDO CEREALES 3800
## 3 27001 QUIBDO CEREALES 3300
## 4 27150 CARMEN DEL DARIEN CEREALES 2750
## 5 27425 MEDIO ATRATO CEREALES 2000
## 6 27077 BAJO BAUDO CEREALES 1920
## 7 27006 ACANDI CEREALES 1440
## 8 27099 BOJAYA CEREALES 740
## 9 27025 ALTO BAUDO CEREALES 720
## 10 27450 MEDIO SAN JUAN CEREALES 595
## # ... with 19 more rows
Se guardan los datos de los dos grupos de cultivo más relevantes del departamento del Choco.
write_csv(TYP2018, "C:/Cuaderno1/TYP2018.csv")
write_csv(CEREALES2018, "C:/Cuaderno1/CEREALES2018.csv")
Cuaderno realizado en base a: Lizarazo, I. Reading and processing municipal agricultural statistics for 2020. https://rpubs.com/ials2un/readingEVAv1.
sessionInfo()
## R version 4.2.3 (2023-03-15 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 17134)
##
## Matrix products: default
##
## locale:
## [1] LC_COLLATE=Spanish_Colombia.1252 LC_CTYPE=Spanish_Colombia.1252
## [3] LC_MONETARY=Spanish_Colombia.1252 LC_NUMERIC=C
## [5] LC_TIME=Spanish_Colombia.1252
##
## attached base packages:
## [1] stats graphics grDevices utils datasets methods base
##
## other attached packages:
## [1] lubridate_1.9.2 forcats_1.0.0 stringr_1.5.0 dplyr_1.1.0
## [5] purrr_1.0.1 readr_2.1.4 tidyr_1.3.0 tibble_3.2.0
## [9] ggplot2_3.4.1 tidyverse_2.0.0
##
## loaded via a namespace (and not attached):
## [1] bslib_0.4.2 compiler_4.2.3 pillar_1.8.1 jquerylib_0.1.4
## [5] tools_4.2.3 bit_4.0.5 digest_0.6.31 timechange_0.2.0
## [9] jsonlite_1.8.4 evaluate_0.20 lifecycle_1.0.3 gtable_0.3.2
## [13] pkgconfig_2.0.3 rlang_1.1.0 cli_3.6.0 rstudioapi_0.14
## [17] parallel_4.2.3 yaml_2.3.7 xfun_0.37 fastmap_1.1.1
## [21] withr_2.5.0 knitr_1.42 hms_1.1.2 generics_0.1.3
## [25] sass_0.4.5 vctrs_0.6.0 bit64_4.0.5 grid_4.2.3
## [29] tidyselect_1.2.0 glue_1.6.2 R6_2.5.1 fansi_1.0.4
## [33] vroom_1.6.1 rmarkdown_2.20 tzdb_0.3.0 magrittr_2.0.3
## [37] ellipsis_0.3.2 scales_1.2.1 htmltools_0.5.4 colorspace_2.1-0
## [41] utf8_1.2.3 stringi_1.7.12 munsell_0.5.0 cachem_1.0.7
## [45] crayon_1.5.2