Estadisticas Agropecuarias Chocó

1- Introducción

Este es el primer cuaderno R Markdown para el curs Geomatica Basica 2022, Tiene como objetivo conocer cuáles son los cultivos agrícolas de mayor producción en el departamento del Choco. Se Usara como fuente principal un archivo excel que contiene las Evaluaciones Agropecuarias Municipales (EVA) producidas por la UPRA para el año 2020.

2- Configuración

Esta sera la configuracion utilizada para la lectura y analicis del archivo EVA

library(tidyverse)
## -- Attaching core tidyverse packages ------------------------ tidyverse 2.0.0 --
## v dplyr     1.1.0     v readr     2.1.4
## v forcats   1.0.0     v stringr   1.5.0
## v ggplot2   3.4.1     v tibble    3.2.0
## v lubridate 1.9.2     v tidyr     1.3.0
## v purrr     1.0.1     
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
## i Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

3- Datos

En este espacio vamos a leer el archivo con los datos de estadísticas agropecuarias municipales y lo describimos.

EVA=read.csv("C:/Cuaderno1/EVA.csv")

Revisamos los encabaezados del archivo

head(EVA)
##   CÃ.D...DEP.       DEPARTAMENTO CÃ.D..MUN.  MUNICIPIO GRUPO..DE.CULTIVO
## 1          15             BOYACA      15114   BUSBANZA        HORTALIZAS
## 2          25       CUNDINAMARCA      25754     SOACHA        HORTALIZAS
## 3          25       CUNDINAMARCA      25214       COTA        HORTALIZAS
## 4          54 NORTE DE SANTANDER      54405 LOS PATIOS        HORTALIZAS
## 5          54 NORTE DE SANTANDER      54518   PAMPLONA        HORTALIZAS
## 6          68          SANTANDER      68377 LA BELLEZA        HORTALIZAS
##   SUBGRUPO..DE.CULTIVO CULTIVO DESAGREGACIÃ.N.REGIONAL.Y.O.SISTEMA.PRODUCTIVO
## 1               ACELGA  ACELGA                                         ACELGA
## 2               ACELGA  ACELGA                                         ACELGA
## 3               ACELGA  ACELGA                                         ACELGA
## 4               ACELGA  ACELGA                                         ACELGA
## 5               ACELGA  ACELGA                                         ACELGA
## 6               ACELGA  ACELGA                                         ACELGA
##   AÃ.O PERIODO Ã.rea.Sembrada..ha. Ã.rea.Cosechada..ha. Producción..t.
## 1 2006   2006B                   2                    1               1
## 2 2006   2006B                  82                   80            1440
## 3 2006   2006B                   2                    2              26
## 4 2006   2006B                   3                    3              48
## 5 2006   2006B                   1                    1               5
## 6 2006   2006B                   1                    1               6
##   Rendimiento..t.ha. ESTADO.FISICO.PRODUCCION NOMBRE..CIENTIFICO
## 1               1.00             FRUTO FRESCO      BETA VULGARIS
## 2              18.00             FRUTO FRESCO      BETA VULGARIS
## 3              17.33             FRUTO FRESCO      BETA VULGARIS
## 4              16.00             FRUTO FRESCO      BETA VULGARIS
## 5              10.00             FRUTO FRESCO      BETA VULGARIS
## 6               6.00             FRUTO FRESCO      BETA VULGARIS
##   CICLO.DE.CULTIVO
## 1      TRANSITORIO
## 2      TRANSITORIO
## 3      TRANSITORIO
## 4      TRANSITORIO
## 5      TRANSITORIO
## 6      TRANSITORIO

RevisAMOS los nombres de los atributos de EVA.

names(EVA)
##  [1] "CÃ.D...DEP."                                   
##  [2] "DEPARTAMENTO"                                  
##  [3] "CÃ.D..MUN."                                    
##  [4] "MUNICIPIO"                                     
##  [5] "GRUPO..DE.CULTIVO"                             
##  [6] "SUBGRUPO..DE.CULTIVO"                          
##  [7] "CULTIVO"                                       
##  [8] "DESAGREGACIÃ.N.REGIONAL.Y.O.SISTEMA.PRODUCTIVO"
##  [9] "AÃ.O"                                          
## [10] "PERIODO"                                       
## [11] "Ã.rea.Sembrada..ha."                           
## [12] "Ã.rea.Cosechada..ha."                          
## [13] "Producción..t."                               
## [14] "Rendimiento..t.ha."                            
## [15] "ESTADO.FISICO.PRODUCCION"                      
## [16] "NOMBRE..CIENTIFICO"                            
## [17] "CICLO.DE.CULTIVO"

Ahora se Cambiaran los nombres de EVA para un mejor manejode los datos.

nombres = c("COD_DEP","DEPARTAMENTO","COD_MUN","MUNICIPIO","GRUPO_CULTIVO","SUB_CULTIVO","CULTIVO","DESAG","YEAR","PERIODO","AREA_SIEMBRA","AREA_COSECHA","PRODUCCION","RENDIMIENTO","ESTADO","NOMBRE","CICLO" )
(names(EVA) = nombres)
##  [1] "COD_DEP"       "DEPARTAMENTO"  "COD_MUN"       "MUNICIPIO"    
##  [5] "GRUPO_CULTIVO" "SUB_CULTIVO"   "CULTIVO"       "DESAG"        
##  [9] "YEAR"          "PERIODO"       "AREA_SIEMBRA"  "AREA_COSECHA" 
## [13] "PRODUCCION"    "RENDIMIENTO"   "ESTADO"        "NOMBRE"       
## [17] "CICLO"

4- Filtrar datos relevantes

Luego de cambiar los nombres de los atributos de Eva, filtramos los datos de nuestro departamento de interes Choco.

choco= dplyr::filter(EVA, DEPARTAMENTO == "CHOCO")
head(choco)
##   COD_DEP DEPARTAMENTO COD_MUN            MUNICIPIO         GRUPO_CULTIVO
## 1      27        CHOCO   27250 LITORAL DEL SAN JUAN TUBERCULOS Y PLATANOS
## 2      27        CHOCO   27077           BAJO BAUDO TUBERCULOS Y PLATANOS
## 3      27        CHOCO   27430          MEDIO BAUDO TUBERCULOS Y PLATANOS
## 4      27        CHOCO   27150    CARMEN DEL DARIEN TUBERCULOS Y PLATANOS
## 5      27        CHOCO   27372               JURADO TUBERCULOS Y PLATANOS
## 6      27        CHOCO   27745                 SIPI TUBERCULOS Y PLATANOS
##   SUB_CULTIVO CULTIVO DESAG YEAR PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION
## 1     MALANGA MALANGA ACHIN 2007    2007          170          170       2380
## 2     MALANGA MALANGA ACHIN 2007    2007          138          138       1173
## 3     MALANGA MALANGA ACHIN 2007    2007          130          130        858
## 4     MALANGA MALANGA ACHIN 2007    2007           44           44        299
## 5     MALANGA MALANGA ACHIN 2007    2007           20           20        156
## 6     MALANGA MALANGA ACHIN 2007    2007           10           10         65
##   RENDIMIENTO           ESTADO              NOMBRE CICLO
## 1        14.0 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 2         8.5 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 3         6.6 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 4         6.8 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 5         7.8 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
## 6         6.5 TUBERCULO FRESCO COLOCASIA ESCULENTA ANUAL
choco.tmp <- choco %>% select("COD_MUN":"RENDIMIENTO")

teniendo exclusivamente los datos correpondientes al departamento del Choco, se filtraran estos mismo datos, pero ahora solo a las áreas de interés.

head(choco.tmp)
##   COD_MUN            MUNICIPIO         GRUPO_CULTIVO SUB_CULTIVO CULTIVO DESAG
## 1   27250 LITORAL DEL SAN JUAN TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 2   27077           BAJO BAUDO TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 3   27430          MEDIO BAUDO TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 4   27150    CARMEN DEL DARIEN TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 5   27372               JURADO TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 6   27745                 SIPI TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
##   YEAR PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2007    2007          170          170       2380        14.0
## 2 2007    2007          138          138       1173         8.5
## 3 2007    2007          130          130        858         6.6
## 4 2007    2007           44           44        299         6.8
## 5 2007    2007           20           20        156         7.8
## 6 2007    2007           10           10         65         6.5

5- Filtrar año de interés

Se observa que los datos filtrados corresponden a distintos periodos de tiempo (años). Para este caso, se requiere unicamente la lectura de los datos mas recientes, por lo que se consultara a que años pertenecen los datos filtrados anteriormente.

unique(choco.tmp$YEAR)
##  [1] 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2006

Los datos filtrados correponden a un periodo de tiempo entre el 2006 y el 2018, p el siguiente paso consiste en filtrar los datos para tomar los mas recientes (2018).

choco2018 = dplyr::filter(choco.tmp, YEAR == 2018)

Estadisticas agropecuarias del departamento del Choco correspondientes al 2018.

head (choco2018)
##   COD_MUN            MUNICIPIO         GRUPO_CULTIVO SUB_CULTIVO CULTIVO DESAG
## 1   27250 LITORAL DEL SAN JUAN TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 2   27050               ATRATO TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 3   27150    CARMEN DEL DARIEN TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 4   27450       MEDIO SAN JUAN TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 5   27001               QUIBDO TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
## 6   27491               NOVITA TUBERCULOS Y PLATANOS     MALANGA MALANGA ACHIN
##   YEAR PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2018    2018          500          500       5000        10.0
## 2 2018    2018          190           25        200         8.0
## 3 2018    2018          120          120        984         8.2
## 4 2018    2018          120          120       1200        10.0
## 5 2018    2018          120          120        960         8.0
## 6 2018    2018          100          100        700         7.0

6- Procesamiento y Análisis.

Ahora se analizan los datos resultantes. Se analizara la producción total de los distintos cultivos ubicados en el departamento del Choco.

choco2018 %>%
  filter(PRODUCCION>0) %>% group_by(CULTIVO) %>% summarize(total_produccion = sum(PRODUCCION)) %>% arrange(desc(total_produccion))
## # A tibble: 41 x 2
##    CULTIVO        total_produccion
##    <chr>                     <int>
##  1 PLATANO                  286902
##  2 YUCA                      87392
##  3 ARROZ                     31187
##  4 BANANO                    12482
##  5 MALANGA                   12060
##  6 MAIZ                      10222
##  7 COCO                       9408
##  8 ÑAME                      8593
##  9 CAÑA PANELERA             7536
## 10 PIÑA                      6901
## # ... with 31 more rows

Se analiza en que municipios se encuentran los cultivos y cual es su produccion total,organizando los datos de mayor a menor.

choco2018 %>%
  group_by(CULTIVO, MUNICIPIO) %>%
  summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
  slice(which.max(max_prod))  %>%
  arrange(desc(max_prod))
## `summarise()` has grouped output by 'CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 41 x 3
## # Groups:   CULTIVO [41]
##    CULTIVO        MUNICIPIO            max_prod
##    <chr>          <chr>                   <int>
##  1 PLATANO        RIOSUCIO                90460
##  2 YUCA           RIOSUCIO                29760
##  3 ARROZ          RIOSUCIO                10532
##  4 MAIZ           RIOSUCIO                 5304
##  5 MALANGA        LITORAL DEL SAN JUAN     5000
##  6 CHONTADURO     SAN JOSE DEL PALMAR      4280
##  7 ÑAME          ACANDI                   3000
##  8 COCO           MEDIO ATRATO             2700
##  9 CAÑA PANELERA MEDIO BAUDO              2340
## 10 AGUACATE       SAN JOSE DEL PALMAR      2225
## # ... with 31 more rows

Luego de analizar los datos de mayor producción, se pasara de un cultivo especifico a un grupo de cultivo y de la misma forma se indicará en que municipio se da su producción máxima.

choco2018 %>%
  group_by(GRUPO_CULTIVO,MUNICIPIO) %>%
  summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
  slice(which.max(max_prod))  %>%
  arrange(desc(max_prod))
## `summarise()` has grouped output by 'GRUPO_CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 8 x 3
## # Groups:   GRUPO_CULTIVO [8]
##   GRUPO_CULTIVO                                    MUNICIPIO           max_prod
##   <chr>                                            <chr>                  <int>
## 1 TUBERCULOS Y PLATANOS                            RIOSUCIO               90460
## 2 CEREALES                                         RIOSUCIO               10532
## 3 FRUTALES                                         SAN JOSE DEL PALMAR     4280
## 4 OTROS PERMANENTES                                MEDIO BAUDO             2340
## 5 OLEAGINOSAS                                      RIOSUCIO                 800
## 6 HORTALIZAS                                       CARMEN DEL ATRATO        450
## 7 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES RIO QUITO                400
## 8 LEGUMINOSAS                                      CARMEN DEL ATRATO         18

Luego, se procesan y se analizan los datos del grupo del cultivo con mayor producción en el departamento del Choco, en que municipios se encuentran y su respectivo código. Dicha producción se organiza de mayor a menor.

choco2018 %>%
  group_by(COD_MUN,MUNICIPIO,GRUPO_CULTIVO) %>%
  filter(GRUPO_CULTIVO =='TUBERCULOS Y PLATANOS') %>% 
  summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
  arrange(desc(max_prod)) -> TYP2018
## `summarise()` has grouped output by 'COD_MUN', 'MUNICIPIO'. You can override
## using the `.groups` argument.
TYP2018
## # A tibble: 30 x 4
## # Groups:   COD_MUN, MUNICIPIO [30]
##    COD_MUN MUNICIPIO            GRUPO_CULTIVO         max_prod
##      <int> <chr>                <chr>                    <int>
##  1   27615 RIOSUCIO             TUBERCULOS Y PLATANOS    90460
##  2   27150 CARMEN DEL DARIEN    TUBERCULOS Y PLATANOS    77726
##  3   27025 ALTO BAUDO           TUBERCULOS Y PLATANOS    22050
##  4   27001 QUIBDO               TUBERCULOS Y PLATANOS    20790
##  5   27099 BOJAYA               TUBERCULOS Y PLATANOS    20120
##  6   27800 UNGUIA               TUBERCULOS Y PLATANOS    19520
##  7   27430 MEDIO BAUDO          TUBERCULOS Y PLATANOS     6921
##  8   27495 NUQUI                TUBERCULOS Y PLATANOS     5865
##  9   27250 LITORAL DEL SAN JUAN TUBERCULOS Y PLATANOS     5000
## 10   27425 MEDIO ATRATO         TUBERCULOS Y PLATANOS     4056
## # ... with 20 more rows

Al igual que con el primer grupo de cultivo, se procesa el segundo grupo, que en este caso es CEREALES, para esto se analizan aspectos como, producción total, municipios en los que se da y su respectivo código.

choco2018 %>%
  group_by(COD_MUN, MUNICIPIO, GRUPO_CULTIVO) %>%
  filter(GRUPO_CULTIVO =='CEREALES') %>% 
  summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
  arrange(desc(max_prod)) -> CEREALES2018
## `summarise()` has grouped output by 'COD_MUN', 'MUNICIPIO'. You can override
## using the `.groups` argument.
CEREALES2018
## # A tibble: 29 x 4
## # Groups:   COD_MUN, MUNICIPIO [29]
##    COD_MUN MUNICIPIO         GRUPO_CULTIVO max_prod
##      <int> <chr>             <chr>            <int>
##  1   27615 RIOSUCIO          CEREALES         10532
##  2   27430 MEDIO BAUDO       CEREALES          3800
##  3   27001 QUIBDO            CEREALES          3300
##  4   27150 CARMEN DEL DARIEN CEREALES          2750
##  5   27425 MEDIO ATRATO      CEREALES          2000
##  6   27077 BAJO BAUDO        CEREALES          1920
##  7   27006 ACANDI            CEREALES          1440
##  8   27099 BOJAYA            CEREALES           740
##  9   27025 ALTO BAUDO        CEREALES           720
## 10   27450 MEDIO SAN JUAN    CEREALES           595
## # ... with 19 more rows

7- Guardar los datos

Se guardan los datos de los dos grupos de cultivo más relevantes del departamento del Choco.

write_csv(TYP2018, "C:/Cuaderno1/TYP2018.csv")
write_csv(CEREALES2018, "C:/Cuaderno1/CEREALES2018.csv")

8- Reproducibilidad

Cuaderno realizado en base a: Lizarazo, I. Reading and processing municipal agricultural statistics for 2020. https://rpubs.com/ials2un/readingEVAv1.

sessionInfo()
## R version 4.2.3 (2023-03-15 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 17134)
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=Spanish_Colombia.1252  LC_CTYPE=Spanish_Colombia.1252   
## [3] LC_MONETARY=Spanish_Colombia.1252 LC_NUMERIC=C                     
## [5] LC_TIME=Spanish_Colombia.1252    
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
##  [1] lubridate_1.9.2 forcats_1.0.0   stringr_1.5.0   dplyr_1.1.0    
##  [5] purrr_1.0.1     readr_2.1.4     tidyr_1.3.0     tibble_3.2.0   
##  [9] ggplot2_3.4.1   tidyverse_2.0.0
## 
## loaded via a namespace (and not attached):
##  [1] bslib_0.4.2      compiler_4.2.3   pillar_1.8.1     jquerylib_0.1.4 
##  [5] tools_4.2.3      bit_4.0.5        digest_0.6.31    timechange_0.2.0
##  [9] jsonlite_1.8.4   evaluate_0.20    lifecycle_1.0.3  gtable_0.3.2    
## [13] pkgconfig_2.0.3  rlang_1.1.0      cli_3.6.0        rstudioapi_0.14 
## [17] parallel_4.2.3   yaml_2.3.7       xfun_0.37        fastmap_1.1.1   
## [21] withr_2.5.0      knitr_1.42       hms_1.1.2        generics_0.1.3  
## [25] sass_0.4.5       vctrs_0.6.0      bit64_4.0.5      grid_4.2.3      
## [29] tidyselect_1.2.0 glue_1.6.2       R6_2.5.1         fansi_1.0.4     
## [33] vroom_1.6.1      rmarkdown_2.20   tzdb_0.3.0       magrittr_2.0.3  
## [37] ellipsis_0.3.2   scales_1.2.1     htmltools_0.5.4  colorspace_2.1-0
## [41] utf8_1.2.3       stringi_1.7.12   munsell_0.5.0    cachem_1.0.7    
## [45] crayon_1.5.2