Estadísticas Agropecuarias

1. Introducción

En esta sección se estudian las estadisticas agropecuarias del respectivo departamento, en este caso Meta. En base a estos datos, se analiza y se procesa cuales de los cultivos más importantes tienen la mayor producción en el departamento. Durante todo el proceso, se encontrarán miles de datos, los cuales podrán ser filtrados y así, llegar a estudiar solo los datos de interés.

2. Configuración

En esta seccion escribimos el codigo para cargar las librerias.

library(tidyverse)

3. Datos

En esta seccion vamos a leer el archivo con los datos de estadísticas agropecuarias municipales y lo describimos.

EVA=read.csv("C:/GB2/CUADERNO_1/EVA.csv")

Revisemos el encabezado de EVA.

head(EVA)
##   CÓD...DEP.       DEPARTAMENTO CÓD..MUN.  MUNICIPIO GRUPO..DE.CULTIVO
## 1         15             BOYACA     15114   BUSBANZA        HORTALIZAS
## 2         25       CUNDINAMARCA     25754     SOACHA        HORTALIZAS
## 3         25       CUNDINAMARCA     25214       COTA        HORTALIZAS
## 4         54 NORTE DE SANTANDER     54405 LOS PATIOS        HORTALIZAS
## 5         54 NORTE DE SANTANDER     54518   PAMPLONA        HORTALIZAS
## 6         68          SANTANDER     68377 LA BELLEZA        HORTALIZAS
##   SUBGRUPO..DE.CULTIVO CULTIVO DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO
## 1               ACELGA  ACELGA                                        ACELGA
## 2               ACELGA  ACELGA                                        ACELGA
## 3               ACELGA  ACELGA                                        ACELGA
## 4               ACELGA  ACELGA                                        ACELGA
## 5               ACELGA  ACELGA                                        ACELGA
## 6               ACELGA  ACELGA                                        ACELGA
##    AÑO PERIODO Área.Sembrada..ha. Área.Cosechada..ha. Producción..t.
## 1 2006   2006B                  2                   1              1
## 2 2006   2006B                 82                  80           1440
## 3 2006   2006B                  2                   2             26
## 4 2006   2006B                  3                   3             48
## 5 2006   2006B                  1                   1              5
## 6 2006   2006B                  1                   1              6
##   Rendimiento..t.ha. ESTADO.FISICO.PRODUCCION NOMBRE..CIENTIFICO
## 1               1.00             FRUTO FRESCO      BETA VULGARIS
## 2              18.00             FRUTO FRESCO      BETA VULGARIS
## 3              17.33             FRUTO FRESCO      BETA VULGARIS
## 4              16.00             FRUTO FRESCO      BETA VULGARIS
## 5              10.00             FRUTO FRESCO      BETA VULGARIS
## 6               6.00             FRUTO FRESCO      BETA VULGARIS
##   CICLO.DE.CULTIVO
## 1      TRANSITORIO
## 2      TRANSITORIO
## 3      TRANSITORIO
## 4      TRANSITORIO
## 5      TRANSITORIO
## 6      TRANSITORIO

Revisemos los nombres de los atributos de EVA.

names(EVA)
##  [1] "CÓD...DEP."                                   
##  [2] "DEPARTAMENTO"                                 
##  [3] "CÓD..MUN."                                    
##  [4] "MUNICIPIO"                                    
##  [5] "GRUPO..DE.CULTIVO"                            
##  [6] "SUBGRUPO..DE.CULTIVO"                         
##  [7] "CULTIVO"                                      
##  [8] "DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO"
##  [9] "AÑO"                                          
## [10] "PERIODO"                                      
## [11] "Área.Sembrada..ha."                           
## [12] "Área.Cosechada..ha."                          
## [13] "Producción..t."                               
## [14] "Rendimiento..t.ha."                           
## [15] "ESTADO.FISICO.PRODUCCION"                     
## [16] "NOMBRE..CIENTIFICO"                           
## [17] "CICLO.DE.CULTIVO"

Cambiemos los nombres de EVA para una mejor interpretación de los datos.

nombres = c("COD_NDEP", "DEPARTAMENTO", "COD_MUN", "MUNICIPIO", "GRUPO_CULTIVO", "SUB_CULTIVO", "CULTIVO", "DESAG", "YEAR", "PERIODO", "AREA_SIEMBRA", "AREA_COSECHA", "PRODUCCION", "RENDIMIENTO", "ESTADO", "NOMBRE", "CICLO" )
(names(EVA) = nombres)
##  [1] "COD_NDEP"      "DEPARTAMENTO"  "COD_MUN"       "MUNICIPIO"    
##  [5] "GRUPO_CULTIVO" "SUB_CULTIVO"   "CULTIVO"       "DESAG"        
##  [9] "YEAR"          "PERIODO"       "AREA_SIEMBRA"  "AREA_COSECHA" 
## [13] "PRODUCCION"    "RENDIMIENTO"   "ESTADO"        "NOMBRE"       
## [17] "CICLO"

4. Filtrar datos relevantes

Una vez cambiamos los nombres de los atributos de Eva, el siguiente paso es filtrar los datos a nuestro departamento de interés, que en este caso corresponde al Meta.

meta= dplyr::filter(EVA, DEPARTAMENTO == "META" )

Los datos correspondientes al departamento del Meta son:

head(meta)
##   COD_NDEP DEPARTAMENTO COD_MUN     MUNICIPIO GRUPO_CULTIVO SUB_CULTIVO
## 1       50         META   50270     EL DORADO      FRUTALES    AGUACATE
## 2       50         META   50400      LEJANIAS      FRUTALES    AGUACATE
## 3       50         META   50001 VILLAVICENCIO      FRUTALES    AGUACATE
## 4       50         META   50313       GRANADA      FRUTALES    AGUACATE
## 5       50         META   50270     EL DORADO      FRUTALES    AGUACATE
## 6       50         META   50400      LEJANIAS      FRUTALES    AGUACATE
##    CULTIVO    DESAG YEAR PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION
## 1 AGUACATE AGUACATE 2007    2007           64           36        511
## 2 AGUACATE AGUACATE 2007    2007           44            0          0
## 3 AGUACATE AGUACATE 2007    2007           25            0          0
## 4 AGUACATE AGUACATE 2007    2007            4            0          0
## 5 AGUACATE AGUACATE 2008    2008           72           35        490
## 6 AGUACATE AGUACATE 2008    2008           44            0          0
##   RENDIMIENTO       ESTADO                 NOMBRE      CICLO
## 1       14.19 FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 2          NA FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 3          NA FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 4          NA FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 5       14.00 FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
## 6          NA FRUTO FRESCO PERSEA AMERICANA MILL. PERMANENTE
meta.tmp <- meta %>% select("COD_MUN": "RENDIMIENTO")

Ya teniendo solo los datos correpondientes al departamento del meta, procedemos a filtrar estos mismo datos, pero ahora solo a las áreas de interés.

head(meta.tmp)
##   COD_MUN     MUNICIPIO GRUPO_CULTIVO SUB_CULTIVO  CULTIVO    DESAG YEAR
## 1   50270     EL DORADO      FRUTALES    AGUACATE AGUACATE AGUACATE 2007
## 2   50400      LEJANIAS      FRUTALES    AGUACATE AGUACATE AGUACATE 2007
## 3   50001 VILLAVICENCIO      FRUTALES    AGUACATE AGUACATE AGUACATE 2007
## 4   50313       GRANADA      FRUTALES    AGUACATE AGUACATE AGUACATE 2007
## 5   50270     EL DORADO      FRUTALES    AGUACATE AGUACATE AGUACATE 2008
## 6   50400      LEJANIAS      FRUTALES    AGUACATE AGUACATE AGUACATE 2008
##   PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1    2007           64           36        511       14.19
## 2    2007           44            0          0          NA
## 3    2007           25            0          0          NA
## 4    2007            4            0          0          NA
## 5    2008           72           35        490       14.00
## 6    2008           44            0          0          NA

5. Filtrar año de interés

Podemos observar que los datos filtrados corresponden a distintos periodos de tiempo (años). Para este caso, se requiere unicamente la lectura de los datos mas recientes, por lo que se procede a consultar a que años pertenecen los datos filtrados anteriormente.

unique(meta.tmp$YEAR)
##  [1] 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2006

Los datos filtrados correponden a un periodo de tiempo entre el 2006 y el 2018, por lo que el siguiente paso consiste en filtrar los datos para unicamente hacer la lectura de los mas recientes (2018).

meta2018 = dplyr::filter(meta.tmp, YEAR == 2018)

Estadisticas agropecuarias del departamento del Meta correspondientes al 2018.

head (meta2018)
##   COD_MUN         MUNICIPIO GRUPO_CULTIVO SUB_CULTIVO  CULTIVO    DESAG YEAR
## 1   50330           MESETAS      FRUTALES    AGUACATE AGUACATE AGUACATE 2018
## 2   50313           GRANADA      FRUTALES    AGUACATE AGUACATE AGUACATE 2018
## 3   50683 SAN JUAN DE ARAMA      FRUTALES    AGUACATE AGUACATE AGUACATE 2018
## 4   50711     VISTA HERMOSA      FRUTALES    AGUACATE AGUACATE AGUACATE 2018
## 5   50400          LEJANIAS      FRUTALES    AGUACATE AGUACATE AGUACATE 2018
## 6   50270         EL DORADO      FRUTALES    AGUACATE AGUACATE AGUACATE 2018
##   PERIODO AREA_SIEMBRA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1    2018          356          356       4984          14
## 2    2018          284          249       3486          14
## 3    2018          258          248        992           4
## 4    2018          201           91       1729          19
## 5    2018          195          185       2035          11
## 6    2018          147           79        316           4

6. Procesamiento y Análisis

En esta sección se analizan los datos resultantes de todos los procesos de filtro realizados anteriormente. Se estudiará la producción total de los distintos cultivos ubicados en el departamento del Meta.

meta2018 %>%
  filter(PRODUCCION > 0) %>%
  group_by(CULTIVO) %>%
  summarize(total_produccion = sum(PRODUCCION)) %>%
  arrange(desc(total_produccion))
## # A tibble: 40 × 2
##    CULTIVO         total_produccion
##    <chr>                      <int>
##  1 CAÑA AZUCARERA           2315889
##  2 PALMA DE ACEITE           723236
##  3 PLATANO                   458395
##  4 MAIZ                      308441
##  5 ARROZ                     272516
##  6 YUCA                      178421
##  7 PIÑA                      126800
##  8 SOYA                      112040
##  9 CITRICOS                  104791
## 10 PATILLA                    71284
## # … with 30 more rows

A continuacion, se analizará en que municipios se encuentran los cultivos y cual es su produccion total, partiendo desde la mayor hasta la menor.

meta2018 %>%
  group_by(CULTIVO, MUNICIPIO) %>%
  summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
  slice(which.max(max_prod))  %>%
  arrange(desc(max_prod))
## `summarise()` has grouped output by 'CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 41 × 3
## # Groups:   CULTIVO [41]
##    CULTIVO         MUNICIPIO     max_prod
##    <chr>           <chr>            <int>
##  1 CAÑA AZUCARERA  PUERTO LOPEZ   2315889
##  2 MAIZ            PUERTO GAITAN   184534
##  3 PLATANO         FUENTE DE ORO   153250
##  4 PALMA DE ACEITE PUERTO GAITAN   111246
##  5 SOYA            PUERTO GAITAN   100500
##  6 YUCA            FUENTE DE ORO    72259
##  7 PIÑA            PUERTO RICO      54675
##  8 ARROZ           FUENTE DE ORO    48823
##  9 PATILLA         SAN MARTIN       45150
## 10 CITRICOS        LEJANIAS         34484
## # … with 31 more rows

Luego de analizar los cultivos y en que municipios se encuentra su producción máxima, se pasará de un cultivo especifico a un grupo de cultivo y de la misma forma se indicará en que municipio se da su producción máxima.

meta2018 %>%
  group_by(GRUPO_CULTIVO,MUNICIPIO) %>%
  summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
  slice(which.max(max_prod))  %>%
  arrange(desc(max_prod))
## `summarise()` has grouped output by 'GRUPO_CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 9 × 3
## # Groups:   GRUPO_CULTIVO [9]
##   GRUPO_CULTIVO                                    MUNICIPIO     max_prod
##   <chr>                                            <chr>            <int>
## 1 OTROS PERMANENTES                                PUERTO LOPEZ   2315889
## 2 CEREALES                                         PUERTO GAITAN   184534
## 3 TUBERCULOS Y PLATANOS                            FUENTE DE ORO   153250
## 4 OLEAGINOSAS                                      PUERTO GAITAN   111246
## 5 LEGUMINOSAS                                      PUERTO GAITAN   100500
## 6 FRUTALES                                         PUERTO RICO      54675
## 7 HORTALIZAS                                       SAN MARTIN        6500
## 8 FORESTALES                                       PUERTO LOPEZ      1950
## 9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES ACACIAS              8

A continuación, se procesa y se analizan los datos del grupo del cultivo con mayor producción en el departamento del Meta, en que municipios se encuentran y su respectivo código. Dicha producción se organiza descendentemente.

meta2018 %>%
  group_by(COD_MUN, MUNICIPIO, GRUPO_CULTIVO) %>%
  filter(GRUPO_CULTIVO =='OTROS PERMANENTES') %>% 
  summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
  arrange(desc(max_prod)) -> OTROS2018
OTROS2018
## # A tibble: 29 × 4
## # Groups:   COD_MUN, MUNICIPIO [29]
##    COD_MUN MUNICIPIO            GRUPO_CULTIVO     max_prod
##      <int> <chr>                <chr>                <int>
##  1   50573 PUERTO LOPEZ         OTROS PERMANENTES  2315889
##  2   50330 MESETAS              OTROS PERMANENTES     1646
##  3   50400 LEJANIAS             OTROS PERMANENTES     1430
##  4   50350 LA MACARENA          OTROS PERMANENTES      900
##  5   50711 VISTA HERMOSA        OTROS PERMANENTES      794
##  6   50313 GRANADA              OTROS PERMANENTES      621
##  7   50245 EL CALVARIO          OTROS PERMANENTES      600
##  8   50370 LA URIBE             OTROS PERMANENTES      520
##  9   50686 SAN JUANITO          OTROS PERMANENTES      416
## 10   50223 SAN LUIS DE CUBARRAL OTROS PERMANENTES      408
## # … with 19 more rows

Al igual que con el primer grupo de cultivo, se procesa el segundo grupo, que en este caso es CEREALES, para esto se analizan aspectos como, producción total, municipios en los que se da y su respectivo código.

meta2018 %>%
  group_by(COD_MUN, MUNICIPIO, GRUPO_CULTIVO) %>%
  filter(GRUPO_CULTIVO =='CEREALES') %>% 
  summarize(max_prod = max(PRODUCCION, na.rm = TRUE)) %>%
  arrange(desc(max_prod)) -> CEREALES2018
CEREALES2018
## # A tibble: 27 × 4
## # Groups:   COD_MUN, MUNICIPIO [27]
##    COD_MUN MUNICIPIO     GRUPO_CULTIVO max_prod
##      <int> <chr>         <chr>            <int>
##  1   50568 PUERTO GAITAN CEREALES        184534
##  2   50287 FUENTE DE ORO CEREALES         48823
##  3   50573 PUERTO LOPEZ  CEREALES         43209
##  4   50001 VILLAVICENCIO CEREALES         33307
##  5   50313 GRANADA       CEREALES         19322
##  6   50226 CUMARAL       CEREALES         16388
##  7   50124 CABUYARO      CEREALES         14104
##  8   50577 PUERTO LLERAS CEREALES         11291
##  9   50711 VISTA HERMOSA CEREALES          7923
## 10   50606 RESTREPO      CEREALES          6617
## # … with 17 more rows

7. Guardar los datos

Finalmente se guardan los respectivos datos de los dos grupos de cultivo más relevantes del departamento del Meta.

#write_csv(OTROS2018, "C:/GB2/CUADERNO_1/OTROS2018.csv")
write_csv(CEREALES2018, "C:/GB2/CUADERNO_1/CEREALES2018.csv")

8. Reproducibilidad

Cuaderno realizado en base a: Lizarazo, I. Reading and processing municipal agricultural statistics for 2020. https://rpubs.com/ials2un/readingEVAv1.

sessionInfo()
## R version 4.2.1 Patched (2022-09-21 r82893 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 22000)
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=Spanish_Colombia.utf8  LC_CTYPE=Spanish_Colombia.utf8   
## [3] LC_MONETARY=Spanish_Colombia.utf8 LC_NUMERIC=C                     
## [5] LC_TIME=Spanish_Colombia.utf8    
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
##  [1] lubridate_1.9.2 forcats_1.0.0   stringr_1.5.0   dplyr_1.1.0    
##  [5] purrr_1.0.1     readr_2.1.4     tidyr_1.3.0     tibble_3.2.0   
##  [9] ggplot2_3.4.1   tidyverse_2.0.0
## 
## loaded via a namespace (and not attached):
##  [1] bslib_0.4.2      compiler_4.2.1   pillar_1.8.1     jquerylib_0.1.4 
##  [5] tools_4.2.1      bit_4.0.5        digest_0.6.31    timechange_0.2.0
##  [9] jsonlite_1.8.4   evaluate_0.20    lifecycle_1.0.3  gtable_0.3.1    
## [13] pkgconfig_2.0.3  rlang_1.1.0      cli_3.6.0        rstudioapi_0.14 
## [17] parallel_4.2.1   yaml_2.3.7       xfun_0.37        fastmap_1.1.1   
## [21] withr_2.5.0      knitr_1.42       hms_1.1.2        generics_0.1.3  
## [25] vctrs_0.6.0      sass_0.4.5       bit64_4.0.5      grid_4.2.1      
## [29] tidyselect_1.2.0 glue_1.6.2       R6_2.5.1         fansi_1.0.4     
## [33] vroom_1.6.1      rmarkdown_2.20   tzdb_0.3.0       magrittr_2.0.3  
## [37] ellipsis_0.3.2   scales_1.2.1     htmltools_0.5.4  colorspace_2.1-0
## [41] utf8_1.2.3       stringi_1.7.12   munsell_0.5.0    cachem_1.0.7    
## [45] crayon_1.5.2