Estadistica agropecuaria

1. Introduccion

En el contenido de este cuaderno encontraremos información estadistica sobre el departamento de Antioquia en donde analizaremos cuales son los cultivos con mayor produccion en el departamento y asi mismo realizar los filtros pertinentes para determinar los datos de nuestro interes.

  • Analizar los cultivos con mayor producción en el departamento de Antioquia
  • Realizar filtros para determinar los datos de interés
  • Identificar tendencias y patrones en los datos

2. Configuracion

En esta seccion esbribimos el codigo para cargar las librerias

library(tidyverse)
library(dplyr)

3. Datos

En esta seccion vamos a leer el archivo con los datos de estadisticas agropecuarias y lo describimos

EVA=read.csv("C:/CUADERNO1/EVA.csv")

Revisemos encabezado de EVA

head(EVA)
##   CÓD...DEP.       DEPARTAMENTO CÓD..MUN.  MUNICIPIO GRUPO..DE.CULTIVO
## 1         15             BOYACA     15114   BUSBANZA        HORTALIZAS
## 2         25       CUNDINAMARCA     25754     SOACHA        HORTALIZAS
## 3         25       CUNDINAMARCA     25214       COTA        HORTALIZAS
## 4         54 NORTE DE SANTANDER     54405 LOS PATIOS        HORTALIZAS
## 5         54 NORTE DE SANTANDER     54518   PAMPLONA        HORTALIZAS
## 6         68          SANTANDER     68377 LA BELLEZA        HORTALIZAS
##   SUBGRUPO..DE.CULTIVO CULTIVO DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO
## 1               ACELGA  ACELGA                                        ACELGA
## 2               ACELGA  ACELGA                                        ACELGA
## 3               ACELGA  ACELGA                                        ACELGA
## 4               ACELGA  ACELGA                                        ACELGA
## 5               ACELGA  ACELGA                                        ACELGA
## 6               ACELGA  ACELGA                                        ACELGA
##    AÑO PERIODO Área.Sembrada..ha. Área.Cosechada..ha. Producción..t.
## 1 2006   2006B                  2                   1              1
## 2 2006   2006B                 82                  80           1440
## 3 2006   2006B                  2                   2             26
## 4 2006   2006B                  3                   3             48
## 5 2006   2006B                  1                   1              5
## 6 2006   2006B                  1                   1              6
##   Rendimiento..t.ha. ESTADO.FISICO.PRODUCCION NOMBRE..CIENTIFICO
## 1               1.00             FRUTO FRESCO      BETA VULGARIS
## 2              18.00             FRUTO FRESCO      BETA VULGARIS
## 3              17.33             FRUTO FRESCO      BETA VULGARIS
## 4              16.00             FRUTO FRESCO      BETA VULGARIS
## 5              10.00             FRUTO FRESCO      BETA VULGARIS
## 6               6.00             FRUTO FRESCO      BETA VULGARIS
##   CICLO.DE.CULTIVO
## 1      TRANSITORIO
## 2      TRANSITORIO
## 3      TRANSITORIO
## 4      TRANSITORIO
## 5      TRANSITORIO
## 6      TRANSITORIO

revisemos los nombres de los atributos de EVA

names(EVA)
##  [1] "CÓD...DEP."                                   
##  [2] "DEPARTAMENTO"                                 
##  [3] "CÓD..MUN."                                    
##  [4] "MUNICIPIO"                                    
##  [5] "GRUPO..DE.CULTIVO"                            
##  [6] "SUBGRUPO..DE.CULTIVO"                         
##  [7] "CULTIVO"                                      
##  [8] "DESAGREGACIÓN.REGIONAL.Y.O.SISTEMA.PRODUCTIVO"
##  [9] "AÑO"                                          
## [10] "PERIODO"                                      
## [11] "Área.Sembrada..ha."                           
## [12] "Área.Cosechada..ha."                          
## [13] "Producción..t."                               
## [14] "Rendimiento..t.ha."                           
## [15] "ESTADO.FISICO.PRODUCCION"                     
## [16] "NOMBRE..CIENTIFICO"                           
## [17] "CICLO.DE.CULTIVO"

Cambiemos los nombres de EVA para una mejor interpretación de los datos

nombres=c("COD_DEP","DEP","COD_MUN","MUN","GRUPO_CULTIVO", "SUBGRUPO CULTIVO","CULTIVO","DESAG","YEAR","PERIODO","AREA_SEMBRADA","AREA_COSECHA","PRODUCCION","RENDIMIENTO","ESTADO","NOMBRE","CICLO")
(names(EVA)=nombres)
##  [1] "COD_DEP"          "DEP"              "COD_MUN"          "MUN"             
##  [5] "GRUPO_CULTIVO"    "SUBGRUPO CULTIVO" "CULTIVO"          "DESAG"           
##  [9] "YEAR"             "PERIODO"          "AREA_SEMBRADA"    "AREA_COSECHA"    
## [13] "PRODUCCION"       "RENDIMIENTO"      "ESTADO"           "NOMBRE"          
## [17] "CICLO"

4. Filtrar datos de EVA para el departamento de antioquia

Una vez que hemos cambiado el nombre del atributo Eva, el siguiente paso es filtrar los datos al sector que nos interesa, que en este caso corresponde al departamento de Antioquia.

antioquia = dplyr::filter(EVA, DEP == "ANTIOQUIA")

Los datos correspondientes al departamento de Antioquia son:

head(antioquia) 
##   COD_DEP       DEP COD_MUN       MUN         GRUPO_CULTIVO SUBGRUPO CULTIVO
## 1       5 ANTIOQUIA    5440 MARINILLA            HORTALIZAS           ACELGA
## 2       5 ANTIOQUIA    5440 MARINILLA            HORTALIZAS           ACELGA
## 3       5 ANTIOQUIA    5440 MARINILLA            HORTALIZAS           ACELGA
## 4       5 ANTIOQUIA    5440 MARINILLA            HORTALIZAS           ACELGA
## 5       5 ANTIOQUIA    5440 MARINILLA            HORTALIZAS           ACELGA
## 6       5 ANTIOQUIA    5475   MURINDO TUBERCULOS Y PLATANOS          MALANGA
##   CULTIVO  DESAG YEAR PERIODO AREA_SEMBRADA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1  ACELGA ACELGA 2016   2016A            11           11        297       27.00
## 2  ACELGA ACELGA 2016   2016B            11           11        297       27.00
## 3  ACELGA ACELGA 2017   2017A             9            9        243       27.00
## 4  ACELGA ACELGA 2017   2017B            15           15        422       28.10
## 5  ACELGA ACELGA 2018   2018A            10           10        277       27.68
## 6 MALANGA  ACHIN 2011    2011             6            6        209       37.40
##             ESTADO              NOMBRE       CICLO
## 1     FRUTO FRESCO       BETA VULGARIS TRANSITORIO
## 2     FRUTO FRESCO       BETA VULGARIS TRANSITORIO
## 3     FRUTO FRESCO       BETA VULGARIS TRANSITORIO
## 4     FRUTO FRESCO       BETA VULGARIS TRANSITORIO
## 5     FRUTO FRESCO       BETA VULGARIS TRANSITORIO
## 6 TUBERCULO FRESCO COLOCASIA ESCULENTA       ANUAL
antioquia.tmp = antioquia %>% select ("COD_MUN":"RENDIMIENTO")

En esta seccion procedemos a filtrar los datos correspondientes al departamento de Antioquia pero soalente las areas de interes.

head(antioquia.tmp) 
##   COD_MUN       MUN         GRUPO_CULTIVO SUBGRUPO CULTIVO CULTIVO  DESAG YEAR
## 1    5440 MARINILLA            HORTALIZAS           ACELGA  ACELGA ACELGA 2016
## 2    5440 MARINILLA            HORTALIZAS           ACELGA  ACELGA ACELGA 2016
## 3    5440 MARINILLA            HORTALIZAS           ACELGA  ACELGA ACELGA 2017
## 4    5440 MARINILLA            HORTALIZAS           ACELGA  ACELGA ACELGA 2017
## 5    5440 MARINILLA            HORTALIZAS           ACELGA  ACELGA ACELGA 2018
## 6    5475   MURINDO TUBERCULOS Y PLATANOS          MALANGA MALANGA  ACHIN 2011
##   PERIODO AREA_SEMBRADA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1   2016A            11           11        297       27.00
## 2   2016B            11           11        297       27.00
## 3   2017A             9            9        243       27.00
## 4   2017B            15           15        422       28.10
## 5   2018A            10           10        277       27.68
## 6    2011             6            6        209       37.40

5. Seleccionar atributos relevantes y año de interes

Podemos ver que los datos filtrados corresponden a diferentes periodos de tiempo . Para este caso, solo se necesita leer los datos más recientes como lo son los datos del (2018), por lo que continuamos consultando a qué años pertenecen los datos previamente filtrados.

unique(antioquia.tmp$YEAR) 
##  [1] 2016 2017 2018 2011 2013 2014 2015 2007 2008 2009 2010 2012 2006

En esta seccion filtramos los datos para solo tener los del año (2018)

antioquia2018 = dplyr::filter(antioquia.tmp, YEAR== 2018)

Estadisticas agropecuarias del departamento de Antioquia del año (2018)

head(antioquia2018) 
##   COD_MUN                MUN GRUPO_CULTIVO  SUBGRUPO CULTIVO  CULTIVO    DESAG
## 1    5440          MARINILLA    HORTALIZAS            ACELGA   ACELGA   ACELGA
## 2    5148  CARMEN DE VIBORAL      FRUTALES FRUTALES EXOTICOS    AGRAZ    AGRAZ
## 3    5686 SANTA ROSA DE OSOS      FRUTALES FRUTALES EXOTICOS    AGRAZ    AGRAZ
## 4    5264         ENTRERRIOS      FRUTALES FRUTALES EXOTICOS    AGRAZ    AGRAZ
## 5    5647         SAN ANDRES      FRUTALES FRUTALES EXOTICOS    AGRAZ    AGRAZ
## 6    5847              URRAO      FRUTALES          AGUACATE AGUACATE AGUACATE
##   YEAR PERIODO AREA_SEMBRADA AREA_COSECHA PRODUCCION RENDIMIENTO
## 1 2018   2018A            10           10        277       27.68
## 2 2018    2018             6            3         10        4.00
## 3 2018    2018             4            3          5        1.50
## 4 2018    2018             2            0          0          NA
## 5 2018    2018             2            0          0          NA
## 6 2018    2018          2490         1616      53328       33.00

6. Procesamiento y analisis

En esta sección, se analizan los datos resultantes de todos los procedimientos de filtrado realizados anteriormente. Se estudiará la producción total de los diferentes cultivos en el departamento de Antioquia.

antioquia2018 %>%
  filter(PRODUCCION > 0) %>%
  group_by(CULTIVO) %>%
  summarize(TOTAL_PRODUCCION = sum(PRODUCCION)) %>% 
  arrange(desc(TOTAL_PRODUCCION)) -> CULTIVOS2018
CULTIVOS2018
## # A tibble: 81 × 2
##    CULTIVO         TOTAL_PRODUCCION
##    <chr>                      <int>
##  1 BANANO                   1246012
##  2 PLATANO                   471097
##  3 CAÑA PANELERA             180905
##  4 YUCA                      170543
##  5 CAFE                      141897
##  6 AGUACATE                  137293
##  7 TOMATE                    115269
##  8 NARANJA                    96181
##  9 TOMATE DE ARBOL            89082
## 10 PAPA                       79345
## # … with 71 more rows

A continuacion, se analizará en que municipios se encuentran los cultivos y cual es su produccion total, partiendo desde la mayor hasta la menor.

antioquia2018 %>%
  group_by(GRUPO_CULTIVO, MUN) %>%
  summarize(MAX_PROD = max(PRODUCCION, na.rm = TRUE)) %>%
  slice(which.max(MAX_PROD))  %>%
  arrange(desc(MAX_PROD)) 
## `summarise()` has grouped output by 'GRUPO_CULTIVO'. You can override using the
## `.groups` argument.
## # A tibble: 11 × 3
## # Groups:   GRUPO_CULTIVO [11]
##    GRUPO_CULTIVO                                    MUN         MAX_PROD
##    <chr>                                            <chr>          <int>
##  1 FRUTALES                                         TURBO         361742
##  2 TUBERCULOS Y PLATANOS                            TURBO          84968
##  3 HORTALIZAS                                       PEÑOL          32400
##  4 OTROS PERMANENTES                                YOLOMBO        20880
##  5 CEREALES                                         NECOCLI         9360
##  6 FLORES Y FOLLAJES                                LA UNION        5320
##  7 OLEAGINOSAS                                      MUTATA          2350
##  8 LEGUMINOSAS                                      SAN VICENTE     1595
##  9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES RIONEGRO         788
## 10 FORESTALES                                       CACERES          560
## 11 FIBRAS                                           URRAO            251

En esta sección se procesa y se analizan los datos del grupo del cultivo con mayor producción en el departamento del Antioquia, en que municipios se encuentran y su respectivo código. Dicha producción se organiza descendentemente.

antioquia2018 %>%
  group_by(COD_MUN, MUN, GRUPO_CULTIVO) %>%
  filter(GRUPO_CULTIVO=="FRUTALES") %>% 
  summarize(MAX_PROD = max(PRODUCCION, na.rm = TRUE)) %>%
  arrange(desc(MAX_PROD)) -> frutales2018 
frutales2018 
## # A tibble: 106 × 4
## # Groups:   COD_MUN, MUN [106]
##    COD_MUN MUN                GRUPO_CULTIVO MAX_PROD
##      <int> <chr>              <chr>            <int>
##  1    5837 TURBO              FRUTALES        361742
##  2    5147 CAREPA             FRUTALES        359795
##  3    5045 APARTADO           FRUTALES        350000
##  4    5172 CHIGORODO          FRUTALES        125234
##  5    5847 URRAO              FRUTALES         53328
##  6    5686 SANTA ROSA DE OSOS FRUTALES         51590
##  7    5034 ANDES              FRUTALES         35945
##  8    5282 FREDONIA           FRUTALES         28467
##  9    5756 SONSON             FRUTALES         20250
## 10    5856 VALPARAISO         FRUTALES         19280
## # … with 96 more rows

En esta sección se procesa y se analizan los datos del grupo del segundo cultivo con mayor producción en el departamento del Antioquia, en que municipios se encuentran y su respectivo código. Dicha producción se organiza descendentemente.

antioquia2018 %>%
  group_by(COD_MUN, MUN, GRUPO_CULTIVO) %>%
  filter(GRUPO_CULTIVO=="TUBERCULOS Y PLATANOS") %>% 
  summarize(MAX_PROD = max(PRODUCCION, na.rm = TRUE)) %>%
  arrange(desc(MAX_PROD)) -> tuberyplat2018 
tuberyplat2018 
## # A tibble: 118 × 4
## # Groups:   COD_MUN, MUN [118]
##    COD_MUN MUN                GRUPO_CULTIVO         MAX_PROD
##      <int> <chr>              <chr>                    <int>
##  1    5837 TURBO              TUBERCULOS Y PLATANOS    84968
##  2    5893 YONDO              TUBERCULOS Y PLATANOS    54000
##  3    5659 SAN JUAN DE URABA  TUBERCULOS Y PLATANOS    47560
##  4    5490 NECOCLI            TUBERCULOS Y PLATANOS    23090
##  5    5250 EL BAGRE           TUBERCULOS Y PLATANOS    18000
##  6    5051 ARBOLETES          TUBERCULOS Y PLATANOS    17505
##  7    5756 SONSON             TUBERCULOS Y PLATANOS    17160
##  8    5368 JERICO             TUBERCULOS Y PLATANOS    16750
##  9    5686 SANTA ROSA DE OSOS TUBERCULOS Y PLATANOS    15500
## 10    5674 SAN VICENTE        TUBERCULOS Y PLATANOS    15400
## # … with 108 more rows

7. Guardar los datos

En esta sección se guardan los respectivos datos de los dos grupos de cultivo más relevantes del departamento del Antioquia.

#write_csv(frutales2018, "C:/CUADERNO1/frutales2018.csv")
write_csv(tuberyplat2018,"C:/CUADERNO1/tuberyplat2018.csv")

8. Reproducibilidad

Cuaderno realizado en base a: Lizarazo, I. Reading and processing municipal agricultural statistics for 2020. https://rpubs.com/ials2un/readingEVAv1.

sessionInfo()
## R version 4.2.1 Patched (2022-09-21 r82893 ucrt)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 22000)
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=Spanish_Colombia.utf8  LC_CTYPE=Spanish_Colombia.utf8   
## [3] LC_MONETARY=Spanish_Colombia.utf8 LC_NUMERIC=C                     
## [5] LC_TIME=Spanish_Colombia.utf8    
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
##  [1] lubridate_1.9.2 forcats_1.0.0   stringr_1.5.0   dplyr_1.1.0    
##  [5] purrr_1.0.1     readr_2.1.4     tidyr_1.3.0     tibble_3.2.0   
##  [9] ggplot2_3.4.1   tidyverse_2.0.0
## 
## loaded via a namespace (and not attached):
##  [1] bslib_0.4.2      compiler_4.2.1   pillar_1.8.1     jquerylib_0.1.4 
##  [5] tools_4.2.1      bit_4.0.5        digest_0.6.31    timechange_0.2.0
##  [9] jsonlite_1.8.4   evaluate_0.20    lifecycle_1.0.3  gtable_0.3.1    
## [13] pkgconfig_2.0.3  rlang_1.1.0      cli_3.6.0        rstudioapi_0.14 
## [17] parallel_4.2.1   yaml_2.3.7       xfun_0.37        fastmap_1.1.1   
## [21] withr_2.5.0      knitr_1.42       hms_1.1.2        generics_0.1.3  
## [25] vctrs_0.6.0      sass_0.4.5       bit64_4.0.5      grid_4.2.1      
## [29] tidyselect_1.2.0 glue_1.6.2       R6_2.5.1         fansi_1.0.4     
## [33] vroom_1.6.1      rmarkdown_2.20   tzdb_0.3.0       magrittr_2.0.3  
## [37] ellipsis_0.3.2   scales_1.2.1     htmltools_0.5.4  colorspace_2.1-0
## [41] utf8_1.2.3       stringi_1.7.12   munsell_0.5.0    cachem_1.0.7    
## [45] crayon_1.5.2