1. Introducción

Este cuaderno se usara para mostrar estadisticas de cultivos en multiples años en cualquier departamento segun los datos del EVA evaluaciones agropecuarias municipales

2. Configuración

library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.6     v dplyr   1.0.8
## v tidyr   1.2.0     v stringr 1.4.0
## v readr   2.1.2     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(dplyr)
library(readr)
library(ggplot2)

3. Download the multi-year EVA dataset for your department

list.files(pattern=c("csv"))
## [1] "boy_hort_2020.csv"                             
## [2] "boy_tuber_2020.csv"                            
## [3] "Ciudades.csv"                                  
## [4] "co.csv"                                        
## [5] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"
(eva = read_csv("Evaluaciones_Agropecuarias_Municipales_EVA.csv", col_names = TRUE,
                show_col_types = FALSE))
## # A tibble: 20,576 x 17
##    `CÓD. \nDEP.` DEPARTAMENTO `CÓD. MUN.` MUNICIPIO      `GRUPO \nDE CULTIVO`
##            <dbl> <chr>              <dbl> <chr>          <chr>               
##  1            15 BOYACA             15114 BUSBANZA       HORTALIZAS          
##  2            15 BOYACA             15516 PAIPA          HORTALIZAS          
##  3            15 BOYACA             15491 NOBSA          HORTALIZAS          
##  4            15 BOYACA             15500 OICATA         HORTALIZAS          
##  5            15 BOYACA             15516 PAIPA          HORTALIZAS          
##  6            15 BOYACA             15500 OICATA         HORTALIZAS          
##  7            15 BOYACA             15377 LABRANZAGRANDE HORTALIZAS          
##  8            15 BOYACA             15377 LABRANZAGRANDE HORTALIZAS          
##  9            15 BOYACA             15491 NOBSA          HORTALIZAS          
## 10            15 BOYACA             15491 NOBSA          HORTALIZAS          
## # ... with 20,566 more rows, and 12 more variables:
## #   `SUBGRUPO \nDE CULTIVO` <chr>, CULTIVO <chr>,
## #   `DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO` <chr>, AÑO <dbl>,
## #   PERIODO <chr>, `Área Sembrada\n(ha)` <dbl>, `Área Cosechada\n(ha)` <dbl>,
## #   `Producción\n(t)` <dbl>, `Rendimiento\n(t/ha)` <dbl>,
## #   `ESTADO FISICO PRODUCCION` <chr>, `NOMBRE \nCIENTIFICO` <chr>,
## #   `CICLO DE CULTIVO` <chr>
names(eva)
##  [1] "CÓD. \nDEP."                                  
##  [2] "DEPARTAMENTO"                                 
##  [3] "CÓD. MUN."                                    
##  [4] "MUNICIPIO"                                    
##  [5] "GRUPO \nDE CULTIVO"                           
##  [6] "SUBGRUPO \nDE CULTIVO"                        
##  [7] "CULTIVO"                                      
##  [8] "DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO"
##  [9] "AÑO"                                          
## [10] "PERIODO"                                      
## [11] "Área Sembrada\n(ha)"                          
## [12] "Área Cosechada\n(ha)"                         
## [13] "Producción\n(t)"                              
## [14] "Rendimiento\n(t/ha)"                          
## [15] "ESTADO FISICO PRODUCCION"                     
## [16] "NOMBRE \nCIENTIFICO"                          
## [17] "CICLO DE CULTIVO"

4. Clean the EVA dataset

eva %>% dplyr::select('CÓD. MUN.':'ESTADO FISICO PRODUCCION') -> eva.tmp
eva.tmp
## # A tibble: 20,576 x 13
##    `CÓD. MUN.` MUNICIPIO      `GRUPO \nDE CULTIVO` `SUBGRUPO \nDE CULT~` CULTIVO
##          <dbl> <chr>          <chr>                <chr>                 <chr>  
##  1       15114 BUSBANZA       HORTALIZAS           ACELGA                ACELGA 
##  2       15516 PAIPA          HORTALIZAS           ACELGA                ACELGA 
##  3       15491 NOBSA          HORTALIZAS           ACELGA                ACELGA 
##  4       15500 OICATA         HORTALIZAS           ACELGA                ACELGA 
##  5       15516 PAIPA          HORTALIZAS           ACELGA                ACELGA 
##  6       15500 OICATA         HORTALIZAS           ACELGA                ACELGA 
##  7       15377 LABRANZAGRANDE HORTALIZAS           ACELGA                ACELGA 
##  8       15377 LABRANZAGRANDE HORTALIZAS           ACELGA                ACELGA 
##  9       15491 NOBSA          HORTALIZAS           ACELGA                ACELGA 
## 10       15491 NOBSA          HORTALIZAS           ACELGA                ACELGA 
## # ... with 20,566 more rows, and 8 more variables:
## #   `DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO` <chr>, AÑO <dbl>,
## #   PERIODO <chr>, `Área Sembrada\n(ha)` <dbl>, `Área Cosechada\n(ha)` <dbl>,
## #   `Producción\n(t)` <dbl>, `Rendimiento\n(t/ha)` <dbl>,
## #   `ESTADO FISICO PRODUCCION` <chr>
eva.tmp %>%  dplyr::rename('Cod_Mun' = 'CÓD. MUN.', 
                         'Grupo' = 'GRUPO \nDE CULTIVO',
                         'Subgrupo' = 'SUBGRUPO \nDE CULTIVO', 
                         'Year' = 'AÑO',
                         'AreaSembrada' = 'Área Sembrada\n(ha)',
                         'AreaCosechada' = 'Área Sembrada\n(ha)',
                         'Produccion' = 'Producción\n(t)',                                                                 'Rendimiento' =  'Rendimiento\n(t/ha)',   
                         'Sistema' = 'DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO',
                         'Estado' = 'ESTADO FISICO PRODUCCION') -> new_eva
new_eva
## # A tibble: 20,576 x 13
##    Cod_Mun MUNICIPIO  Grupo Subgrupo CULTIVO Sistema  Year PERIODO AreaCosechada
##      <dbl> <chr>      <chr> <chr>    <chr>   <chr>   <dbl> <chr>           <dbl>
##  1   15114 BUSBANZA   HORT~ ACELGA   ACELGA  ACELGA   2006 2006B               2
##  2   15516 PAIPA      HORT~ ACELGA   ACELGA  ACELGA   2007 2007B               1
##  3   15491 NOBSA      HORT~ ACELGA   ACELGA  ACELGA   2010 2010B               0
##  4   15500 OICATA     HORT~ ACELGA   ACELGA  ACELGA   2011 2011A              40
##  5   15516 PAIPA      HORT~ ACELGA   ACELGA  ACELGA   2011 2011B             300
##  6   15500 OICATA     HORT~ ACELGA   ACELGA  ACELGA   2011 2011B               0
##  7   15377 LABRANZAG~ HORT~ ACELGA   ACELGA  ACELGA   2012 2012A               2
##  8   15377 LABRANZAG~ HORT~ ACELGA   ACELGA  ACELGA   2012 2012B               1
##  9   15491 NOBSA      HORT~ ACELGA   ACELGA  ACELGA   2014 2014A               1
## 10   15491 NOBSA      HORT~ ACELGA   ACELGA  ACELGA   2014 2014B               1
## # ... with 20,566 more rows, and 4 more variables:
## #   `Área Cosechada\n(ha)` <dbl>, Produccion <dbl>, Rendimiento <dbl>,
## #   Estado <chr>

5. Data analysis

5.1 The most importance crops between 2007 and 2018

new_eva %>%
  group_by(Grupo) %>%
  summarize(total_produccion = sum(Produccion)) %>%
  arrange(desc(total_produccion))
## # A tibble: 12 x 2
##    Grupo                                            total_produccion
##    <chr>                                                       <dbl>
##  1 TUBERCULOS Y PLATANOS                                    10388648
##  2 HORTALIZAS                                                4868712
##  3 OTROS PERMANENTES                                         2344976
##  4 FRUTALES                                                  1610069
##  5 CEREALES                                                   291985
##  6 LEGUMINOSAS                                                228791
##  7 OTROS TRANSITORIOS                                           8422
##  8 FLORES Y FOLLAJES                                            4818
##  9 FIBRAS                                                       1114
## 10 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES              891
## 11 OLEAGINOSAS                                                   186
## 12 HONGOS                                                          2
new_eva %>%
  group_by(Grupo) %>%
  summarize(total_produccion = sum(Produccion)) -> PT 
PT %>% 
  filter(total_produccion > 1000000) -> main.groups
(value = sum(main.groups$total_produccion))
## [1] 19212405
main.groups$percent = main.groups$total_produccion/value
library(ggplot2)
bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupo))+
geom_bar(width = 1, stat = "identity")
pie <- bp + coord_polar("y", start=0)
pie

### 5.2 Municipalities with higher production for every group of crops:

new_eva %>%
  group_by(Grupo, MUNICIPIO) %>%
  summarize(total_prod = sum(Produccion, na.rm= TRUE)) %>%
  slice(which.max(total_prod)) %>%
  arrange(desc(total_prod))
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
## # A tibble: 12 x 3
## # Groups:   Grupo [12]
##    Grupo                                            MUNICIPIO     total_prod
##    <chr>                                            <chr>              <dbl>
##  1 HORTALIZAS                                       AQUITANIA        1211476
##  2 TUBERCULOS Y PLATANOS                            TUNJA            1112521
##  3 OTROS PERMANENTES                                CHITARAQUE        793334
##  4 FRUTALES                                         NUEVO COLON       225664
##  5 LEGUMINOSAS                                      SAMACA             26406
##  6 CEREALES                                         SIACHOQUE          16800
##  7 OTROS TRANSITORIOS                               COVARACHIA          3606
##  8 FLORES Y FOLLAJES                                TOCA                2209
##  9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES SOATA                671
## 10 FIBRAS                                           COVARACHIA           268
## 11 OLEAGINOSAS                                      PUERTO BOYACA        106
## 12 HONGOS                                           OICATA                 2
new_eva %>%
  group_by(Grupo, MUNICIPIO) %>%
  summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
  slice(which.max(total_prod))  -> leaders
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
leaders
## # A tibble: 12 x 3
## # Groups:   Grupo [12]
##    Grupo                                            MUNICIPIO     total_prod
##    <chr>                                            <chr>              <dbl>
##  1 CEREALES                                         SIACHOQUE          16800
##  2 FIBRAS                                           COVARACHIA           268
##  3 FLORES Y FOLLAJES                                TOCA                2209
##  4 FRUTALES                                         NUEVO COLON       225664
##  5 HONGOS                                           OICATA                 2
##  6 HORTALIZAS                                       AQUITANIA        1211476
##  7 LEGUMINOSAS                                      SAMACA             26406
##  8 OLEAGINOSAS                                      PUERTO BOYACA        106
##  9 OTROS PERMANENTES                                CHITARAQUE        793334
## 10 OTROS TRANSITORIOS                               COVARACHIA          3606
## 11 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES SOATA                671
## 12 TUBERCULOS Y PLATANOS                            TUNJA            1112521
leaders %>%
  filter(total_prod > 50000) -> main.leaders
p<-ggplot(data=main.leaders, aes(x=MUNICIPIO, y=total_prod)) + geom_bar(stat="identity")
p

### 5.3 Dynamics of one important crop between 2007 and 2018

new_eva
## # A tibble: 20,576 x 13
##    Cod_Mun MUNICIPIO  Grupo Subgrupo CULTIVO Sistema  Year PERIODO AreaCosechada
##      <dbl> <chr>      <chr> <chr>    <chr>   <chr>   <dbl> <chr>           <dbl>
##  1   15114 BUSBANZA   HORT~ ACELGA   ACELGA  ACELGA   2006 2006B               2
##  2   15516 PAIPA      HORT~ ACELGA   ACELGA  ACELGA   2007 2007B               1
##  3   15491 NOBSA      HORT~ ACELGA   ACELGA  ACELGA   2010 2010B               0
##  4   15500 OICATA     HORT~ ACELGA   ACELGA  ACELGA   2011 2011A              40
##  5   15516 PAIPA      HORT~ ACELGA   ACELGA  ACELGA   2011 2011B             300
##  6   15500 OICATA     HORT~ ACELGA   ACELGA  ACELGA   2011 2011B               0
##  7   15377 LABRANZAG~ HORT~ ACELGA   ACELGA  ACELGA   2012 2012A               2
##  8   15377 LABRANZAG~ HORT~ ACELGA   ACELGA  ACELGA   2012 2012B               1
##  9   15491 NOBSA      HORT~ ACELGA   ACELGA  ACELGA   2014 2014A               1
## 10   15491 NOBSA      HORT~ ACELGA   ACELGA  ACELGA   2014 2014B               1
## # ... with 20,566 more rows, and 4 more variables:
## #   `Área Cosechada\n(ha)` <dbl>, Produccion <dbl>, Rendimiento <dbl>,
## #   Estado <chr>
new_eva %>% 
  filter(MUNICIPIO=="AQUITANIA" & CULTIVO=="CEBOLLA DE RAMA") %>% 
  group_by(Year, CULTIVO) %>%
  select(MUNICIPIO, CULTIVO, Produccion, Year) ->  aquitania_hort
aquitania_hort
## # A tibble: 24 x 4
## # Groups:   Year, CULTIVO [13]
##    MUNICIPIO CULTIVO         Produccion  Year
##    <chr>     <chr>                <dbl> <dbl>
##  1 AQUITANIA CEBOLLA DE RAMA      46000  2006
##  2 AQUITANIA CEBOLLA DE RAMA      45600  2007
##  3 AQUITANIA CEBOLLA DE RAMA      46000  2007
##  4 AQUITANIA CEBOLLA DE RAMA      46000  2008
##  5 AQUITANIA CEBOLLA DE RAMA      44000  2008
##  6 AQUITANIA CEBOLLA DE RAMA      52000  2009
##  7 AQUITANIA CEBOLLA DE RAMA      52000  2009
##  8 AQUITANIA CEBOLLA DE RAMA      44000  2010
##  9 AQUITANIA CEBOLLA DE RAMA      44000  2010
## 10 AQUITANIA CEBOLLA DE RAMA      45960  2011
## # ... with 14 more rows
g <- ggplot(aes(x=Year, y=Produccion/1000), data = aquitania_hort) + geom_bar(stat = "identity") + labs(y="Produccion de Cebolla [Ton x 1000]")
g + ggtitle("Evolution of Onion crop production in Aquitania from 2007 to 2018") + labs(caption= "Based on EVA data (MinAgricultura, 2020)")