Este cuaderno se usara para mostrar estadisticas de cultivos en multiples años en cualquier departamento segun los datos del EVA evaluaciones agropecuarias municipales
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(dplyr)
library(readr)
library(ggplot2)
list.files(pattern=c("csv"))
## [1] "boy_hort_2020.csv"
## [2] "boy_tuber_2020.csv"
## [3] "Ciudades.csv"
## [4] "co.csv"
## [5] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"
(eva = read_csv("Evaluaciones_Agropecuarias_Municipales_EVA.csv", col_names = TRUE,
show_col_types = FALSE))
## # A tibble: 20,576 x 17
## `CÓD. \nDEP.` DEPARTAMENTO `CÓD. MUN.` MUNICIPIO `GRUPO \nDE CULTIVO`
## <dbl> <chr> <dbl> <chr> <chr>
## 1 15 BOYACA 15114 BUSBANZA HORTALIZAS
## 2 15 BOYACA 15516 PAIPA HORTALIZAS
## 3 15 BOYACA 15491 NOBSA HORTALIZAS
## 4 15 BOYACA 15500 OICATA HORTALIZAS
## 5 15 BOYACA 15516 PAIPA HORTALIZAS
## 6 15 BOYACA 15500 OICATA HORTALIZAS
## 7 15 BOYACA 15377 LABRANZAGRANDE HORTALIZAS
## 8 15 BOYACA 15377 LABRANZAGRANDE HORTALIZAS
## 9 15 BOYACA 15491 NOBSA HORTALIZAS
## 10 15 BOYACA 15491 NOBSA HORTALIZAS
## # ... with 20,566 more rows, and 12 more variables:
## # `SUBGRUPO \nDE CULTIVO` <chr>, CULTIVO <chr>,
## # `DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO` <chr>, AÑO <dbl>,
## # PERIODO <chr>, `Área Sembrada\n(ha)` <dbl>, `Área Cosechada\n(ha)` <dbl>,
## # `Producción\n(t)` <dbl>, `Rendimiento\n(t/ha)` <dbl>,
## # `ESTADO FISICO PRODUCCION` <chr>, `NOMBRE \nCIENTIFICO` <chr>,
## # `CICLO DE CULTIVO` <chr>
names(eva)
## [1] "CÓD. \nDEP."
## [2] "DEPARTAMENTO"
## [3] "CÓD. MUN."
## [4] "MUNICIPIO"
## [5] "GRUPO \nDE CULTIVO"
## [6] "SUBGRUPO \nDE CULTIVO"
## [7] "CULTIVO"
## [8] "DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO"
## [9] "AÑO"
## [10] "PERIODO"
## [11] "Área Sembrada\n(ha)"
## [12] "Área Cosechada\n(ha)"
## [13] "Producción\n(t)"
## [14] "Rendimiento\n(t/ha)"
## [15] "ESTADO FISICO PRODUCCION"
## [16] "NOMBRE \nCIENTIFICO"
## [17] "CICLO DE CULTIVO"
eva %>% dplyr::select('CÓD. MUN.':'ESTADO FISICO PRODUCCION') -> eva.tmp
eva.tmp
## # A tibble: 20,576 x 13
## `CÓD. MUN.` MUNICIPIO `GRUPO \nDE CULTIVO` `SUBGRUPO \nDE CULT~` CULTIVO
## <dbl> <chr> <chr> <chr> <chr>
## 1 15114 BUSBANZA HORTALIZAS ACELGA ACELGA
## 2 15516 PAIPA HORTALIZAS ACELGA ACELGA
## 3 15491 NOBSA HORTALIZAS ACELGA ACELGA
## 4 15500 OICATA HORTALIZAS ACELGA ACELGA
## 5 15516 PAIPA HORTALIZAS ACELGA ACELGA
## 6 15500 OICATA HORTALIZAS ACELGA ACELGA
## 7 15377 LABRANZAGRANDE HORTALIZAS ACELGA ACELGA
## 8 15377 LABRANZAGRANDE HORTALIZAS ACELGA ACELGA
## 9 15491 NOBSA HORTALIZAS ACELGA ACELGA
## 10 15491 NOBSA HORTALIZAS ACELGA ACELGA
## # ... with 20,566 more rows, and 8 more variables:
## # `DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO` <chr>, AÑO <dbl>,
## # PERIODO <chr>, `Área Sembrada\n(ha)` <dbl>, `Área Cosechada\n(ha)` <dbl>,
## # `Producción\n(t)` <dbl>, `Rendimiento\n(t/ha)` <dbl>,
## # `ESTADO FISICO PRODUCCION` <chr>
eva.tmp %>% dplyr::rename('Cod_Mun' = 'CÓD. MUN.',
'Grupo' = 'GRUPO \nDE CULTIVO',
'Subgrupo' = 'SUBGRUPO \nDE CULTIVO',
'Year' = 'AÑO',
'AreaSembrada' = 'Área Sembrada\n(ha)',
'AreaCosechada' = 'Área Sembrada\n(ha)',
'Produccion' = 'Producción\n(t)', 'Rendimiento' = 'Rendimiento\n(t/ha)',
'Sistema' = 'DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO',
'Estado' = 'ESTADO FISICO PRODUCCION') -> new_eva
new_eva
## # A tibble: 20,576 x 13
## Cod_Mun MUNICIPIO Grupo Subgrupo CULTIVO Sistema Year PERIODO AreaCosechada
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <chr> <dbl>
## 1 15114 BUSBANZA HORT~ ACELGA ACELGA ACELGA 2006 2006B 2
## 2 15516 PAIPA HORT~ ACELGA ACELGA ACELGA 2007 2007B 1
## 3 15491 NOBSA HORT~ ACELGA ACELGA ACELGA 2010 2010B 0
## 4 15500 OICATA HORT~ ACELGA ACELGA ACELGA 2011 2011A 40
## 5 15516 PAIPA HORT~ ACELGA ACELGA ACELGA 2011 2011B 300
## 6 15500 OICATA HORT~ ACELGA ACELGA ACELGA 2011 2011B 0
## 7 15377 LABRANZAG~ HORT~ ACELGA ACELGA ACELGA 2012 2012A 2
## 8 15377 LABRANZAG~ HORT~ ACELGA ACELGA ACELGA 2012 2012B 1
## 9 15491 NOBSA HORT~ ACELGA ACELGA ACELGA 2014 2014A 1
## 10 15491 NOBSA HORT~ ACELGA ACELGA ACELGA 2014 2014B 1
## # ... with 20,566 more rows, and 4 more variables:
## # `Área Cosechada\n(ha)` <dbl>, Produccion <dbl>, Rendimiento <dbl>,
## # Estado <chr>
new_eva %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion)) %>%
arrange(desc(total_produccion))
## # A tibble: 12 x 2
## Grupo total_produccion
## <chr> <dbl>
## 1 TUBERCULOS Y PLATANOS 10388648
## 2 HORTALIZAS 4868712
## 3 OTROS PERMANENTES 2344976
## 4 FRUTALES 1610069
## 5 CEREALES 291985
## 6 LEGUMINOSAS 228791
## 7 OTROS TRANSITORIOS 8422
## 8 FLORES Y FOLLAJES 4818
## 9 FIBRAS 1114
## 10 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES 891
## 11 OLEAGINOSAS 186
## 12 HONGOS 2
new_eva %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion)) -> PT
PT %>%
filter(total_produccion > 1000000) -> main.groups
(value = sum(main.groups$total_produccion))
## [1] 19212405
main.groups$percent = main.groups$total_produccion/value
library(ggplot2)
bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupo))+
geom_bar(width = 1, stat = "identity")
pie <- bp + coord_polar("y", start=0)
pie
### 5.2 Municipalities with higher production for every group of
crops:
new_eva %>%
group_by(Grupo, MUNICIPIO) %>%
summarize(total_prod = sum(Produccion, na.rm= TRUE)) %>%
slice(which.max(total_prod)) %>%
arrange(desc(total_prod))
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
## # A tibble: 12 x 3
## # Groups: Grupo [12]
## Grupo MUNICIPIO total_prod
## <chr> <chr> <dbl>
## 1 HORTALIZAS AQUITANIA 1211476
## 2 TUBERCULOS Y PLATANOS TUNJA 1112521
## 3 OTROS PERMANENTES CHITARAQUE 793334
## 4 FRUTALES NUEVO COLON 225664
## 5 LEGUMINOSAS SAMACA 26406
## 6 CEREALES SIACHOQUE 16800
## 7 OTROS TRANSITORIOS COVARACHIA 3606
## 8 FLORES Y FOLLAJES TOCA 2209
## 9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES SOATA 671
## 10 FIBRAS COVARACHIA 268
## 11 OLEAGINOSAS PUERTO BOYACA 106
## 12 HONGOS OICATA 2
new_eva %>%
group_by(Grupo, MUNICIPIO) %>%
summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
slice(which.max(total_prod)) -> leaders
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
leaders
## # A tibble: 12 x 3
## # Groups: Grupo [12]
## Grupo MUNICIPIO total_prod
## <chr> <chr> <dbl>
## 1 CEREALES SIACHOQUE 16800
## 2 FIBRAS COVARACHIA 268
## 3 FLORES Y FOLLAJES TOCA 2209
## 4 FRUTALES NUEVO COLON 225664
## 5 HONGOS OICATA 2
## 6 HORTALIZAS AQUITANIA 1211476
## 7 LEGUMINOSAS SAMACA 26406
## 8 OLEAGINOSAS PUERTO BOYACA 106
## 9 OTROS PERMANENTES CHITARAQUE 793334
## 10 OTROS TRANSITORIOS COVARACHIA 3606
## 11 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES SOATA 671
## 12 TUBERCULOS Y PLATANOS TUNJA 1112521
leaders %>%
filter(total_prod > 50000) -> main.leaders
p<-ggplot(data=main.leaders, aes(x=MUNICIPIO, y=total_prod)) + geom_bar(stat="identity")
p
### 5.3 Dynamics of one important crop between 2007 and 2018
new_eva
## # A tibble: 20,576 x 13
## Cod_Mun MUNICIPIO Grupo Subgrupo CULTIVO Sistema Year PERIODO AreaCosechada
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <chr> <dbl>
## 1 15114 BUSBANZA HORT~ ACELGA ACELGA ACELGA 2006 2006B 2
## 2 15516 PAIPA HORT~ ACELGA ACELGA ACELGA 2007 2007B 1
## 3 15491 NOBSA HORT~ ACELGA ACELGA ACELGA 2010 2010B 0
## 4 15500 OICATA HORT~ ACELGA ACELGA ACELGA 2011 2011A 40
## 5 15516 PAIPA HORT~ ACELGA ACELGA ACELGA 2011 2011B 300
## 6 15500 OICATA HORT~ ACELGA ACELGA ACELGA 2011 2011B 0
## 7 15377 LABRANZAG~ HORT~ ACELGA ACELGA ACELGA 2012 2012A 2
## 8 15377 LABRANZAG~ HORT~ ACELGA ACELGA ACELGA 2012 2012B 1
## 9 15491 NOBSA HORT~ ACELGA ACELGA ACELGA 2014 2014A 1
## 10 15491 NOBSA HORT~ ACELGA ACELGA ACELGA 2014 2014B 1
## # ... with 20,566 more rows, and 4 more variables:
## # `Área Cosechada\n(ha)` <dbl>, Produccion <dbl>, Rendimiento <dbl>,
## # Estado <chr>
new_eva %>%
filter(MUNICIPIO=="AQUITANIA" & CULTIVO=="CEBOLLA DE RAMA") %>%
group_by(Year, CULTIVO) %>%
select(MUNICIPIO, CULTIVO, Produccion, Year) -> aquitania_hort
aquitania_hort
## # A tibble: 24 x 4
## # Groups: Year, CULTIVO [13]
## MUNICIPIO CULTIVO Produccion Year
## <chr> <chr> <dbl> <dbl>
## 1 AQUITANIA CEBOLLA DE RAMA 46000 2006
## 2 AQUITANIA CEBOLLA DE RAMA 45600 2007
## 3 AQUITANIA CEBOLLA DE RAMA 46000 2007
## 4 AQUITANIA CEBOLLA DE RAMA 46000 2008
## 5 AQUITANIA CEBOLLA DE RAMA 44000 2008
## 6 AQUITANIA CEBOLLA DE RAMA 52000 2009
## 7 AQUITANIA CEBOLLA DE RAMA 52000 2009
## 8 AQUITANIA CEBOLLA DE RAMA 44000 2010
## 9 AQUITANIA CEBOLLA DE RAMA 44000 2010
## 10 AQUITANIA CEBOLLA DE RAMA 45960 2011
## # ... with 14 more rows
g <- ggplot(aes(x=Year, y=Produccion/1000), data = aquitania_hort) + geom_bar(stat = "identity") + labs(y="Produccion de Cebolla [Ton x 1000]")
g + ggtitle("Evolution of Onion crop production in Aquitania from 2007 to 2018") + labs(caption= "Based on EVA data (MinAgricultura, 2020)")