library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5 v purrr 0.3.4
## v tibble 3.1.6 v dplyr 1.0.8
## v tidyr 1.2.0 v stringr 1.4.0
## v readr 2.1.2 v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(dplyr)
library(readr)
library(ggplot2)
list.files("C:/Users/EPI_m/OneDrive/Documentos/R estudio", pattern=c('csv'))
## [1] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"
## [2] "Vichada_Cereales_2020.csv"
## [3] "Vichada_platanos_2020.csv"
## [4] "Vichada_Tuberculos_2020.csv"
(eva = read_csv("C:/Users/EPI_m/OneDrive/Documentos/R estudio/Evaluaciones_Agropecuarias_Municipales_EVA.csv", col_names = TRUE,
show_col_types = FALSE))
## # A tibble: 668 x 17
## `CÓD. \nDEP.` DEPARTAMENTO `CÓD. MUN.` MUNICIPIO `GRUPO \nDE CULTIVO`
## <dbl> <chr> <dbl> <chr> <chr>
## 1 99 VICHADA 99524 LA PRIMAVERA FRUTALES
## 2 99 VICHADA 99524 LA PRIMAVERA FRUTALES
## 3 99 VICHADA 99524 LA PRIMAVERA FRUTALES
## 4 99 VICHADA 99524 LA PRIMAVERA FRUTALES
## 5 99 VICHADA 99524 LA PRIMAVERA FRUTALES
## 6 99 VICHADA 99001 PUERTO CARREÑO HORTALIZAS
## 7 99 VICHADA 99773 CUMARIBO HORTALIZAS
## 8 99 VICHADA 99524 LA PRIMAVERA HORTALIZAS
## 9 99 VICHADA 99624 SANTA ROSALIA HORTALIZAS
## 10 99 VICHADA 99001 PUERTO CARREÑO HORTALIZAS
## # ... with 658 more rows, and 12 more variables: `SUBGRUPO \nDE CULTIVO` <chr>,
## # CULTIVO <chr>, `DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO` <chr>,
## # AÑO <dbl>, PERIODO <chr>, `Área Sembrada\n(ha)` <dbl>,
## # `Área Cosechada\n(ha)` <dbl>, `Producción\n(t)` <dbl>,
## # `Rendimiento\n(t/ha)` <dbl>, `ESTADO FISICO PRODUCCION` <chr>,
## # `NOMBRE \nCIENTIFICO` <chr>, `CICLO DE CULTIVO` <chr>
names(eva)
## [1] "CÓD. \nDEP."
## [2] "DEPARTAMENTO"
## [3] "CÓD. MUN."
## [4] "MUNICIPIO"
## [5] "GRUPO \nDE CULTIVO"
## [6] "SUBGRUPO \nDE CULTIVO"
## [7] "CULTIVO"
## [8] "DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO"
## [9] "AÑO"
## [10] "PERIODO"
## [11] "Área Sembrada\n(ha)"
## [12] "Área Cosechada\n(ha)"
## [13] "Producción\n(t)"
## [14] "Rendimiento\n(t/ha)"
## [15] "ESTADO FISICO PRODUCCION"
## [16] "NOMBRE \nCIENTIFICO"
## [17] "CICLO DE CULTIVO"
eva %>% dplyr::select('CÓD. MUN.':'ESTADO FISICO PRODUCCION') -> eva.tmp
eva.tmp
## # A tibble: 668 x 13
## `CÓD. MUN.` MUNICIPIO `GRUPO \nDE CULTIVO` `SUBGRUPO \nDE CULT~` CULTIVO
## <dbl> <chr> <chr> <chr> <chr>
## 1 99524 LA PRIMAVERA FRUTALES AGUACATE AGUACA~
## 2 99524 LA PRIMAVERA FRUTALES AGUACATE AGUACA~
## 3 99524 LA PRIMAVERA FRUTALES AGUACATE AGUACA~
## 4 99524 LA PRIMAVERA FRUTALES AGUACATE AGUACA~
## 5 99524 LA PRIMAVERA FRUTALES AGUACATE AGUACA~
## 6 99001 PUERTO CARREÑO HORTALIZAS AHUYAMA AHUYAMA
## 7 99773 CUMARIBO HORTALIZAS AHUYAMA AHUYAMA
## 8 99524 LA PRIMAVERA HORTALIZAS AHUYAMA AHUYAMA
## 9 99624 SANTA ROSALIA HORTALIZAS AHUYAMA AHUYAMA
## 10 99001 PUERTO CARREÑO HORTALIZAS AHUYAMA AHUYAMA
## # ... with 658 more rows, and 8 more variables:
## # `DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO` <chr>, AÑO <dbl>,
## # PERIODO <chr>, `Área Sembrada\n(ha)` <dbl>, `Área Cosechada\n(ha)` <dbl>,
## # `Producción\n(t)` <dbl>, `Rendimiento\n(t/ha)` <dbl>,
## # `ESTADO FISICO PRODUCCION` <chr>
eva.tmp %>% dplyr::rename('Cod_Mun' = 'CÓD. MUN.',
'Grupo' = 'GRUPO \nDE CULTIVO',
'Subgrupo' = 'SUBGRUPO \nDE CULTIVO',
'Year' = 'AÑO',
'AreaSembrada' = 'Área Sembrada\n(ha)',
'AreaCosechada' = 'Área Sembrada\n(ha)',
'Produccion' = 'Producción\n(t)', 'Rendimiento' = 'Rendimiento\n(t/ha)',
'Sistema' = 'DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO',
'Estado' = 'ESTADO FISICO PRODUCCION') -> new_eva
new_eva
## # A tibble: 668 x 13
## Cod_Mun MUNICIPIO Grupo Subgrupo CULTIVO Sistema Year PERIODO AreaCosechada
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <chr> <dbl>
## 1 99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~ 2011 2011 1
## 2 99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~ 2013 2013 2
## 3 99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~ 2014 2014 4
## 4 99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~ 2015 2015 4
## 5 99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~ 2016 2016 4
## 6 99001 PUERTO CA~ HORT~ AHUYAMA AHUYAMA AHUYAMA 2007 2007B 56
## 7 99773 CUMARIBO HORT~ AHUYAMA AHUYAMA AHUYAMA 2007 2007B 3
## 8 99524 LA PRIMAV~ HORT~ AHUYAMA AHUYAMA AHUYAMA 2007 2007B 2
## 9 99624 SANTA ROS~ HORT~ AHUYAMA AHUYAMA AHUYAMA 2007 2007B 2
## 10 99001 PUERTO CA~ HORT~ AHUYAMA AHUYAMA AHUYAMA 2008 2008A 58
## # ... with 658 more rows, and 4 more variables: `Área Cosechada\n(ha)` <dbl>,
## # Produccion <dbl>, Rendimiento <dbl>, Estado <chr>
new_eva %>%
##filter(Produccion > 0) %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion)) %>%
arrange(desc(total_produccion))
## # A tibble: 10 x 2
## Grupo total_produccion
## <chr> <dbl>
## 1 CEREALES 360043
## 2 LEGUMINOSAS 149713
## 3 TUBERCULOS Y PLATANOS 122263
## 4 FRUTALES 52846
## 5 OLEAGINOSAS 44338
## 6 OTROS PERMANENTES 9515
## 7 HORTALIZAS 8121
## 8 FIBRAS 3174
## 9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES 3
## 10 FORESTALES 0
new_eva %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion)) -> PT
PT %>%
filter(total_produccion > 100000) -> main.groups
(value = sum(main.groups$total_produccion))
## [1] 632019
main.groups$percent = main.groups$total_produccion/value
library(ggplot2)
bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupo))+
geom_bar(width = 1, stat = "identity")
pie <- bp + coord_polar("y", start=0)
pie

new_eva %>%
group_by(Grupo, MUNICIPIO) %>%
summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
slice(which.max(total_prod)) %>%
arrange(desc(total_prod))
## Warning in unlink(c(requestFile, responseFile)): cannot get info on 'C:/Users/
## EPI_m/AppData/Local/Temp/RtmpWmr5JJ/rstudio-ipc-requests-246456e81c50.rds',
## reason 'El sistema no puede encontrar el archivo especificado'
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
## # A tibble: 10 x 3
## # Groups: Grupo [10]
## Grupo MUNICIPIO total_prod
## <chr> <chr> <dbl>
## 1 CEREALES CUMARIBO 351720
## 2 LEGUMINOSAS CUMARIBO 133171
## 3 TUBERCULOS Y PLATANOS CUMARIBO 80201
## 4 FRUTALES PUERTO CARREÑO 25730
## 5 OLEAGINOSAS LA PRIMAVERA 25596
## 6 HORTALIZAS CUMARIBO 7396
## 7 OTROS PERMANENTES CUMARIBO 4245
## 8 FIBRAS PUERTO CARREÑO 3174
## 9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES SANTA ROSALIA 3
## 10 FORESTALES CUMARIBO 0
new_eva %>%
group_by(Grupo, MUNICIPIO) %>%
summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
slice(which.max(total_prod)) -> leaders
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
leaders
## # A tibble: 10 x 3
## # Groups: Grupo [10]
## Grupo MUNICIPIO total_prod
## <chr> <chr> <dbl>
## 1 CEREALES CUMARIBO 351720
## 2 FIBRAS PUERTO CARREÑO 3174
## 3 FORESTALES CUMARIBO 0
## 4 FRUTALES PUERTO CARREÑO 25730
## 5 HORTALIZAS CUMARIBO 7396
## 6 LEGUMINOSAS CUMARIBO 133171
## 7 OLEAGINOSAS LA PRIMAVERA 25596
## 8 OTROS PERMANENTES CUMARIBO 4245
## 9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES SANTA ROSALIA 3
## 10 TUBERCULOS Y PLATANOS CUMARIBO 80201
leaders %>%
filter(total_prod > 5000) -> main.leaders
options(scipen = 99999)
p<- ggplot(data=main.leaders, aes(x=MUNICIPIO, y=total_prod)) +
geom_bar(stat="identity")
p

new_eva %>%
filter(MUNICIPIO=="CUMARIBO" & CULTIVO=="NARANJA") %>%
group_by(Year, CULTIVO) %>%
select(MUNICIPIO, CULTIVO, Produccion, Year) -> CUMARIBO_NARANJA
CUMARIBO_NARANJA
## # A tibble: 10 x 4
## # Groups: Year, CULTIVO [10]
## MUNICIPIO CULTIVO Produccion Year
## <chr> <chr> <dbl> <dbl>
## 1 CUMARIBO NARANJA 270 2008
## 2 CUMARIBO NARANJA 270 2009
## 3 CUMARIBO NARANJA 858 2010
## 4 CUMARIBO NARANJA 700 2011
## 5 CUMARIBO NARANJA 800 2012
## 6 CUMARIBO NARANJA 800 2013
## 7 CUMARIBO NARANJA 800 2015
## 8 CUMARIBO NARANJA 800 2016
## 9 CUMARIBO NARANJA 800 2017
## 10 CUMARIBO NARANJA 800 2018
g <- ggplot(aes(x=Year, y=Produccion/1000), data = CUMARIBO_NARANJA) + geom_bar(stat='identity') + labs(y='Produccion de Naranja [Ton x 1000]')
g + ggtitle("Evolution of Orange Crop Production in Cumaribo from 2007 to 2018") + labs(caption= "Based on EVA data (Minagricultura, 2020)")
