library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.5     v purrr   0.3.4
## v tibble  3.1.6     v dplyr   1.0.8
## v tidyr   1.2.0     v stringr 1.4.0
## v readr   2.1.2     v forcats 0.5.1
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(dplyr)
library(readr)
library(ggplot2)
list.files("C:/Users/EPI_m/OneDrive/Documentos/R estudio", pattern=c('csv'))
## [1] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"
## [2] "Vichada_Cereales_2020.csv"                     
## [3] "Vichada_platanos_2020.csv"                     
## [4] "Vichada_Tuberculos_2020.csv"
(eva = read_csv("C:/Users/EPI_m/OneDrive/Documentos/R estudio/Evaluaciones_Agropecuarias_Municipales_EVA.csv", col_names = TRUE,
                show_col_types = FALSE))
## # A tibble: 668 x 17
##    `CÓD. \nDEP.` DEPARTAMENTO `CÓD. MUN.` MUNICIPIO      `GRUPO \nDE CULTIVO`
##            <dbl> <chr>              <dbl> <chr>          <chr>               
##  1            99 VICHADA            99524 LA PRIMAVERA   FRUTALES            
##  2            99 VICHADA            99524 LA PRIMAVERA   FRUTALES            
##  3            99 VICHADA            99524 LA PRIMAVERA   FRUTALES            
##  4            99 VICHADA            99524 LA PRIMAVERA   FRUTALES            
##  5            99 VICHADA            99524 LA PRIMAVERA   FRUTALES            
##  6            99 VICHADA            99001 PUERTO CARREÑO HORTALIZAS          
##  7            99 VICHADA            99773 CUMARIBO       HORTALIZAS          
##  8            99 VICHADA            99524 LA PRIMAVERA   HORTALIZAS          
##  9            99 VICHADA            99624 SANTA ROSALIA  HORTALIZAS          
## 10            99 VICHADA            99001 PUERTO CARREÑO HORTALIZAS          
## # ... with 658 more rows, and 12 more variables: `SUBGRUPO \nDE CULTIVO` <chr>,
## #   CULTIVO <chr>, `DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO` <chr>,
## #   AÑO <dbl>, PERIODO <chr>, `Área Sembrada\n(ha)` <dbl>,
## #   `Área Cosechada\n(ha)` <dbl>, `Producción\n(t)` <dbl>,
## #   `Rendimiento\n(t/ha)` <dbl>, `ESTADO FISICO PRODUCCION` <chr>,
## #   `NOMBRE \nCIENTIFICO` <chr>, `CICLO DE CULTIVO` <chr>
names(eva)
##  [1] "CÓD. \nDEP."                                  
##  [2] "DEPARTAMENTO"                                 
##  [3] "CÓD. MUN."                                    
##  [4] "MUNICIPIO"                                    
##  [5] "GRUPO \nDE CULTIVO"                           
##  [6] "SUBGRUPO \nDE CULTIVO"                        
##  [7] "CULTIVO"                                      
##  [8] "DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO"
##  [9] "AÑO"                                          
## [10] "PERIODO"                                      
## [11] "Área Sembrada\n(ha)"                          
## [12] "Área Cosechada\n(ha)"                         
## [13] "Producción\n(t)"                              
## [14] "Rendimiento\n(t/ha)"                          
## [15] "ESTADO FISICO PRODUCCION"                     
## [16] "NOMBRE \nCIENTIFICO"                          
## [17] "CICLO DE CULTIVO"
eva %>% dplyr::select('CÓD. MUN.':'ESTADO FISICO PRODUCCION') -> eva.tmp
eva.tmp
## # A tibble: 668 x 13
##    `CÓD. MUN.` MUNICIPIO      `GRUPO \nDE CULTIVO` `SUBGRUPO \nDE CULT~` CULTIVO
##          <dbl> <chr>          <chr>                <chr>                 <chr>  
##  1       99524 LA PRIMAVERA   FRUTALES             AGUACATE              AGUACA~
##  2       99524 LA PRIMAVERA   FRUTALES             AGUACATE              AGUACA~
##  3       99524 LA PRIMAVERA   FRUTALES             AGUACATE              AGUACA~
##  4       99524 LA PRIMAVERA   FRUTALES             AGUACATE              AGUACA~
##  5       99524 LA PRIMAVERA   FRUTALES             AGUACATE              AGUACA~
##  6       99001 PUERTO CARREÑO HORTALIZAS           AHUYAMA               AHUYAMA
##  7       99773 CUMARIBO       HORTALIZAS           AHUYAMA               AHUYAMA
##  8       99524 LA PRIMAVERA   HORTALIZAS           AHUYAMA               AHUYAMA
##  9       99624 SANTA ROSALIA  HORTALIZAS           AHUYAMA               AHUYAMA
## 10       99001 PUERTO CARREÑO HORTALIZAS           AHUYAMA               AHUYAMA
## # ... with 658 more rows, and 8 more variables:
## #   `DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO` <chr>, AÑO <dbl>,
## #   PERIODO <chr>, `Área Sembrada\n(ha)` <dbl>, `Área Cosechada\n(ha)` <dbl>,
## #   `Producción\n(t)` <dbl>, `Rendimiento\n(t/ha)` <dbl>,
## #   `ESTADO FISICO PRODUCCION` <chr>
eva.tmp %>%  dplyr::rename('Cod_Mun' = 'CÓD. MUN.', 
                         'Grupo' = 'GRUPO \nDE CULTIVO',
                         'Subgrupo' = 'SUBGRUPO \nDE CULTIVO', 
                         'Year' = 'AÑO',
                         'AreaSembrada' = 'Área Sembrada\n(ha)',
                         'AreaCosechada' = 'Área Sembrada\n(ha)',
                         'Produccion' = 'Producción\n(t)',                                                                 'Rendimiento' =  'Rendimiento\n(t/ha)',   
                         'Sistema' = 'DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO',
                         'Estado' = 'ESTADO FISICO PRODUCCION') -> new_eva
new_eva
## # A tibble: 668 x 13
##    Cod_Mun MUNICIPIO  Grupo Subgrupo CULTIVO Sistema  Year PERIODO AreaCosechada
##      <dbl> <chr>      <chr> <chr>    <chr>   <chr>   <dbl> <chr>           <dbl>
##  1   99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~  2011 2011                1
##  2   99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~  2013 2013                2
##  3   99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~  2014 2014                4
##  4   99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~  2015 2015                4
##  5   99524 LA PRIMAV~ FRUT~ AGUACATE AGUACA~ AGUACA~  2016 2016                4
##  6   99001 PUERTO CA~ HORT~ AHUYAMA  AHUYAMA AHUYAMA  2007 2007B              56
##  7   99773 CUMARIBO   HORT~ AHUYAMA  AHUYAMA AHUYAMA  2007 2007B               3
##  8   99524 LA PRIMAV~ HORT~ AHUYAMA  AHUYAMA AHUYAMA  2007 2007B               2
##  9   99624 SANTA ROS~ HORT~ AHUYAMA  AHUYAMA AHUYAMA  2007 2007B               2
## 10   99001 PUERTO CA~ HORT~ AHUYAMA  AHUYAMA AHUYAMA  2008 2008A              58
## # ... with 658 more rows, and 4 more variables: `Área Cosechada\n(ha)` <dbl>,
## #   Produccion <dbl>, Rendimiento <dbl>, Estado <chr>
new_eva %>%
  ##filter(Produccion > 0) %>%
  group_by(Grupo) %>%
  summarize(total_produccion = sum(Produccion)) %>% 
  arrange(desc(total_produccion)) 
## # A tibble: 10 x 2
##    Grupo                                            total_produccion
##    <chr>                                                       <dbl>
##  1 CEREALES                                                   360043
##  2 LEGUMINOSAS                                                149713
##  3 TUBERCULOS Y PLATANOS                                      122263
##  4 FRUTALES                                                    52846
##  5 OLEAGINOSAS                                                 44338
##  6 OTROS PERMANENTES                                            9515
##  7 HORTALIZAS                                                   8121
##  8 FIBRAS                                                       3174
##  9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES                3
## 10 FORESTALES                                                      0
new_eva %>%
  group_by(Grupo) %>%
  summarize(total_produccion = sum(Produccion)) -> PT
PT %>% 
  filter(total_produccion > 100000) -> main.groups
(value = sum(main.groups$total_produccion))
## [1] 632019
main.groups$percent = main.groups$total_produccion/value
library(ggplot2)
bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupo))+
geom_bar(width = 1, stat = "identity")
pie <- bp + coord_polar("y", start=0)
pie

new_eva %>%
  group_by(Grupo, MUNICIPIO) %>%
  summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
  slice(which.max(total_prod))  %>%
  arrange(desc(total_prod))
## Warning in unlink(c(requestFile, responseFile)): cannot get info on 'C:/Users/
## EPI_m/AppData/Local/Temp/RtmpWmr5JJ/rstudio-ipc-requests-246456e81c50.rds',
## reason 'El sistema no puede encontrar el archivo especificado'
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
## # A tibble: 10 x 3
## # Groups:   Grupo [10]
##    Grupo                                            MUNICIPIO      total_prod
##    <chr>                                            <chr>               <dbl>
##  1 CEREALES                                         CUMARIBO           351720
##  2 LEGUMINOSAS                                      CUMARIBO           133171
##  3 TUBERCULOS Y PLATANOS                            CUMARIBO            80201
##  4 FRUTALES                                         PUERTO CARREÑO      25730
##  5 OLEAGINOSAS                                      LA PRIMAVERA        25596
##  6 HORTALIZAS                                       CUMARIBO             7396
##  7 OTROS PERMANENTES                                CUMARIBO             4245
##  8 FIBRAS                                           PUERTO CARREÑO       3174
##  9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES SANTA ROSALIA           3
## 10 FORESTALES                                       CUMARIBO                0
new_eva %>%
  group_by(Grupo, MUNICIPIO) %>%
  summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
  slice(which.max(total_prod))  -> leaders
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
leaders
## # A tibble: 10 x 3
## # Groups:   Grupo [10]
##    Grupo                                            MUNICIPIO      total_prod
##    <chr>                                            <chr>               <dbl>
##  1 CEREALES                                         CUMARIBO           351720
##  2 FIBRAS                                           PUERTO CARREÑO       3174
##  3 FORESTALES                                       CUMARIBO                0
##  4 FRUTALES                                         PUERTO CARREÑO      25730
##  5 HORTALIZAS                                       CUMARIBO             7396
##  6 LEGUMINOSAS                                      CUMARIBO           133171
##  7 OLEAGINOSAS                                      LA PRIMAVERA        25596
##  8 OTROS PERMANENTES                                CUMARIBO             4245
##  9 PLANTAS AROMATICAS, CONDIMENTARIAS Y MEDICINALES SANTA ROSALIA           3
## 10 TUBERCULOS Y PLATANOS                            CUMARIBO            80201
leaders %>% 
  filter(total_prod > 5000) -> main.leaders
options(scipen = 99999)
p<- ggplot(data=main.leaders, aes(x=MUNICIPIO, y=total_prod)) +
  geom_bar(stat="identity")
p

new_eva %>% 
  filter(MUNICIPIO=="CUMARIBO" & CULTIVO=="NARANJA") %>% 
  group_by(Year, CULTIVO) %>%
  select(MUNICIPIO, CULTIVO, Produccion, Year) ->  CUMARIBO_NARANJA
CUMARIBO_NARANJA
## # A tibble: 10 x 4
## # Groups:   Year, CULTIVO [10]
##    MUNICIPIO CULTIVO Produccion  Year
##    <chr>     <chr>        <dbl> <dbl>
##  1 CUMARIBO  NARANJA        270  2008
##  2 CUMARIBO  NARANJA        270  2009
##  3 CUMARIBO  NARANJA        858  2010
##  4 CUMARIBO  NARANJA        700  2011
##  5 CUMARIBO  NARANJA        800  2012
##  6 CUMARIBO  NARANJA        800  2013
##  7 CUMARIBO  NARANJA        800  2015
##  8 CUMARIBO  NARANJA        800  2016
##  9 CUMARIBO  NARANJA        800  2017
## 10 CUMARIBO  NARANJA        800  2018
g <- ggplot(aes(x=Year, y=Produccion/1000), data = CUMARIBO_NARANJA) + geom_bar(stat='identity') + labs(y='Produccion de Naranja [Ton x 1000]')
g + ggtitle("Evolution of Orange Crop Production in Cumaribo from 2007 to 2018") + labs(caption= "Based on EVA data (Minagricultura, 2020)")