library(DT)
## Warning: package 'DT' was built under R version 4.3.3
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.3.3
## Warning: package 'ggplot2' was built under R version 4.3.3
## Warning: package 'tibble' was built under R version 4.3.3
## Warning: package 'tidyr' was built under R version 4.3.3
## Warning: package 'readr' was built under R version 4.3.3
## Warning: package 'purrr' was built under R version 4.3.3
## Warning: package 'dplyr' was built under R version 4.3.3
## Warning: package 'stringr' was built under R version 4.3.3
## Warning: package 'forcats' was built under R version 4.3.3
## Warning: package 'lubridate' was built under R version 4.3.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(dplyr)
library(readr)
library(ggplot2)
list.files(path = "C:/Users/lacj7/OneDrive/Escritorio/GB2", pattern = "*.csv")
## [1] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"  
## [2] "Evaluaciones_Agropecuarias_Municipaless_EVA.csv" 
## [3] "Evaluaciones_Agropecuarias_Municipalesss_EVA.csv"
eva <- read_delim("C:/Users/lacj7/OneDrive/Escritorio/GB2/Evaluaciones_Agropecuarias_Municipales_EVA.csv", delim = ";", col_names = TRUE, show_col_types = FALSE)

head(eva)
## # A tibble: 6 × 17
##   Cod_Departamento Departamento    Cod_Municipio Municipio      Grupo_de_cultivo
##              <dbl> <chr>                   <dbl> <chr>          <chr>           
## 1               76 Valle del Cauca         76001 Santiago de C… Hortalizas      
## 2               76 Valle del Cauca         76001 Santiago de C… Hortalizas      
## 3               76 Valle del Cauca         76001 Santiago de C… Hortalizas      
## 4               76 Valle del Cauca         76001 Santiago de C… Hortalizas      
## 5               76 Valle del Cauca         76001 Santiago de C… Hortalizas      
## 6               76 Valle del Cauca         76001 Santiago de C… Hortalizas      
## # ℹ 12 more variables: Subgrupo_de_cultivo <chr>, Cultivo <chr>,
## #   Desagregacion_regional__y_sistema_productivo <chr>, Year <dbl>,
## #   Periodo <chr>, Area_sembrada_ha <dbl>, Area_cosechada_ha <dbl>,
## #   Produccion_t <dbl>, Rendimiento_th <dbl>, Estado_fisico_produccion <chr>,
## #   Nombre_cientifico <chr>, Ciclo_de_cultivo <chr>
names(eva)
##  [1] "Cod_Departamento"                            
##  [2] "Departamento"                                
##  [3] "Cod_Municipio"                               
##  [4] "Municipio"                                   
##  [5] "Grupo_de_cultivo"                            
##  [6] "Subgrupo_de_cultivo"                         
##  [7] "Cultivo"                                     
##  [8] "Desagregacion_regional__y_sistema_productivo"
##  [9] "Year"                                        
## [10] "Periodo"                                     
## [11] "Area_sembrada_ha"                            
## [12] "Area_cosechada_ha"                           
## [13] "Produccion_t"                                
## [14] "Rendimiento_th"                              
## [15] "Estado_fisico_produccion"                    
## [16] "Nombre_cientifico"                           
## [17] "Ciclo_de_cultivo"
eva %>% dplyr::select('Cod_Municipio':'Estado_fisico_produccion') -> eva.tmp
eva.tmp
## # A tibble: 7,465 × 13
##    Cod_Municipio Municipio        Grupo_de_cultivo Subgrupo_de_cultivo Cultivo
##            <dbl> <chr>            <chr>            <chr>               <chr>  
##  1         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
##  2         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
##  3         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
##  4         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
##  5         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
##  6         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
##  7         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
##  8         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
##  9         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
## 10         76001 Santiago de Cali Hortalizas       Hortalizas de hoja  Acelga 
## # ℹ 7,455 more rows
## # ℹ 8 more variables: Desagregacion_regional__y_sistema_productivo <chr>,
## #   Year <dbl>, Periodo <chr>, Area_sembrada_ha <dbl>, Area_cosechada_ha <dbl>,
## #   Produccion_t <dbl>, Rendimiento_th <dbl>, Estado_fisico_produccion <chr>
eva.tmp %>% dplyr::rename(
                          'Grupo' = 'Grupo_de_cultivo',
                          'Subgrupo' = 'Subgrupo_de_cultivo',
                          'Sistema' = 'Desagregacion_regional__y_sistema_productivo',
                          'AreaSembrada' = 'Area_sembrada_ha',
                          'AreaCosechada' = 'Area_cosechada_ha',
                          'Produccion' = 'Produccion_t',
                          'Rendimiento' = 'Rendimiento_th',
                          'Estado' = 'Estado_fisico_produccion') -> new_eva
new_eva
## # A tibble: 7,465 × 13
##    Cod_Municipio Municipio        Grupo   Subgrupo Cultivo Sistema  Year Periodo
##            <dbl> <chr>            <chr>   <chr>    <chr>   <chr>   <dbl> <chr>  
##  1         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2019 2019A  
##  2         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2019 2019B  
##  3         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2020 2020A  
##  4         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2020 2020B  
##  5         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2021 2021A  
##  6         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2021 2021B  
##  7         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2022 2022A  
##  8         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2022 2022B  
##  9         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2023 2023A  
## 10         76001 Santiago de Cali Hortal… Hortali… Acelga  Acelga   2023 2023B  
## # ℹ 7,455 more rows
## # ℹ 5 more variables: AreaSembrada <dbl>, AreaCosechada <dbl>,
## #   Produccion <dbl>, Rendimiento <dbl>, Estado <chr>
new_eva %>%
  group_by(Grupo) %>%
  summarize(total_produccion = sum(Produccion)) %>%
  arrange(desc(total_produccion))
## # A tibble: 8 × 2
##   Grupo                                                       total_produccion
##   <chr>                                                                  <dbl>
## 1 Cultivos tropicales tradicionales                                 122323809.
## 2 Frutales                                                            4184864.
## 3 Hortalizas                                                           630269.
## 4 Cereales                                                             588195.
## 5 Raíces y tubérculos                                                  124134.
## 6 Leguminosas                                                           47839.
## 7 Cultivos para condimentos, bebidas medicinales y aromáticas           24867.
## 8 Oleaginosas                                                           16907.
new_eva %>%
  group_by(Grupo) %>%
  summarize(total_produccion = sum(Produccion)) -> PT
PT %>% 
  filter(total_produccion > 61000) -> main.groups
(value = sum(main.groups$total_produccion))
## [1] 127851272
main.groups$percent = main.groups$total_produccion/value
library(ggplot2)

bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupo))+
geom_bar(width = 1, stat = "identity")

pie <- bp + coord_polar("y", start=0)
pie

new_eva %>%
  group_by(Grupo, Municipio) %>%
  summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
  slice(which.max(total_prod))  %>%
  arrange(desc(total_prod))
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
## # A tibble: 8 × 3
## # Groups:   Grupo [8]
##   Grupo                                                     Municipio total_prod
##   <chr>                                                     <chr>          <dbl>
## 1 Cultivos tropicales tradicionales                         Palmira    23136246.
## 2 Frutales                                                  Sevilla      538899.
## 3 Cereales                                                  Obando        90789.
## 4 Hortalizas                                                Dagua         83639 
## 5 Raíces y tubérculos                                       Tuluá         39909 
## 6 Cultivos para condimentos, bebidas medicinales y aromáti… Dagua         14712 
## 7 Oleaginosas                                               Cartago        6809.
## 8 Leguminosas                                               La Cumbre      4616.
new_eva %>%
  group_by(Grupo, Municipio) %>%
  summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
  slice(which.max(total_prod))  -> leaders
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
leaders
## # A tibble: 8 × 3
## # Groups:   Grupo [8]
##   Grupo                                                     Municipio total_prod
##   <chr>                                                     <chr>          <dbl>
## 1 Cereales                                                  Obando        90789.
## 2 Cultivos para condimentos, bebidas medicinales y aromáti… Dagua         14712 
## 3 Cultivos tropicales tradicionales                         Palmira    23136246.
## 4 Frutales                                                  Sevilla      538899.
## 5 Hortalizas                                                Dagua         83639 
## 6 Leguminosas                                               La Cumbre      4616.
## 7 Oleaginosas                                               Cartago        6809.
## 8 Raíces y tubérculos                                       Tuluá         39909
leaders %>% 
  filter(total_prod > 80000) -> main.leaders
library(ggplot2)
library(scales)
## Warning: package 'scales' was built under R version 4.3.3
## 
## Attaching package: 'scales'
## The following object is masked from 'package:purrr':
## 
##     discard
## The following object is masked from 'package:readr':
## 
##     col_factor
p <- ggplot(data = main.leaders, aes(x = Municipio, y = total_prod)) +
  geom_bar(stat = "identity") +
  scale_y_continuous(labels = comma)
p

options(scipen = 999)  
new_eva %>%
  filter(Municipio == "Palmira")
## # A tibble: 247 × 13
##    Cod_Municipio Municipio Grupo      Subgrupo     Cultivo Sistema  Year Periodo
##            <dbl> <chr>     <chr>      <chr>        <chr>   <chr>   <dbl> <chr>  
##  1         76520 Palmira   Frutales   Demás fruta… Aguaca… Aguaca…  2019 2019   
##  2         76520 Palmira   Frutales   Demás fruta… Aguaca… Aguaca…  2020 2020   
##  3         76520 Palmira   Frutales   Demás fruta… Aguaca… Aguaca…  2021 2021   
##  4         76520 Palmira   Frutales   Demás fruta… Aguaca… Aguaca…  2022 2022   
##  5         76520 Palmira   Frutales   Demás fruta… Aguaca… Aguaca…  2023 2023   
##  6         76520 Palmira   Hortalizas Hortalizas … Ahuyama Ahuyama  2019 2019A  
##  7         76520 Palmira   Hortalizas Hortalizas … Ahuyama Ahuyama  2019 2019B  
##  8         76520 Palmira   Hortalizas Hortalizas … Ahuyama Ahuyama  2020 2020A  
##  9         76520 Palmira   Hortalizas Hortalizas … Ahuyama Ahuyama  2020 2020B  
## 10         76520 Palmira   Hortalizas Hortalizas … Ahuyama Ahuyama  2021 2021A  
## # ℹ 237 more rows
## # ℹ 5 more variables: AreaSembrada <dbl>, AreaCosechada <dbl>,
## #   Produccion <dbl>, Rendimiento <dbl>, Estado <chr>
new_eva %>% 
  filter(Municipio=="Palmira" & Cultivo=="Caña") %>% 
  group_by(Year, Cultivo) %>%
  select(Municipio, Cultivo, Produccion, Year) ->  Palmira_Caña

Palmira_Caña
## # A tibble: 10 × 4
## # Groups:   Year, Cultivo [5]
##    Municipio Cultivo Produccion  Year
##    <chr>     <chr>        <dbl> <dbl>
##  1 Palmira   Caña      4407000   2019
##  2 Palmira   Caña      4402307.  2020
##  3 Palmira   Caña      4776340.  2021
##  4 Palmira   Caña      4746000   2022
##  5 Palmira   Caña      4746000   2023
##  6 Palmira   Caña        12460   2019
##  7 Palmira   Caña        12282   2020
##  8 Palmira   Caña        10680   2021
##  9 Palmira   Caña        10680   2022
## 10 Palmira   Caña        10680   2023
g <- ggplot(aes(x=Year, y=Produccion/1000), data = Palmira_Caña) + geom_bar(stat='identity') + labs(y='Produccion de caña [Ton x 1000]')
g + ggtitle("Evolucion de la caña en Palmira desde 2019 a 2023") + labs(caption= "Tomado de EVA data (Minagricultura, 2023)")

new_eva %>% 
  filter(Municipio=="Palmira" & Cultivo=="Maíz") %>% 
  group_by(Year, Cultivo) %>%
  select(Municipio, Cultivo, Produccion, Year) ->  Palmira_Maíz

Palmira_Maíz
## # A tibble: 20 × 4
## # Groups:   Year, Cultivo [5]
##    Municipio Cultivo Produccion  Year
##    <chr>     <chr>        <dbl> <dbl>
##  1 Palmira   Maíz          28.8  2021
##  2 Palmira   Maíz          34.8  2021
##  3 Palmira   Maíz         167.   2022
##  4 Palmira   Maíz         182.   2022
##  5 Palmira   Maíz         154    2023
##  6 Palmira   Maíz         198.   2023
##  7 Palmira   Maíz        1933.   2021
##  8 Palmira   Maíz        1222.   2021
##  9 Palmira   Maíz         850.   2022
## 10 Palmira   Maíz         662.   2022
## 11 Palmira   Maíz        2048    2023
## 12 Palmira   Maíz        1971.   2023
## 13 Palmira   Maíz        1350    2019
## 14 Palmira   Maíz        1350    2019
## 15 Palmira   Maíz        1800    2020
## 16 Palmira   Maíz        1350    2020
## 17 Palmira   Maíz         158.   2019
## 18 Palmira   Maíz         158.   2019
## 19 Palmira   Maíz         400    2020
## 20 Palmira   Maíz         150    2020
g <- ggplot(aes(x=Year, y=Produccion/1000), data = Palmira_Maíz) + geom_bar(stat='identity') + labs(y='Produccion de Maíz [Ton x 1000]')
g + ggtitle("Evolucion del Maíz en la Palmira desde 2019 a 2023") + labs(caption= "Tomado de EVA data (Minagricultura, 2023)")