library(DT)
## Warning: package 'DT' was built under R version 4.3.3
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.3.3
## Warning: package 'ggplot2' was built under R version 4.3.3
## Warning: package 'tibble' was built under R version 4.3.3
## Warning: package 'tidyr' was built under R version 4.3.3
## Warning: package 'readr' was built under R version 4.3.3
## Warning: package 'purrr' was built under R version 4.3.3
## Warning: package 'dplyr' was built under R version 4.3.3
## Warning: package 'stringr' was built under R version 4.3.3
## Warning: package 'forcats' was built under R version 4.3.3
## Warning: package 'lubridate' was built under R version 4.3.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.1 ✔ tibble 3.2.1
## ✔ lubridate 1.9.4 ✔ tidyr 1.3.1
## ✔ purrr 1.0.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(dplyr)
library(readr)
library(ggplot2)
list.files(path = "C:/Users/lacj7/OneDrive/Escritorio/GB2", pattern = "*.csv")
## [1] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"
## [2] "Evaluaciones_Agropecuarias_Municipaless_EVA.csv"
## [3] "Evaluaciones_Agropecuarias_Municipalesss_EVA.csv"
eva <- read_delim("C:/Users/lacj7/OneDrive/Escritorio/GB2/Evaluaciones_Agropecuarias_Municipales_EVA.csv", delim = ";", col_names = TRUE, show_col_types = FALSE)
head(eva)
## # A tibble: 6 × 17
## Cod_Departamento Departamento Cod_Municipio Municipio Grupo_de_cultivo
## <dbl> <chr> <dbl> <chr> <chr>
## 1 76 Valle del Cauca 76001 Santiago de C… Hortalizas
## 2 76 Valle del Cauca 76001 Santiago de C… Hortalizas
## 3 76 Valle del Cauca 76001 Santiago de C… Hortalizas
## 4 76 Valle del Cauca 76001 Santiago de C… Hortalizas
## 5 76 Valle del Cauca 76001 Santiago de C… Hortalizas
## 6 76 Valle del Cauca 76001 Santiago de C… Hortalizas
## # ℹ 12 more variables: Subgrupo_de_cultivo <chr>, Cultivo <chr>,
## # Desagregacion_regional__y_sistema_productivo <chr>, Year <dbl>,
## # Periodo <chr>, Area_sembrada_ha <dbl>, Area_cosechada_ha <dbl>,
## # Produccion_t <dbl>, Rendimiento_th <dbl>, Estado_fisico_produccion <chr>,
## # Nombre_cientifico <chr>, Ciclo_de_cultivo <chr>
names(eva)
## [1] "Cod_Departamento"
## [2] "Departamento"
## [3] "Cod_Municipio"
## [4] "Municipio"
## [5] "Grupo_de_cultivo"
## [6] "Subgrupo_de_cultivo"
## [7] "Cultivo"
## [8] "Desagregacion_regional__y_sistema_productivo"
## [9] "Year"
## [10] "Periodo"
## [11] "Area_sembrada_ha"
## [12] "Area_cosechada_ha"
## [13] "Produccion_t"
## [14] "Rendimiento_th"
## [15] "Estado_fisico_produccion"
## [16] "Nombre_cientifico"
## [17] "Ciclo_de_cultivo"
eva %>% dplyr::select('Cod_Municipio':'Estado_fisico_produccion') -> eva.tmp
eva.tmp
## # A tibble: 7,465 × 13
## Cod_Municipio Municipio Grupo_de_cultivo Subgrupo_de_cultivo Cultivo
## <dbl> <chr> <chr> <chr> <chr>
## 1 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 2 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 3 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 4 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 5 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 6 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 7 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 8 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 9 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## 10 76001 Santiago de Cali Hortalizas Hortalizas de hoja Acelga
## # ℹ 7,455 more rows
## # ℹ 8 more variables: Desagregacion_regional__y_sistema_productivo <chr>,
## # Year <dbl>, Periodo <chr>, Area_sembrada_ha <dbl>, Area_cosechada_ha <dbl>,
## # Produccion_t <dbl>, Rendimiento_th <dbl>, Estado_fisico_produccion <chr>
eva.tmp %>% dplyr::rename(
'Grupo' = 'Grupo_de_cultivo',
'Subgrupo' = 'Subgrupo_de_cultivo',
'Sistema' = 'Desagregacion_regional__y_sistema_productivo',
'AreaSembrada' = 'Area_sembrada_ha',
'AreaCosechada' = 'Area_cosechada_ha',
'Produccion' = 'Produccion_t',
'Rendimiento' = 'Rendimiento_th',
'Estado' = 'Estado_fisico_produccion') -> new_eva
new_eva
## # A tibble: 7,465 × 13
## Cod_Municipio Municipio Grupo Subgrupo Cultivo Sistema Year Periodo
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <chr>
## 1 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2019 2019A
## 2 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2019 2019B
## 3 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2020 2020A
## 4 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2020 2020B
## 5 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2021 2021A
## 6 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2021 2021B
## 7 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2022 2022A
## 8 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2022 2022B
## 9 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2023 2023A
## 10 76001 Santiago de Cali Hortal… Hortali… Acelga Acelga 2023 2023B
## # ℹ 7,455 more rows
## # ℹ 5 more variables: AreaSembrada <dbl>, AreaCosechada <dbl>,
## # Produccion <dbl>, Rendimiento <dbl>, Estado <chr>
new_eva %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion)) %>%
arrange(desc(total_produccion))
## # A tibble: 8 × 2
## Grupo total_produccion
## <chr> <dbl>
## 1 Cultivos tropicales tradicionales 122323809.
## 2 Frutales 4184864.
## 3 Hortalizas 630269.
## 4 Cereales 588195.
## 5 Raíces y tubérculos 124134.
## 6 Leguminosas 47839.
## 7 Cultivos para condimentos, bebidas medicinales y aromáticas 24867.
## 8 Oleaginosas 16907.
new_eva %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion)) -> PT
PT %>%
filter(total_produccion > 61000) -> main.groups
(value = sum(main.groups$total_produccion))
## [1] 127851272
main.groups$percent = main.groups$total_produccion/value
library(ggplot2)
bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupo))+
geom_bar(width = 1, stat = "identity")
pie <- bp + coord_polar("y", start=0)
pie

new_eva %>%
group_by(Grupo, Municipio) %>%
summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
slice(which.max(total_prod)) %>%
arrange(desc(total_prod))
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
## # A tibble: 8 × 3
## # Groups: Grupo [8]
## Grupo Municipio total_prod
## <chr> <chr> <dbl>
## 1 Cultivos tropicales tradicionales Palmira 23136246.
## 2 Frutales Sevilla 538899.
## 3 Cereales Obando 90789.
## 4 Hortalizas Dagua 83639
## 5 Raíces y tubérculos Tuluá 39909
## 6 Cultivos para condimentos, bebidas medicinales y aromáti… Dagua 14712
## 7 Oleaginosas Cartago 6809.
## 8 Leguminosas La Cumbre 4616.
new_eva %>%
group_by(Grupo, Municipio) %>%
summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
slice(which.max(total_prod)) -> leaders
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
leaders
## # A tibble: 8 × 3
## # Groups: Grupo [8]
## Grupo Municipio total_prod
## <chr> <chr> <dbl>
## 1 Cereales Obando 90789.
## 2 Cultivos para condimentos, bebidas medicinales y aromáti… Dagua 14712
## 3 Cultivos tropicales tradicionales Palmira 23136246.
## 4 Frutales Sevilla 538899.
## 5 Hortalizas Dagua 83639
## 6 Leguminosas La Cumbre 4616.
## 7 Oleaginosas Cartago 6809.
## 8 Raíces y tubérculos Tuluá 39909
leaders %>%
filter(total_prod > 80000) -> main.leaders
library(ggplot2)
library(scales)
## Warning: package 'scales' was built under R version 4.3.3
##
## Attaching package: 'scales'
## The following object is masked from 'package:purrr':
##
## discard
## The following object is masked from 'package:readr':
##
## col_factor
p <- ggplot(data = main.leaders, aes(x = Municipio, y = total_prod)) +
geom_bar(stat = "identity") +
scale_y_continuous(labels = comma)
p

options(scipen = 999)
new_eva %>%
filter(Municipio == "Palmira")
## # A tibble: 247 × 13
## Cod_Municipio Municipio Grupo Subgrupo Cultivo Sistema Year Periodo
## <dbl> <chr> <chr> <chr> <chr> <chr> <dbl> <chr>
## 1 76520 Palmira Frutales Demás fruta… Aguaca… Aguaca… 2019 2019
## 2 76520 Palmira Frutales Demás fruta… Aguaca… Aguaca… 2020 2020
## 3 76520 Palmira Frutales Demás fruta… Aguaca… Aguaca… 2021 2021
## 4 76520 Palmira Frutales Demás fruta… Aguaca… Aguaca… 2022 2022
## 5 76520 Palmira Frutales Demás fruta… Aguaca… Aguaca… 2023 2023
## 6 76520 Palmira Hortalizas Hortalizas … Ahuyama Ahuyama 2019 2019A
## 7 76520 Palmira Hortalizas Hortalizas … Ahuyama Ahuyama 2019 2019B
## 8 76520 Palmira Hortalizas Hortalizas … Ahuyama Ahuyama 2020 2020A
## 9 76520 Palmira Hortalizas Hortalizas … Ahuyama Ahuyama 2020 2020B
## 10 76520 Palmira Hortalizas Hortalizas … Ahuyama Ahuyama 2021 2021A
## # ℹ 237 more rows
## # ℹ 5 more variables: AreaSembrada <dbl>, AreaCosechada <dbl>,
## # Produccion <dbl>, Rendimiento <dbl>, Estado <chr>
new_eva %>%
filter(Municipio=="Palmira" & Cultivo=="Caña") %>%
group_by(Year, Cultivo) %>%
select(Municipio, Cultivo, Produccion, Year) -> Palmira_Caña
Palmira_Caña
## # A tibble: 10 × 4
## # Groups: Year, Cultivo [5]
## Municipio Cultivo Produccion Year
## <chr> <chr> <dbl> <dbl>
## 1 Palmira Caña 4407000 2019
## 2 Palmira Caña 4402307. 2020
## 3 Palmira Caña 4776340. 2021
## 4 Palmira Caña 4746000 2022
## 5 Palmira Caña 4746000 2023
## 6 Palmira Caña 12460 2019
## 7 Palmira Caña 12282 2020
## 8 Palmira Caña 10680 2021
## 9 Palmira Caña 10680 2022
## 10 Palmira Caña 10680 2023
g <- ggplot(aes(x=Year, y=Produccion/1000), data = Palmira_Caña) + geom_bar(stat='identity') + labs(y='Produccion de caña [Ton x 1000]')
g + ggtitle("Evolucion de la caña en Palmira desde 2019 a 2023") + labs(caption= "Tomado de EVA data (Minagricultura, 2023)")

new_eva %>%
filter(Municipio=="Palmira" & Cultivo=="Maíz") %>%
group_by(Year, Cultivo) %>%
select(Municipio, Cultivo, Produccion, Year) -> Palmira_Maíz
Palmira_Maíz
## # A tibble: 20 × 4
## # Groups: Year, Cultivo [5]
## Municipio Cultivo Produccion Year
## <chr> <chr> <dbl> <dbl>
## 1 Palmira Maíz 28.8 2021
## 2 Palmira Maíz 34.8 2021
## 3 Palmira Maíz 167. 2022
## 4 Palmira Maíz 182. 2022
## 5 Palmira Maíz 154 2023
## 6 Palmira Maíz 198. 2023
## 7 Palmira Maíz 1933. 2021
## 8 Palmira Maíz 1222. 2021
## 9 Palmira Maíz 850. 2022
## 10 Palmira Maíz 662. 2022
## 11 Palmira Maíz 2048 2023
## 12 Palmira Maíz 1971. 2023
## 13 Palmira Maíz 1350 2019
## 14 Palmira Maíz 1350 2019
## 15 Palmira Maíz 1800 2020
## 16 Palmira Maíz 1350 2020
## 17 Palmira Maíz 158. 2019
## 18 Palmira Maíz 158. 2019
## 19 Palmira Maíz 400 2020
## 20 Palmira Maíz 150 2020
g <- ggplot(aes(x=Year, y=Produccion/1000), data = Palmira_Maíz) + geom_bar(stat='identity') + labs(y='Produccion de Maíz [Ton x 1000]')
g + ggtitle("Evolucion del Maíz en la Palmira desde 2019 a 2023") + labs(caption= "Tomado de EVA data (Minagricultura, 2023)")
