Este cuaderno permite analizar los datos provenientes de las Evaluaciones agropecuarias municipales EVA. Por medio de este análisis se identificarán los cultivos de mayor importancia en el departamento de Casanare.
#install.packages("readxl")
#install.packages("dplyr")
#install.packages("readr")
library(readxl)
library(dplyr)
library(readr)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.1.3
(archivos = list.files(pattern ='xls'))
## [1] "20210624_BaseSIPRA2020.xlsx"
(hojas <- excel_sheets("20210624_BaseSIPRA2020.xlsx"))
## [1] "Agrícola_SIPRA_AGRONET" "InventarioBovino"
## [3] "InventarioPorcino" "InvBufalosCaprinoOvinoEquino"
## [5] "InvAves"
(eva2020 <- read_excel("20210624_BaseSIPRA2020.xlsx", sheet = "Agrícola_SIPRA_AGRONET"))
El departamento objeto de estudio es Casanare, por lo tanto, se seleccionara el subconjunto de datos del mismo.
(casanare2020 <- filter(eva2020, Departamento == "Casanare"))
Las columnas que no son relevantes para nuestro análisis (por ejemplo, Código del departamento y Departamento), serán eliminadas con el objetivo ser más eficientes. Las columnas restante serán renombradas con el fin de optimizar los análisis.
(casanare2020.tmp <- casanare2020 %>% select('Código del Municipio':'Ciclo del cultivo'))
casanare2020.tmp %>% rename(Cod_Mun = 'Código del Municipio',
Grupo = 'Grupo cultivo según especie',
Subgrupo = 'Subgrupo cultivo según especie',
AreaSiembra = 'Area Sembrada (ha)',
AreaCosecha = 'Area Cosechada (ha)',
Produccion = 'Producción (t)',
Rendimiento = 'Rendimiento (t/ha)', Ciclo='Ciclo del cultivo') -> casanare2020
casanare2020
casanare2020 %>% mutate(AreaSiembra = as.numeric(AreaSiembra),
AreaCosecha = as.numeric(AreaCosecha),
Produccion = as.numeric(Produccion),
Rendimiento = as.numeric(Rendimiento)) -> casanare2020
casanare2020
casanare2020 %>%
group_by(Grupo) %>%
summarize(sum_as = sum(AreaSiembra, na.rm = TRUE)) %>%
arrange(desc(sum_as)) -> ars
ggplot(data = ars, aes(x = reorder(Grupo,sum_as), y = sum_as)) +
geom_bar(stat="identity", fill="#006D2C", alpha=.6, width=.4) +
coord_flip() +
xlab("") +
ylab("Área Sembrada (ha)") +
theme_bw()
casanare2020 %>%
group_by(Grupo) %>%
summarize(prom_rend = mean(Rendimiento, na.rm = TRUE)) %>%
arrange(desc(prom_rend)) -> ren
ggplot(data = ren, aes(x = reorder(Grupo,prom_rend), y = prom_rend)) +
geom_bar(stat="identity", fill="#006D2C", alpha=.6, width=.4) +
coord_flip() +
xlab("") +
ylab("Rendimiento promedio (t/ha)") +
theme_bw()
casanare2020 %>%
group_by(Cultivo, Municipio) %>%
summarize(max_prod = max(Produccion, na.rm = TRUE)) %>%
slice(which.max(max_prod)) %>%
arrange(desc(max_prod))
## `summarise()` has grouped output by 'Cultivo'. You can override using the
## `.groups` argument.
Los cultivos más importantes en el departamento de Casanare son el arroz en primer lugar, con una producción máxima de 194583 t/ha; le sigue la palma de aceite con 89478.27 t/ha, y en tercer lugar se encuentra la piña, con una producción máxima de 19859.50 t/ha.
casanare2020 %>%
group_by(Grupo,Municipio) %>%
summarize(max_prod = max(Produccion, na.rm = TRUE)) %>%
slice(which.max(max_prod)) %>%
arrange(desc(max_prod))
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
Los grupos de cultivos más importantes en el Departamento de Casanare son los cereales y las leguminosas y oleaginosas, que ocupan en segundo puesto a nivel departamental.
Paz de Ariporo es el principal productor de cereales, mientras que el municipio de Maní domina la producción de leguminosas y oleaginosas; por otro lado, Tauramena encabeza la producción de Frutales.
casanare2020 %>%
group_by(Cod_Mun, Municipio, Grupo) %>%
filter(Grupo=='Cereales') %>%
summarize(max_prod = max(Produccion, na.rm = TRUE)) %>%
arrange(desc(max_prod)) -> Cereales2020
## `summarise()` has grouped output by 'Cod_Mun', 'Municipio'. You can override
## using the `.groups` argument.
Cereales2020
ggplot(data = Cereales2020, aes(x = reorder(Municipio, max_prod), y = max_prod)) +
geom_bar(stat="identity", fill="#006D2C", alpha=.6, width=.4) +
coord_flip() +
xlab("") +
ylab("Producción (t)") +
theme_bw()
casanare2020 %>%
group_by(Cod_Mun, Municipio, Grupo) %>%
filter(Grupo=='Leguminosas Y Oleaginosas') %>%
summarize(max_prod = max(Produccion, na.rm = TRUE)) %>%
arrange(desc(max_prod)) -> oleaginosas2020
## `summarise()` has grouped output by 'Cod_Mun', 'Municipio'. You can override
## using the `.groups` argument.
oleaginosas2020
ggplot(oleaginosas2020, aes(x = reorder(Municipio, max_prod), y = max_prod)) +
geom_bar(stat="identity", fill="#006D2C", alpha=.6, width=.4) +
coord_flip() +
xlab("") +
ylab("Producción (t)") +
theme_bw()
casanare2020 %>%
group_by(Cod_Mun, Municipio, Cultivo) %>%
filter(Cultivo=='Arroz') %>%
summarize(max_prod_arroz = max(Produccion, na.rm = TRUE)) %>%
arrange(desc(max_prod_arroz)) -> arroz2020
## `summarise()` has grouped output by 'Cod_Mun', 'Municipio'. You can override
## using the `.groups` argument.
arroz2020
casanare2020 %>%
group_by(Cod_Mun, Municipio, Cultivo) %>%
filter(Cultivo=='Palma de aceite') %>%
summarize(max_prod_pa = max(Produccion, na.rm = TRUE)) %>%
arrange(desc(max_prod_pa)) -> palmadeaceite2020
## `summarise()` has grouped output by 'Cod_Mun', 'Municipio'. You can override
## using the `.groups` argument.
palmadeaceite2020
write_csv(Cereales2020, "./casanare_cereales_2020.csv")
write_csv(oleaginosas2020, "./casanare_oleag_2020.csv")
write_csv(arroz2020, "./casanare_arroz_2020.csv")
write_csv(palmadeaceite2020, "./casanare_pa_2020.csv")