Las estadísticas multianuales para los cereales, y las leguminosas y oleaginosas en el departamento de Casanare se obtuvieron mediante este cuaderno. Se utilizó como fuente de datos principal las Evaluaciones Agropecuarias Municipales (EVA), un conjunto de datos agrícolas 2007-2018 proporcionado por el Ministerio de Agricultura y Desarrollo Rural.
library(dplyr)
library(readr)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.1.3
library(RColorBrewer)
list.files(".", pattern=c('csv'))
## [1] "casanare_arroz_2020.csv"
## [2] "casanare_cereales_2020.csv"
## [3] "casanare_frutales_2020.csv"
## [4] "casanare_oleag_2020.csv"
## [5] "casanare_pa_2020.csv"
## [6] "co.csv"
## [7] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"
(eva = read_csv("Evaluaciones_Agropecuarias_Municipales_EVA.csv", col_names = TRUE))
## Rows: 3142 Columns: 17
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (10): DEPARTAMENTO, MUNICIPIO, GRUPO
## DE CULTIVO, SUBGRUPO
## DE CULTIVO, ...
## dbl (7): CÓD.
## DEP., CÓD. MUN., AÑO, Área Sembrada
## (ha), Área Cosechada
## (ha...
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
names(eva)
## [1] "CÓD. \nDEP."
## [2] "DEPARTAMENTO"
## [3] "CÓD. MUN."
## [4] "MUNICIPIO"
## [5] "GRUPO \nDE CULTIVO"
## [6] "SUBGRUPO \nDE CULTIVO"
## [7] "CULTIVO"
## [8] "DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO"
## [9] "AÑO"
## [10] "PERIODO"
## [11] "Área Sembrada\n(ha)"
## [12] "Área Cosechada\n(ha)"
## [13] "Producción\n(t)"
## [14] "Rendimiento\n(t/ha)"
## [15] "ESTADO FISICO PRODUCCION"
## [16] "NOMBRE \nCIENTIFICO"
## [17] "CICLO DE CULTIVO"
(eva %>% dplyr::select('CÓD. MUN.':'ESTADO FISICO PRODUCCION') -> eva.tmp)
eva.tmp %>% rename('Cod_Mun' = 'CÓD. MUN.',
'Grupo' = 'GRUPO \nDE CULTIVO',
'Subgrupo' = 'SUBGRUPO \nDE CULTIVO',
'Year' = 'AÑO',
'AreaSembrada' = 'Área Sembrada\n(ha)',
'AreaCosechada' = 'Área Cosechada\n(ha)',
'Produccion' = 'Producción\n(t)',
'Rendimiento' = 'Rendimiento\n(t/ha)',
'Sistema' = 'DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO',
'Estado' = 'ESTADO FISICO PRODUCCION') -> new_eva
new_eva
Para el análisis de los datos se utilizó la función group_by() de la biblioteca dplyr, ya que permite dividir los datos en grupos; además, la función summarize() permitió colapsar cada grupo en un resumen de una sola fila.
new_eva %>%
filter(Produccion > 0) %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion)) %>%
arrange(desc(total_produccion))
new_eva %>%
group_by(Grupo) %>%
summarize(total_produccion = sum(Produccion)) -> PT
PT %>%
filter(total_produccion > 1000000) -> main.groups
(value = sum(main.groups$total_produccion))
## [1] 8296494
main.groups$percent = (main.groups$total_produccion/value)*100
# Barplot
bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupo))+
geom_col(color = "black") +
geom_bar(width = 1, stat = "identity")
# Piechart
pie <- bp + coord_polar("y", start=0)
pie + scale_fill_manual(values=c("#60A855", "#B3E0A6")) + theme_minimal()
new_eva %>%
group_by(Grupo, MUNICIPIO) %>%
summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
slice(which.max(total_prod)) %>%
arrange(desc(total_prod))
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
new_eva %>%
group_by(Grupo, MUNICIPIO) %>%
summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
slice(which.max(total_prod)) -> leaders
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
leaders
leaders %>%
filter(total_prod > 50000) -> main.leaders
# Basic barplot
ggplot(data = main.leaders, aes(x = MUNICIPIO, y = total_prod)) +
geom_bar(stat = "identity", color="#256D3D", fill="#B3E0A6") +
geom_text(aes(label=Grupo), vjust=1.6, size=2.5)+
labs(x="MUNICIPIO",y="PRODUCCIÓN TOTAL", title="Municipios que lideran la producción en el departamento de Casanare (2007-2018)") +
theme_minimal() + theme(axis.title=element_text(size=9))
#### 5.3 Dinámica del arroz entre 2007 y 2018
new_eva %>%
filter(MUNICIPIO == "PAZ DE ARIPORO" & CULTIVO == "ARROZ") %>%
group_by(Year, CULTIVO) %>%
dplyr::select(MUNICIPIO, CULTIVO, Produccion, Year) -> pda_arroz
pda_arroz
pda <- ggplot(aes(x=Year, y=Produccion/1000), data = pda_arroz) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Produccion de Arroz [Ton x 1000]', x='Año')
pda + ggtitle("Evolución de la producción de Arroz en Paz de Ariporo de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") + theme_minimal()
new_eva %>%
filter(MUNICIPIO == "PAZ DE ARIPORO" & CULTIVO == "ARROZ") %>%
group_by(Year, CULTIVO) %>%
dplyr::select(MUNICIPIO, CULTIVO, AreaSembrada, Year) -> as_arroz
ggplot(aes(x=Year, y=AreaSembrada), data = as_arroz) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Área Sembrada (ha)', x='Año') + ggtitle("Evolución del área sembrada con Arroz en Paz de Ariporo de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") + theme_minimal()
new_eva %>%
filter(MUNICIPIO == "MANI" & CULTIVO == "ARROZ") %>%
group_by(Year, CULTIVO) %>%
dplyr::select(MUNICIPIO, CULTIVO, Rendimiento, Year) -> ren_arroz
ggplot(aes(x=Year, y=Rendimiento), data = ren_arroz) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Rendimiento (t/ha)', x='Año') + ggtitle("Evolución del rendimiento del cultivo de arroz en Paz de Ariporo de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") + theme_minimal()
new_eva %>%
filter(MUNICIPIO == "MANI" & CULTIVO == "PALMA DE ACEITE") %>%
group_by(Year, CULTIVO) %>%
dplyr::select(MUNICIPIO, CULTIVO, Produccion, Year) -> mani_pda
mani_pda
mpda <- ggplot(aes(x=Year, y=Produccion/1000), data = mani_pda) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Produccion de aceite de palma [Ton x 1000]', x='Año')
mpda + ggtitle("Evolución de la producción de aceite de palma en Maní de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") + theme_minimal()
new_eva %>%
filter(MUNICIPIO == "MANI" & CULTIVO == "PALMA DE ACEITE") %>%
group_by(Year, CULTIVO) %>%
dplyr::select(MUNICIPIO, CULTIVO, AreaSembrada, Year) -> as_pda
ggplot(aes(x=Year, y=AreaSembrada), data = as_pda) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Área Sembrada (ha)', x='Año') + ggtitle("Evolución del área sembrada con palma de aceite en Maní de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") + theme_minimal()
new_eva %>%
filter(MUNICIPIO == "MANI" & CULTIVO == "PALMA DE ACEITE") %>%
group_by(Year, CULTIVO) %>%
dplyr::select(MUNICIPIO, CULTIVO, Rendimiento, Year) -> ren_pda
ggplot(aes(x=Year, y=Rendimiento), data = ren_pda) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Rendimiento (t/ha)', x='Año') + ggtitle("Evolución del rendimiento del cultivo de palma de aceite en Maní de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") + theme_minimal()
Lizarazo, I., 2022. Understanding dynamic productivity of crops. Available at https://rpubs.com/ials2un/production_dyn_v1