1 Introducción

Las estadísticas multianuales para los cereales, y las leguminosas y oleaginosas en el departamento de Casanare se obtuvieron mediante este cuaderno. Se utilizó como fuente de datos principal las Evaluaciones Agropecuarias Municipales (EVA), un conjunto de datos agrícolas 2007-2018 proporcionado por el Ministerio de Agricultura y Desarrollo Rural.

2. Instalación y llamado de paquetes

library(dplyr)
library(readr)
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.1.3
library(RColorBrewer)

3. Lectura de la base de datos EVA

list.files(".", pattern=c('csv'))
## [1] "casanare_arroz_2020.csv"                       
## [2] "casanare_cereales_2020.csv"                    
## [3] "casanare_frutales_2020.csv"                    
## [4] "casanare_oleag_2020.csv"                       
## [5] "casanare_pa_2020.csv"                          
## [6] "co.csv"                                        
## [7] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"
(eva = read_csv("Evaluaciones_Agropecuarias_Municipales_EVA.csv", col_names = TRUE))
## Rows: 3142 Columns: 17
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (10): DEPARTAMENTO, MUNICIPIO, GRUPO 
## DE CULTIVO, SUBGRUPO 
## DE CULTIVO, ...
## dbl  (7): CÓD. 
## DEP., CÓD. MUN., AÑO, Área Sembrada
## (ha), Área Cosechada
## (ha...
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
names(eva)
##  [1] "CÓD. \nDEP."                                  
##  [2] "DEPARTAMENTO"                                 
##  [3] "CÓD. MUN."                                    
##  [4] "MUNICIPIO"                                    
##  [5] "GRUPO \nDE CULTIVO"                           
##  [6] "SUBGRUPO \nDE CULTIVO"                        
##  [7] "CULTIVO"                                      
##  [8] "DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO"
##  [9] "AÑO"                                          
## [10] "PERIODO"                                      
## [11] "Área Sembrada\n(ha)"                          
## [12] "Área Cosechada\n(ha)"                         
## [13] "Producción\n(t)"                              
## [14] "Rendimiento\n(t/ha)"                          
## [15] "ESTADO FISICO PRODUCCION"                     
## [16] "NOMBRE \nCIENTIFICO"                          
## [17] "CICLO DE CULTIVO"

4. Limpieza de datos

(eva %>% dplyr::select('CÓD. MUN.':'ESTADO FISICO PRODUCCION') -> eva.tmp)
eva.tmp %>% rename('Cod_Mun' = 'CÓD. MUN.',
                   'Grupo' = 'GRUPO \nDE CULTIVO',
                   'Subgrupo' = 'SUBGRUPO \nDE CULTIVO', 
                   'Year' = 'AÑO',
                   'AreaSembrada' = 'Área Sembrada\n(ha)',
                   'AreaCosechada' = 'Área Cosechada\n(ha)',
                   'Produccion' = 'Producción\n(t)',
                   'Rendimiento' =  'Rendimiento\n(t/ha)',   
                   'Sistema' = 'DESAGREGACIÓN REGIONAL Y/O SISTEMA PRODUCTIVO',
                   'Estado' = 'ESTADO FISICO PRODUCCION') -> new_eva
new_eva

Análisis de datos

Para el análisis de los datos se utilizó la función group_by() de la biblioteca dplyr, ya que permite dividir los datos en grupos; además, la función summarize() permitió colapsar cada grupo en un resumen de una sola fila.

5.1 Producción de cereales y oleaginosas entre 2007 y 2018

new_eva %>%
  filter(Produccion > 0) %>%
  group_by(Grupo) %>%
  summarize(total_produccion = sum(Produccion)) %>% 
  arrange(desc(total_produccion)) 
new_eva %>%
  group_by(Grupo) %>%
  summarize(total_produccion = sum(Produccion)) -> PT 
PT %>% 
  filter(total_produccion > 1000000) -> main.groups
(value = sum(main.groups$total_produccion))
## [1] 8296494
main.groups$percent = (main.groups$total_produccion/value)*100
# Barplot
bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupo))+
  geom_col(color = "black") +
  geom_bar(width = 1, stat = "identity")

# Piechart
pie <- bp + coord_polar("y", start=0) 
pie + scale_fill_manual(values=c("#60A855", "#B3E0A6")) + theme_minimal() 

new_eva %>%
  group_by(Grupo, MUNICIPIO) %>%
  summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
  slice(which.max(total_prod))  %>%
  arrange(desc(total_prod))
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
new_eva %>%
  group_by(Grupo, MUNICIPIO) %>%
  summarize(total_prod = sum(Produccion, na.rm = TRUE)) %>%
  slice(which.max(total_prod))  -> leaders
## `summarise()` has grouped output by 'Grupo'. You can override using the
## `.groups` argument.
leaders
leaders %>% 
  filter(total_prod > 50000) -> main.leaders
# Basic barplot
ggplot(data = main.leaders, aes(x = MUNICIPIO, y = total_prod)) +
  geom_bar(stat = "identity", color="#256D3D", fill="#B3E0A6") +
  geom_text(aes(label=Grupo), vjust=1.6, size=2.5)+
  labs(x="MUNICIPIO",y="PRODUCCIÓN TOTAL", title="Municipios que lideran la producción en el departamento de Casanare (2007-2018)") + 
  theme_minimal() + theme(axis.title=element_text(size=9))

#### 5.3 Dinámica del arroz entre 2007 y 2018

new_eva %>% 
  filter(MUNICIPIO == "PAZ DE ARIPORO" & CULTIVO == "ARROZ") %>% 
  group_by(Year, CULTIVO) %>%
  dplyr::select(MUNICIPIO, CULTIVO, Produccion, Year) ->  pda_arroz
pda_arroz
pda <- ggplot(aes(x=Year, y=Produccion/1000), data = pda_arroz) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Produccion de Arroz [Ton x 1000]', x='Año')

pda + ggtitle("Evolución de la producción de Arroz en Paz de Ariporo de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") +  theme_minimal()

new_eva %>% 
  filter(MUNICIPIO == "PAZ DE ARIPORO" & CULTIVO == "ARROZ") %>% 
  group_by(Year, CULTIVO) %>%
  dplyr::select(MUNICIPIO, CULTIVO, AreaSembrada, Year) ->  as_arroz

ggplot(aes(x=Year, y=AreaSembrada), data = as_arroz) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Área Sembrada (ha)', x='Año') + ggtitle("Evolución del área sembrada con Arroz en Paz de Ariporo de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") +  theme_minimal()

new_eva %>% 
  filter(MUNICIPIO == "MANI" & CULTIVO == "ARROZ") %>% 
  group_by(Year, CULTIVO) %>%
  dplyr::select(MUNICIPIO, CULTIVO, Rendimiento, Year) ->  ren_arroz

ggplot(aes(x=Year, y=Rendimiento), data = ren_arroz) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Rendimiento (t/ha)', x='Año') + ggtitle("Evolución del rendimiento del cultivo de arroz en Paz de Ariporo de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") +  theme_minimal()

new_eva %>% 
  filter(MUNICIPIO == "MANI" & CULTIVO == "PALMA DE ACEITE") %>% 
  group_by(Year, CULTIVO) %>%
  dplyr::select(MUNICIPIO, CULTIVO, Produccion, Year) ->  mani_pda
mani_pda
mpda <- ggplot(aes(x=Year, y=Produccion/1000), data = mani_pda) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Produccion de aceite de palma [Ton x 1000]', x='Año')

mpda + ggtitle("Evolución de la producción de aceite de palma en Maní de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") +  theme_minimal()

new_eva %>% 
  filter(MUNICIPIO == "MANI" & CULTIVO == "PALMA DE ACEITE") %>% 
  group_by(Year, CULTIVO) %>%
  dplyr::select(MUNICIPIO, CULTIVO, AreaSembrada, Year) ->  as_pda

ggplot(aes(x=Year, y=AreaSembrada), data = as_pda) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Área Sembrada (ha)', x='Año') + ggtitle("Evolución del área sembrada con palma de aceite en Maní de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") +  theme_minimal()

new_eva %>% 
  filter(MUNICIPIO == "MANI" & CULTIVO == "PALMA DE ACEITE") %>% 
  group_by(Year, CULTIVO) %>%
  dplyr::select(MUNICIPIO, CULTIVO, Rendimiento, Year) ->  ren_pda

ggplot(aes(x=Year, y=Rendimiento), data = ren_pda) + geom_bar(stat='identity', color="#B3E0A6", fill="#B3E0A6") + labs(y='Rendimiento (t/ha)', x='Año') + ggtitle("Evolución del rendimiento del cultivo de palma de aceite en Maní de 2007 a 2018") + labs(caption= "Basado en los datos de EVA (Minagricultura, 2020)") +  theme_minimal()

6. Bibliografía

Lizarazo, I., 2022. Understanding dynamic productivity of crops. Available at https://rpubs.com/ials2un/production_dyn_v1