En este Notebook se podra visualizar la dinamica agricola del departamento del Magdalena, teniendo en cuenta los resultados de las evaluaciones EVA en el año 2019 y 2023

library(tidyverse)
library(readr)
library(dplyr)
library(ggplot2)
list.files("./datos", pattern = c ('csv'))
## [1] "Evaluaciones_Agropecuarias_Magdalenaa.csv"
## [1] "co.csv"                                        
## [2] "Evaluaciones_Agropecuarias_Municipales_EVA.csv"
## [3] "stder_frutales_2020.csv"                       
## [4] "stder_oleag_2020.csv"
eva <- read_csv("./datos/Evaluaciones_Agropecuarias_Magdalenaa.csv", 
                col_names = TRUE, 
                show_col_types = FALSE)
## Warning: One or more parsing issues, call `problems()` on your data frame for details,
## e.g.:
##   dat <- vroom(...)
##   problems(dat)
names(eva)
## [1] "Codigomunicipio;Municipio;Cultivo;Grupocultivo;Año;Areasembrada(ha);Areacosechada(ha);Produccion(t);Rendimiento(t/ha)"
eva <- read_csv2(
  "./datos/Evaluaciones_Agropecuarias_Magdalenaa.csv", 
  col_names = TRUE, 
  show_col_types = FALSE
) %>% 
  # Seleccionar columnas relevantes
  dplyr::select(Codigomunicipio:`Rendimiento(t/ha)`) %>% 
  # Limpiar y transformar columnas
  dplyr::mutate(
    `Areasembrada(ha)` = floor(as.numeric(gsub(",", ".", `Areasembrada(ha)`))),
    `Areacosechada(ha)` = floor(as.numeric(gsub(",", ".", `Areacosechada(ha)`))),
    `Produccion(t)` = floor(as.numeric(gsub(",", ".", `Produccion(t)`)))
  ) %>% 
  # Renombrar columnas
  dplyr::rename(
    `Area_cosechada(ha)` = `Areacosechada(ha)`,
    `Produccion(t)` = `Produccion(t)`,
    `Rendimiento(t/ha)` = `Rendimiento(t/ha)`
  )
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.

###1.Tabla De Datos De Las Evaluaciones agropecuarias (EVA) Podemos observar los resultados que obtuvo el departamento del Meta durante los años 2019 y 2023

eva <- read_delim(
  "./datos/Evaluaciones_Agropecuarias_Magdalenaa.csv", 
  delim = ";",  # Especificamos el delimitador
  col_names = TRUE, 
  locale = locale(
    decimal_mark = ",",  # Coma como separador decimal
    grouping_mark = "."  # Punto como separador de miles
  ),
  show_col_types = FALSE
) %>% 
  # Seleccionar columnas relevantes
  dplyr::select(Codigomunicipio:`Rendimiento(t/ha)`) %>% 
  # Limpiar y transformar columnas
  dplyr::mutate(
    `Areasembrada(ha)` = floor(as.numeric(gsub(",", ".", `Areasembrada(ha)`))),
    `Areacosechada(ha)` = floor(as.numeric(gsub(",", ".", `Areacosechada(ha)`))),
    `Produccion(t)` = floor(as.numeric(gsub(",", ".", `Produccion(t)`)))
  ) %>% 
  # Renombrar columnas
  dplyr::rename(
    `Area_cosechada(ha)` = `Areacosechada(ha)`,
    `Rendimiento(t/ha)` = `Rendimiento(t/ha)`
  )->new.eva
new.eva
## # A tibble: 1,145 × 9
##    Codigomunicipio Municipio   Cultivo  Grupocultivo   Año `Areasembrada(ha)`
##              <dbl> <chr>       <chr>    <chr>        <dbl>              <dbl>
##  1           47001 Santa Marta Aguacate Frutales      2019                 48
##  2           47001 Santa Marta Aguacate Frutales      2023                 10
##  3           47001 Santa Marta Aguacate Frutales      2023                 40
##  4           47001 Santa Marta Ahuyama  Hortalizas    2019                101
##  5           47001 Santa Marta Ahuyama  Hortalizas    2019                142
##  6           47001 Santa Marta Ahuyama  Hortalizas    2023                111
##  7           47001 Santa Marta Ahuyama  Hortalizas    2023                 39
##  8           47001 Santa Marta Ají      Hortalizas    2019                 53
##  9           47001 Santa Marta Ají      Hortalizas    2019                 75
## 10           47001 Santa Marta Ají      Hortalizas    2023                 36
## # ℹ 1,135 more rows
## # ℹ 3 more variables: `Area_cosechada(ha)` <dbl>, `Produccion(t)` <dbl>,
## #   `Rendimiento(t/ha)` <dbl>

###2.Analisis Evaluaciones EVA Departamento Del Meta #2.1 cultivos representativos de los años 2019 y 2023

new.eva %>%
  ## filter(`Produccion(t)` > 0) %>% 
  group_by(Grupocultivo) %>%
  summarize(`total_produccion(t)` = sum(`Produccion(t)`)) %>% 
  arrange(desc(`total_produccion(t)`))
## # A tibble: 8 × 2
##   Grupocultivo                                             `total_produccion(t)`
##   <chr>                                                                    <dbl>
## 1 Frutales                                                               1575894
## 2 Raíces y tubérculos                                                     525530
## 3 Oleaginosas                                                             285836
## 4 Cereales                                                                148878
## 5 Hortalizas                                                              146924
## 6 Cultivos tropicales tradicionales                                        36557
## 7 Leguminosas                                                               4233
## 8 Cultivos para condimentos, bebidas medicinales y aromát…                    82

Los cultivos mas representativos de los años 2019 y 2023 segun las evaluaciones EVA fueron los frutales, las raices y tubercos,las oleaginosas y los cereales

new.eva %>% group_by(Grupocultivo) %>% summarize(`total_produccion(t)` = sum(`Produccion(t)`)) -> PT
PT %>% 
  filter(`total_produccion(t)` > 1000000) -> main.groups

Suma de los cultivos mas representativos en toneladas(t)

(value = sum(main.groups$`total_produccion(t)`))
## [1] 1575894

Podemos observar que el total de la suma de estos 4 cultivos (frutales,raices,tuberculos, oleaginosas y cereales ) no da un valor de 1.575.894 toneladas en los años 2019 y 2023

A continuacion podremos observar un diagrama de torta con el cultivo mas representativo

main.groups$percent = main.groups$`total_produccion(t)`/value
PT <- PT %>%
  mutate(percentage = (`total_produccion(t)` / sum(`total_produccion(t)`)) * 100)
bp<- ggplot(main.groups, aes(x="", y=percent, fill=Grupocultivo))+
geom_bar(stat = "identity", width = 1, color = "white") +
  coord_polar("y", start = 0)+ theme_void() + labs(title = "Distribucion de Produccion por Grupocultivo", fill = "Grupocultivo") +  theme(plot.title = element_text(hjust = 0.5, size = 14, face = "bold"),  
    legend.title = element_text(hjust = 0.5), 
    legend.text = element_text(size = 10),  
    plot.margin = margin(20, 20, 20, 20) )
# Piechart
pie <- bp + coord_polar("y", start=0)
## Coordinate system already present. Adding new coordinate system, which will
## replace the existing one.
pie

#2.2 Municipios Lideres En Produccion De Cada Cultivo En El Año 2019 Y 2023

new.eva %>%
  group_by(Grupocultivo, Municipio) %>%
  summarize(`total_produccion(t)` = sum(`Produccion(t)`, na.rm = TRUE)) %>%
  slice(which.max(`total_produccion(t)`))  %>%
  arrange(desc(`total_produccion(t)`)) -> lideres
## `summarise()` has grouped output by 'Grupocultivo'. You can override using the
## `.groups` argument.
lideres
## # A tibble: 8 × 3
## # Groups:   Grupocultivo [8]
##   Grupocultivo                                   Municipio `total_produccion(t)`
##   <chr>                                          <chr>                     <dbl>
## 1 Frutales                                       Zona Ban…                912712
## 2 Oleaginosas                                    Zona Ban…                 99221
## 3 Raíces y tubérculos                            San Zenón                 90880
## 4 Hortalizas                                     Sitionue…                 45212
## 5 Cereales                                       El Retén                  23781
## 6 Cultivos tropicales tradicionales              Fundación                 13607
## 7 Leguminosas                                    Sitionue…                   584
## 8 Cultivos para condimentos, bebidas medicinale… Fundación                    82

Como podemos observar los Municipios lideres en producción fuerón Zona Bananera como primer y segundo lugar destacando con frutrales y oleaginosas y San zesón en tercer lugar, destacando en raíces y tubérculos

#2.3 Vista Agrícola En Los Municipios Lideres

lideres %>% 
  filter(`total_produccion(t)` > 50000) -> lideres.principales
library(scales)
## 
## Adjuntando el paquete: 'scales'
## The following object is masked from 'package:purrr':
## 
##     discard
## The following object is masked from 'package:readr':
## 
##     col_factor
p <- ggplot(data = lideres.principales, aes(x = reorder(Municipio, -`total_produccion(t)`), y = `total_produccion(t)`)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  labs(
    title = "Municipios Lideres en Produccion Agricola en el Magdalena ",
    x = "Municipio",
    y = "Produccion Total (t)"
  ) +
  theme_minimal() + 
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),  
    plot.title = element_text(hjust = 0.5))+  scale_y_continuous(labels = label_comma())
p

2.4 Cultivo Más Representativas Según Área Sembrada Y Cosechada En Los Años 2019 Y 2023

especies_representativas <- new.eva %>%
  filter(`Areasembrada(ha)` > 0, `Area_cosechada(ha)` > 0) %>%  # Filtrar valores mayores a cero
  group_by(Cultivo, Grupocultivo) %>%  # Agrupar por Cultivo y Grupocultivo
  summarize(
    `total_Areasembrada(ha)` = sum(`Areasembrada(ha)`, na.rm = TRUE),  # Sumar área sembrada
    `total_Area_Cosechada(ha)` = sum(`Area_cosechada(ha)`, na.rm = TRUE),  # Sumar área cosechada
    .groups = "drop"  # Eliminar los grupos después de la agregación
  ) %>%
  arrange(desc(`total_Area_Cosechada(ha)`)) %>%  # Asegúrate de usar el nombre correcto de la columna
  slice_head(n = 10)  # Seleccionar las primeras 10 filas
especies_representativas %>%
  head()
## # A tibble: 6 × 4
##   Cultivo         Grupocultivo     total_Areasembrada(h…¹ total_Area_Cosechada…²
##   <chr>           <chr>                             <dbl>                  <dbl>
## 1 Palma de aceite Oleaginosas                       92103                  80459
## 2 Maíz            Cereales                          57832                  55206
## 3 Yuca            Raíces y tubérc…                  41212                  38304
## 4 Café            Cultivos tropic…                  37486                  34738
## 5 Banano          Frutales                          34964                  31476
## 6 Mango           Frutales                          10568                   8026
## # ℹ abbreviated names: ¹​`total_Areasembrada(ha)`, ²​`total_Area_Cosechada(ha)`

A continuación podemos observar un gráfico de barras con los cultivos más representativos del municipio del Magdalena en el año 2019 y 2023

ggplot(data = especies_representativas, 
       aes(x = reorder(Cultivo, -`total_Area_Cosechada(ha)`), 
           y = `total_Area_Cosechada(ha)`, fill = Cultivo)) +
  geom_bar(stat = "identity") +
  labs(
    title = "Top 10 cultivos en Area Cosechada",
    x = "Cultivo",
    y = "Area Cosechada Total (ha)"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5),  # Centrar título
    axis.text.x = element_text(angle = 45, hjust = 1)  # Rotar etiquetas del eje X
  )

2.5 Rendimiento Del Cultivo De Palma De Aceite En Los Años 2019 Y 2023

Palma_de_aceite <- new.eva %>% 
  filter(Cultivo == "Palma de aceite", Año >= 2019, Año <= 2023) %>%  group_by(Año) %>% 
  summarize(
    `Rendimiento_Total(t/ha)` = sum(`Rendimiento(t/ha)`, na.rm = TRUE),
    .groups = "drop"
  )
Palma_de_aceite
## # A tibble: 2 × 2
##     Año `Rendimiento_Total(t/ha)`
##   <dbl>                     <dbl>
## 1  2019                      42.1
## 2  2023                      43.3

Gráfico de lineas del rendimiento en toneladas por hectárea de palma de aceite del año 2019 y 2023

ggplot(Palma_de_aceite, aes(x = Año, y = `Rendimiento_Total(t/ha)`)) +
  geom_line(color = "pink", size = 1) + 
  geom_point(color = "red", size = 2) +  
  labs(title = "Rendimiento Total de Palma de Aceite (2019-2023)",
       x = "Año",
       y = "Rendimiento Total (t/ha)") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

###Conclusión El Magdalena muestra una diversidad de cultivos importantes que contribuyen significativamente a la produción agricola del departamento. Entre los cultivos analizados, se destacan algunos con un alto rendimiento y áreas cosechadas extensas,lo que refleja la importancia estratégica de estas actividades para la economía y el desarrollo rural de la región. Se identificaron los 10 principales cultivoss con mayor área cosechada, entre los cuales destacan cultivos de raíces, tubérculos y frutas. Estos cultivos reflejan la diversidad agroecológica de la región y la adaptación de los agricultores a diferentes condiciones climáticas y de suelo.

###Bibliograía Lizarazo, I., 2022. Understanding dynamic productivity of crops. Available at https://rpubs.com/ials2un/production_dyn_v1.

EVA 2023. (2023). Upra.gov.co. https://upra.gov.co/es-co/Paginas/eva_2023.aspx