Ana María Montaño Hernández Abril 20/2020

1. Introducción:

Norte de Santander, es uno de los departamentos de Colombia, ubicado al noreste del país, limitando con Venezuela al oriente, al sur con Boyacá, y al occidente con Santander y Cesar. Tiene una superficie de 21658 km2 para el año 2019, y una población de 1367716 habitantes. Su capital es Cúcuta. En cuanto a su economía, la principal actividad económica del departamento es la agricultura, desarrollándose en las vertientes de las cordilleras y sobresaliendo cultivos como el café, maíz, arroz, yuca, caña de azúcar, cacao, trigo, plátano y palma africana. Su economía, también se complementa con el explotación petrolera en la zona del Tibú. Por lo tanto, en este cuaderno de R se ilustran las Estadísticas Agrícolas para Norte de Santander, en Colombia.

2. Funcionalidades del SIG

Cuando se desea comprender lo que está sucediendo en un territorio, es esencial la exploración de estadísticas no espaciales. Para ello, existen librerías de R útiles para explorar y resumir estadísticas, como dplyr y tidyverse. Por otro lado, las operaciones geoespaciales pueden mejorar la comprensión de problemas que afectan las regiones geográficas. Por ejemplo, si se desea averiguar cuál es la ubicación de aquellos municipios cuyos rendimientos de cosecha son sobresalientes (o, más bajos que el promedio), es necesario unir datos no espaciales con datos espaciales para la exploración. Esto ya se realizó usando QGIS, ahora se realizará usando R. Además, también se pueden explorar uniones espaciales. Estas operaciones se basan en la intersección entre dos objetos espaciales, a menudo puntos y polígonos. Existen varias formas en que podemos unir objetos, que pueden incluir opciones específicas como cruces, cerca, dentro, toques, etc.

rm(list = ls())

Ahora, se instalan las librerías que se necesitan (here, tidyverse, rgeos, maptools, raster, sf, viridis, rnaturalearth, GSODR, ggrepel y cowplot) Luego, se cargan todas las librerías anteriores.

warning= FALSE
library(here)
## here() starts at C:/Users/user/Documents/Intro_to_R
library(tidyverse)
## -- Attaching packages ------------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.0     v purrr   0.3.3
## v tibble  2.1.3     v dplyr   0.8.4
## v tidyr   1.0.2     v stringr 1.4.0
## v readr   1.3.1     v forcats 0.5.0
## -- Conflicts --------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(rgeos)
## Loading required package: sp
## rgeos version: 0.5-2, (SVN revision 621)
##  GEOS runtime version: 3.6.1-CAPI-1.10.1 
##  Linking to sp version: 1.4-1 
##  Polygon checking: TRUE
library(maptools)
## Checking rgeos availability: TRUE
library(raster)
## 
## Attaching package: 'raster'
## The following object is masked from 'package:dplyr':
## 
##     select
## The following object is masked from 'package:tidyr':
## 
##     extract
library(sf)
## Linking to GEOS 3.6.1, GDAL 2.2.3, PROJ 4.9.3
library(viridis)
## Loading required package: viridisLite
library(rnaturalearth)
library(GSODR)
library(ggrepel)
library(cowplot)
## 
## ********************************************************
## Note: As of version 1.0.0, cowplot does not change the
##   default ggplot2 theme anymore. To recover the previous
##   behavior, execute:
##   theme_set(theme_cowplot())
## ********************************************************

3. Explorando estadísticas agrícolas en Norte de Santander.

Previamente, se descargaron los datos estadísticos en formato csv, en Estadísticas Municipales Agropecuarias. Luego, en Excel se eliminaron las filas de los municipios de departamentos diferentes a Norte de Santander, y se guardó este archivo con el nombre EVA_NORTEDESANTANDER.csv. Ahora, se va a leer el archivo csv.

datos <- read_csv2("C:/Users/user/Documents/Norte de Santander/EVA2_NORTEDESANTANDER.csv")
## Using ',' as decimal and '.' as grouping mark. Use read_delim() for more control.
## Parsed with column specification:
## cols(
##   COD_DEP = col_double(),
##   DEPARTAMENTO = col_character(),
##   COD_MUN = col_double(),
##   MUNICIPIO = col_character(),
##   GRUPO = col_character(),
##   SUBGRUPO = col_character(),
##   CULTIVO = col_character(),
##   YEAR = col_number(),
##   `Area_Sembrada(ha)` = col_number(),
##   `Area_Cosecha(ha)` = col_number(),
##   `Produccion_(t)` = col_number(),
##   `Rendimiento(t/ha)` = col_double(),
##   ESTADO = col_character(),
##   NOMBRE = col_character(),
##   CICLO = col_character()
## )
head(datos)
tail(datos)

Ahora, se usa la librería dplyr para explorar el contenido del objeto datos. Primero, se obtiene un resumen del rendimiento (es decir, el rendimiento promedio durante varios años) por grupo y municipio.

datos %>% 
  group_by(MUNICIPIO, GRUPO) %>%
  summarise(rend_prom = mean(`Rendimiento(t/ha)`, na.rm = TRUE)) -> rend_resumen
head(rend_resumen)

También, se puede calcular el rendimiento promedio por GRUPO en los municipios de Norte de Santander:

datos %>%
  group_by(GRUPO) %>%
  summarise(rend_dep = mean(`Rendimiento(t/ha)`, na.rm = TRUE)) -> rend_nortedesantander

rend_nortedesantander

Con la tabla anterior se puede observar que los rendimientos más altos corresponden a HORTALIZAS, FRUTALES Y TUBERCULOS Y PLATANOS. Luego, se pueden ver cuáles son los municipios con mayor rendimiento para cada grupo de cultivos en el año 2018.

datos %>%
  filter(YEAR==2018) %>%
  group_by(GRUPO, MUNICIPIO) %>%
  summarize(max_rend = max(`Rendimiento(t/ha)`, na.rm = TRUE)) %>%
  slice(which.max(max_rend)) -> rend_max_18

rend_max_18

En seguida, se van a observar cuáles son los municipios con mayor área cosechada para cada grupo de cultivos en el año 2018:

datos %>%
  filter(YEAR==2018) %>%
  group_by(GRUPO,MUNICIPIO) %>% 
  summarize(max_area_cosecha = max(`Area_Cosecha(ha)`, na.rm = TRUE)) %>% 
  slice(which.max(max_area_cosecha)) -> area_cosecha_max

area_cosecha_max

Hay que tener en cuenta que el área más grande cosechada en el año 2018 correspondió al GRUPO OLEAGINOSAS en el municipio de TIBU. Cabe mencionar, que la economía de TIBU depende principalmente de la explotación petrolera, pero además de esto, cuenta con grandes hectáreas de cultivos de cacao, yuca, maíz y palma de aceite, esta última se encuentra en constante aumento. Dicho lo anterior, se va a seleccionar la producción de palma de aceite (toneladas) en TIBU para cada año:

datos %>% 
  filter(MUNICIPIO== "TIBU" & SUBGRUPO== "PALMA DE ACEITE") %>%
  group_by(YEAR, CULTIVO) -> tibu_palmadeaceite

tibu_palmadeaceite

Se va a realizar una exploración gráfica básica y para esto se va a usar la librería ggplot2:

g <- ggplot(aes(x=YEAR, y= `Produccion_(t)`/1000), data = tibu_palmadeaceite) + geom_bar(stat = "identity") + labs(y= "Producción de palma de aceite [Ton x 1000]")
g + ggtitle("Evolución de la producción de palma de aceite en Tibu desde 2007 hasta 2018") + labs(caption = "Basado en datos de EMA (DANE, 2018)")

En esta gráfica se puede observar que la producción de palma de aceite en el municipio de Tibú ha estado en constante aumento hasta el año 2018. Además, según el palmicultor Roque Julio Gómez (2015), el crecimiento en el área sembrada y por tanto, en la producción, se debe a que la palma es un cultivo alternativo en Tibú debido a la construcción de la planta procesadora de palma en este municipio. También, según la revista LA OPINIÓN, este comportamiento de aumento se debe al apoyo del Gobierno Nacional y la llegada de recursos internacionales.

Ahora, se va a investigar qué cultivos tuvieron la mayor área cosechada en 2018:

datos %>%
  filter(YEAR== 2018) %>%
  group_by(GRUPO) %>%
  summarize(sum_area_cosecha = sum(`Area_Cosecha(ha)`, na.rm = TRUE)) %>% 
  arrange(desc(sum_area_cosecha)) -> total_area_cosecha

total_area_cosecha

También, es posible ver que el grupo de cultivos OTROS PERMANENTES tuvo la mayor parte del área cosechada en 2018 para Norte de Santander. Pero, ¿Qué cultivos pertenecen a este GRUPO? Si se desea, se puede buscar más información en DANE, la agencia gubernamental a cargo de las estadísticas nacionales en Colombia. Además, se puede buscar esta información en los mismos datos que ya se tienen:

datos %>%
  filter(GRUPO== "OTROS PERMANENTES" & YEAR== 2018) %>%
  group_by(CULTIVO) %>%
  summarize(sum_cosecha = sum(`Area_Cosecha(ha)`, na.rm = TRUE)) %>% 
  arrange(desc(sum_cosecha)) -> total_cosecha

total_cosecha     

De los cultivos pertenecientes al grupo OTRO PERMANENTES, se pudo observar que el café tiene gran importancia en la agricultura de Norte de Santander, debido a su alta área de cosecha. En seguida, se van a observar cuáles son los municipios con mayor área cosechada para cada cultivo permanente en 2018:

datos %>%
  filter(YEAR== 2018 & GRUPO=="OTROS PERMANENTES") %>%
  group_by(CULTIVO, MUNICIPIO) %>% 
  summarize(max_area2 = max(`Area_Cosecha(ha)`, na.rm = TRUE)) %>%
  slice(which.max(max_area2)) -> area_cosecha2

area_cosecha2

Se vuelve a los datos de cultivos permanentes. Antes de trazar la gráfica, se necesita agregar al objeto total_area_cosecha, un nuevo campo con abreviaturas para cada GRUPO de cultivos, de modo que la gráfica se verá ordenada.

total_area_cosecha$Cultivo <- abbreviate(total_area_cosecha$GRUPO, 3)

Ahora, se traza la gráfica y se va a usar la librería ggplot2:

g <- ggplot(aes(x= Cultivo, y= sum_area_cosecha), data = total_area_cosecha) + geom_bar(stat = "identity") + labs(y= "Área total cosechada [ha]")
g + ggtitle("Área total cosechada por grupos de cultivo en 2018 para Norte de Santander") + theme(plot.title = element_text(hjust = 0.5)) + labs(caption = "Basado en datos de EMA (DANE, 2018) ")

A continuación, se observa el comportamiento en la producción de los cultivos de arroz y yuca en el municipio de Cúcuta, ya que son cultivos de gran importancia economica.

datos %>% 
  filter(MUNICIPIO== "CUCUTA" & SUBGRUPO== "ARROZ") %>%
  group_by(YEAR, CULTIVO) -> CUCUTA_arroz

CUCUTA_arroz
g <- ggplot(aes(x=YEAR, y= `Produccion_(t)`/1000), data = CUCUTA_arroz) + geom_bar(stat = "identity") + labs(y= "Producción de arroz [Ton x 1000]")
g + ggtitle("Evolución de la producción de arroz en Cúcuta desde 2007 hasta 2018") + labs(caption = "Basado en datos de EMA (DANE, 2018)")

Con la gráfica anterior se puede observar que la producción de arroz en la capital, ha sido variable a lo largo de estos años. Según EL TIEMPO, 2012, el cultivo de arroz ha estado siendo vigilado y controlado por el ICA, ya que la producción se ha visto afectada por el virus de la hoja blanca, que es el principal problema fitosanitario que actualemnte afecta estos cultivos. Es necesario tomar medidas para controlar este virus, ya que esto afecta directamente la economía del municipio y a su vez a miles de productores. Cabe mencionar que Cúcuta y El Zulia, donde se concentra el 76% del área sembrada, son las zonas más afectadas con la presencia de enfermedades como Rhizoctonia solani, Helminthosporium en la hoja y Manchado del grano.

Ahora, se observa el comportamiento de la yuca en este mismo municipio:

datos %>% 
  filter(MUNICIPIO== "CUCUTA" & SUBGRUPO== "YUCA") %>%
  group_by(YEAR, CULTIVO) -> CUCUTA_yuca

CUCUTA_yuca
g <- ggplot(aes(x=YEAR, y= `Produccion_(t)`/1000), data = CUCUTA_yuca) + geom_bar(stat = "identity") + labs(y= "Producción de yuca [Ton x 1000]")
g + ggtitle("Evolución de la producción de yuca en Cúcuta desde 2007 hasta 2018") + labs(caption = "Basado en datos de EMA (DANE, 2018)")

Por el contrario, la gráfica anterior muestra que la producción de yuca se encuentra en declive, siendo muy baja para el año 2018, en comparación al año 2007. Puede deberse a que la yuca esta siendo sustituida por otros cultivos que se adaptan mejor a los suelos y condiciones de la zona.

4.Unir las estadísticas agrícolas a los municipios.

Para realizar la unión (join),es buena idea usar el shapefile correspondiente al Marco Geoestadístico Departamental que está disponible en el Geoportal del DANE; para este caso el que corresponde a Norte de Santander. Primero, se empieza leyendo los datos usando la librería sf

ant_munic <- sf:: st_read("C:/Users/user/Documents/Norte de Santander/54_NORTE DE SANTANDER/ADMINISTRATIVO/MGN_MPIO_POLITICO.shp")
## Reading layer `MGN_MPIO_POLITICO' from data source `C:\Users\user\Documents\Norte de Santander\54_NORTE DE SANTANDER\ADMINISTRATIVO\MGN_MPIO_POLITICO.shp' using driver `ESRI Shapefile'
## Simple feature collection with 40 features and 9 fields
## geometry type:  MULTIPOLYGON
## dimension:      XY
## bbox:           xmin: -73.63379 ymin: 6.872201 xmax: -72.04761 ymax: 9.290847
## epsg (SRID):    4326
## proj4string:    +proj=longlat +datum=WGS84 +no_defs

Pero, ¿Qué es ant_munic?

ant_munic

Tenga en cuenta, que ant_munic es una colección de características simples. Una característica simple se refiere a un estándar formal (ISO 19125-1:2004) que describe cómo los objetos de la vida real pueden ser representados en el computador, haciendo énfasis en la geometría espacial de estos objetos. También, describe cómo estos objetos se pueden almacenar y recuperarse de bases de datos. Además, muestra las operaciones geométricas que se pueden definir para estos objetos. R ha carecido de una implementación completa de características simples, haciendo que las conversiones a veces sean complicadas, pero el paquete sf intenta suplir estas deficiencias a largo plazo.

También, hay que mencionar que estos datos utilizan el sistema de referencia de coordenadas geográficas WGS1984 (Código EPSG: 4326) Se puede usar la función left_join para unir los municipios y las estadísticas agrícolas seleccionadas. Ahora, para ver cuál es la función de left_join se escirbe en la consola de R el código: ?left_join y en la parte de ayudas se obtiene:

left_join: Función genérica que sirve para unir dos fuentes de datos (x, y).X y Y, generalmente deben ser del mismo origen de datos, pero si la copia es VERDADERA, y se copiará automáticamente en el mismo origen que x.

Se va a verificar lo anterior:

datos %>% filter(MUNICIPIO=="CUCUTA") -> med_datos
med_datos
class(med_datos$COD_MUN)
## [1] "numeric"
datos2 <- datos
datos2$TEMP <- as.character(datos2$COD_MUN)
datos2$MPIO_CCDGO <- as.factor(datos2$TEMP)
head(datos2)

Hay que asegurarse de verificar, en el objetos datos 2, las características del nuevo atributo MPIO_CCDGO. Luego, se va a filtrar un solo año y a seleccionar solo dos atributos relevantes:

datos2 %>% filter(CULTIVO =="CAFE") -> datos3
head(datos3)
tail(datos3)
class(datos3)
## [1] "spec_tbl_df" "tbl_df"      "tbl"         "data.frame"
datos4 <- datos3 %>% dplyr::select(MUNICIPIO, MPIO_CCDGO, YEAR,   `Produccion_(t)`, `Rendimiento(t/ha)`)
datos4
datos4 %>%
  gather("YEAR", "Produccion_(t)", "Rendimiento(t/ha)" , key =  variable, value = number)
head(datos4)

A continuación, viene una tarea clave. Implica varios pasos para poder convertir la tabla de atributos de formato largo a formato ancho.

datos4 %>%
  group_by(MPIO_CCDGO) %>% 
  mutate(Visit = 1:n()) %>%
  gather("YEAR", "Produccion_(t)", "Rendimiento(t/ha)" , key =  variable, value = number) %>%
  unite(combi, variable, Visit) %>%
  spread(combi, number) -> datos5
head(datos5)
tail(datos5)

También se hará una copia de la colección de características simples, para evitar daños en la original:

ant_munic2 <- ant_munic

AHORA ES TIEMPO DE UNIR:

ant_munic_stat = left_join(ant_munic2, datos5, by= "MPIO_CCDGO")
summary(ant_munic_stat)
##  DPTO_CCDGO   MPIO_CCDGO      MPIO_CNMBR   MPIO_CRSLC   MPIO_NAREA     
##  54:40      54001  : 1   ABREGO    : 1   1911   : 2   Min.   :  44.95  
##             54003  : 1   ARBOLEDAS : 1   1930   : 2   1st Qu.: 164.39  
##             54051  : 1   BOCHALEMA : 1   1555   : 1   Median : 345.88  
##             54099  : 1   BUCARASICA: 1   1570   : 1   Mean   : 546.41  
##             54109  : 1   CÁCHIRA   : 1   1580   : 1   3rd Qu.: 678.45  
##             54125  : 1   CÁCOTA    : 1   1583   : 1   Max.   :2680.08  
##             (Other):34   (Other)   :34   (Other):32                    
##    MPIO_NANO                 DPTO_CNMBR   Shape_Leng       Shape_Area      
##  Min.   :2017   NORTE DE SANTANDER:40   Min.   :0.4550   Min.   :0.003686  
##  1st Qu.:2017                           1st Qu.:0.6974   1st Qu.:0.013460  
##  Median :2017                           Median :1.0266   Median :0.028313  
##  Mean   :2017                           Mean   :1.3434   Mean   :0.044807  
##  3rd Qu.:2017                           3rd Qu.:1.7969   3rd Qu.:0.055629  
##  Max.   :2017                           Max.   :4.0863   Max.   :0.220099  
##                                                                            
##   MUNICIPIO         Produccion_(t)_1  Produccion_(t)_10 Produccion_(t)_11
##  Length:40          Min.   :   0.00   Min.   :   2.0    Min.   :  31.0   
##  Class :character   1st Qu.:  59.25   1st Qu.: 209.5    1st Qu.: 209.5   
##  Mode  :character   Median : 287.00   Median : 413.0    Median : 659.0   
##                     Mean   : 378.00   Mean   : 573.7    Mean   : 722.8   
##                     3rd Qu.: 560.50   3rd Qu.: 925.0    3rd Qu.:1128.2   
##                     Max.   :1695.00   Max.   :1341.0    Max.   :1668.0   
##                     NA's   :4         NA's   :6         NA's   :8        
##  Produccion_(t)_12 Produccion_(t)_13 Produccion_(t)_14 Produccion_(t)_15
##  Min.   :  30.0    Min.   :45        Min.   :110       Min.   :61       
##  1st Qu.: 213.5    1st Qu.:45        1st Qu.:110       1st Qu.:61       
##  Median : 662.0    Median :45        Median :110       Median :61       
##  Mean   : 724.2    Mean   :45        Mean   :110       Mean   :61       
##  3rd Qu.:1105.0    3rd Qu.:45        3rd Qu.:110       3rd Qu.:61       
##  Max.   :1717.0    Max.   :45        Max.   :110       Max.   :61       
##  NA's   :8         NA's   :39        NA's   :39        NA's   :39       
##  Produccion_(t)_16 Produccion_(t)_17 Produccion_(t)_18 Produccion_(t)_19
##  Min.   :66        Min.   :105       Min.   :123       Min.   :149      
##  1st Qu.:66        1st Qu.:105       1st Qu.:123       1st Qu.:149      
##  Median :66        Median :105       Median :123       Median :149      
##  Mean   :66        Mean   :105       Mean   :123       Mean   :149      
##  3rd Qu.:66        3rd Qu.:105       3rd Qu.:123       3rd Qu.:149      
##  Max.   :66        Max.   :105       Max.   :123       Max.   :149      
##  NA's   :39        NA's   :39        NA's   :39        NA's   :39       
##  Produccion_(t)_2  Produccion_(t)_20 Produccion_(t)_21 Produccion_(t)_22
##  Min.   :   0.00   Min.   :112       Min.   :100       Min.   :96       
##  1st Qu.:  63.75   1st Qu.:112       1st Qu.:100       1st Qu.:96       
##  Median : 287.00   Median :112       Median :100       Median :96       
##  Mean   : 380.53   Mean   :112       Mean   :100       Mean   :96       
##  3rd Qu.: 560.50   3rd Qu.:112       3rd Qu.:100       3rd Qu.:96       
##  Max.   :1695.00   Max.   :112       Max.   :100       Max.   :96       
##  NA's   :4         NA's   :39        NA's   :39        NA's   :39       
##  Produccion_(t)_3 Produccion_(t)_4 Produccion_(t)_5 Produccion_(t)_6
##  Min.   :   2.0   Min.   :   0.0   Min.   :   1.0   Min.   :   1.0  
##  1st Qu.:  54.0   1st Qu.: 114.0   1st Qu.:  64.0   1st Qu.:  57.5  
##  Median : 194.0   Median : 468.0   Median : 262.0   Median : 275.0  
##  Mean   : 290.7   Mean   : 625.1   Mean   : 350.4   Mean   : 348.7  
##  3rd Qu.: 456.0   3rd Qu.: 854.5   3rd Qu.: 477.5   3rd Qu.: 445.5  
##  Max.   :1263.0   Max.   :2991.0   Max.   :1671.0   Max.   :1732.0  
##  NA's   :5        NA's   :5        NA's   :5        NA's   :5       
##  Produccion_(t)_7 Produccion_(t)_8 Produccion_(t)_9 Rendimiento(t/ha)_1
##  Min.   :   3.0   Min.   :   3.0   Min.   :   4.0   Min.   :0.1500     
##  1st Qu.:  93.5   1st Qu.:  92.0   1st Qu.: 199.5   1st Qu.:0.3400     
##  Median : 340.0   Median : 332.0   Median : 428.0   Median :0.3900     
##  Mean   : 435.3   Mean   : 431.9   Mean   : 592.3   Mean   :0.4386     
##  3rd Qu.: 660.5   3rd Qu.: 686.0   3rd Qu.: 985.5   3rd Qu.:0.5000     
##  Max.   :2020.0   Max.   :1487.0   Max.   :1544.0   Max.   :1.2500     
##  NA's   :5        NA's   :5        NA's   :6        NA's   :5          
##  Rendimiento(t/ha)_10 Rendimiento(t/ha)_11 Rendimiento(t/ha)_12
##  Min.   :0.6000       Min.   :0.480        Min.   :0.480       
##  1st Qu.:0.8025       1st Qu.:0.840        1st Qu.:0.860       
##  Median :0.9000       Median :1.120        Median :1.140       
##  Mean   :0.8935       Mean   :1.073        Mean   :1.087       
##  3rd Qu.:0.9800       3rd Qu.:1.120        3rd Qu.:1.140       
##  Max.   :1.1400       Max.   :1.820        Max.   :1.870       
##  NA's   :6            NA's   :8            NA's   :8           
##  Rendimiento(t/ha)_13 Rendimiento(t/ha)_14 Rendimiento(t/ha)_15
##  Min.   :0.28         Min.   :0.76         Min.   :0.56        
##  1st Qu.:0.28         1st Qu.:0.76         1st Qu.:0.56        
##  Median :0.28         Median :0.76         Median :0.56        
##  Mean   :0.28         Mean   :0.76         Mean   :0.56        
##  3rd Qu.:0.28         3rd Qu.:0.76         3rd Qu.:0.56        
##  Max.   :0.28         Max.   :0.76         Max.   :0.56        
##  NA's   :39           NA's   :39           NA's   :39          
##  Rendimiento(t/ha)_16 Rendimiento(t/ha)_17 Rendimiento(t/ha)_18
##  Min.   :0.56         Min.   :0.67         Min.   :0.73        
##  1st Qu.:0.56         1st Qu.:0.67         1st Qu.:0.73        
##  Median :0.56         Median :0.67         Median :0.73        
##  Mean   :0.56         Mean   :0.67         Mean   :0.73        
##  3rd Qu.:0.56         3rd Qu.:0.67         3rd Qu.:0.73        
##  Max.   :0.56         Max.   :0.67         Max.   :0.73        
##  NA's   :39           NA's   :39           NA's   :39          
##  Rendimiento(t/ha)_19 Rendimiento(t/ha)_2 Rendimiento(t/ha)_20
##  Min.   :0.96         Min.   :0.2700      Min.   :0.99        
##  1st Qu.:0.96         1st Qu.:0.3450      1st Qu.:0.99        
##  Median :0.96         Median :0.4100      Median :0.99        
##  Mean   :0.96         Mean   :0.4406      Mean   :0.99        
##  3rd Qu.:0.96         3rd Qu.:0.5250      3rd Qu.:0.99        
##  Max.   :0.96         Max.   :0.7300      Max.   :0.99        
##  NA's   :39           NA's   :5           NA's   :39          
##  Rendimiento(t/ha)_21 Rendimiento(t/ha)_22 Rendimiento(t/ha)_3
##  Min.   :1.12         Min.   :1.14         Min.   :0.1100     
##  1st Qu.:1.12         1st Qu.:1.14         1st Qu.:0.1950     
##  Median :1.12         Median :1.14         Median :0.2700     
##  Mean   :1.12         Mean   :1.14         Mean   :0.2877     
##  3rd Qu.:1.12         3rd Qu.:1.14         3rd Qu.:0.3550     
##  Max.   :1.12         Max.   :1.14         Max.   :0.5200     
##  NA's   :39           NA's   :39           NA's   :5          
##  Rendimiento(t/ha)_4 Rendimiento(t/ha)_5 Rendimiento(t/ha)_6
##  Min.   :0.270       Min.   :0.2200      Min.   :0.2200     
##  1st Qu.:0.490       1st Qu.:0.4100      1st Qu.:0.4200     
##  Median :0.580       Median :0.5100      Median :0.5100     
##  Mean   :0.628       Mean   :0.5266      Mean   :0.5471     
##  3rd Qu.:0.785       3rd Qu.:0.6450      3rd Qu.:0.6750     
##  Max.   :1.150       Max.   :0.9500      Max.   :1.0000     
##  NA's   :5           NA's   :5           NA's   :5          
##  Rendimiento(t/ha)_7 Rendimiento(t/ha)_8 Rendimiento(t/ha)_9     YEAR_1    
##  Min.   :0.3600      Min.   :0.3900      Min.   :0.5800      Min.   :2007  
##  1st Qu.:0.4850      1st Qu.:0.5250      1st Qu.:0.7725      1st Qu.:2007  
##  Median :0.5300      Median :0.5800      Median :0.8700      Median :2007  
##  Mean   :0.6109      Mean   :0.6554      Mean   :0.8662      Mean   :2007  
##  3rd Qu.:0.6600      3rd Qu.:0.7150      3rd Qu.:0.9500      3rd Qu.:2007  
##  Max.   :1.4300      Max.   :1.4700      Max.   :1.1200      Max.   :2011  
##  NA's   :5           NA's   :5           NA's   :6           NA's   :4     
##     YEAR_10        YEAR_11        YEAR_12        YEAR_13        YEAR_14    
##  Min.   :2016   Min.   :2007   Min.   :2008   Min.   :2009   Min.   :2010  
##  1st Qu.:2016   1st Qu.:2017   1st Qu.:2018   1st Qu.:2009   1st Qu.:2010  
##  Median :2016   Median :2017   Median :2018   Median :2009   Median :2010  
##  Mean   :2016   Mean   :2017   Mean   :2018   Mean   :2009   Mean   :2010  
##  3rd Qu.:2016   3rd Qu.:2017   3rd Qu.:2018   3rd Qu.:2009   3rd Qu.:2010  
##  Max.   :2018   Max.   :2017   Max.   :2018   Max.   :2009   Max.   :2010  
##  NA's   :6      NA's   :8      NA's   :8      NA's   :39     NA's   :39    
##     YEAR_15        YEAR_16        YEAR_17        YEAR_18        YEAR_19    
##  Min.   :2011   Min.   :2012   Min.   :2013   Min.   :2014   Min.   :2015  
##  1st Qu.:2011   1st Qu.:2012   1st Qu.:2013   1st Qu.:2014   1st Qu.:2015  
##  Median :2011   Median :2012   Median :2013   Median :2014   Median :2015  
##  Mean   :2011   Mean   :2012   Mean   :2013   Mean   :2014   Mean   :2015  
##  3rd Qu.:2011   3rd Qu.:2012   3rd Qu.:2013   3rd Qu.:2014   3rd Qu.:2015  
##  Max.   :2011   Max.   :2012   Max.   :2013   Max.   :2014   Max.   :2015  
##  NA's   :39     NA's   :39     NA's   :39     NA's   :39     NA's   :39    
##      YEAR_2        YEAR_20        YEAR_21        YEAR_22         YEAR_3    
##  Min.   :2008   Min.   :2016   Min.   :2017   Min.   :2018   Min.   :2009  
##  1st Qu.:2008   1st Qu.:2016   1st Qu.:2017   1st Qu.:2018   1st Qu.:2009  
##  Median :2008   Median :2016   Median :2017   Median :2018   Median :2009  
##  Mean   :2008   Mean   :2016   Mean   :2017   Mean   :2018   Mean   :2009  
##  3rd Qu.:2008   3rd Qu.:2016   3rd Qu.:2017   3rd Qu.:2018   3rd Qu.:2009  
##  Max.   :2012   Max.   :2016   Max.   :2017   Max.   :2018   Max.   :2013  
##  NA's   :4      NA's   :39     NA's   :39     NA's   :39     NA's   :5     
##      YEAR_4         YEAR_5         YEAR_6         YEAR_7         YEAR_8    
##  Min.   :2010   Min.   :2011   Min.   :2012   Min.   :2013   Min.   :2014  
##  1st Qu.:2010   1st Qu.:2011   1st Qu.:2012   1st Qu.:2013   1st Qu.:2014  
##  Median :2010   Median :2011   Median :2012   Median :2013   Median :2014  
##  Mean   :2010   Mean   :2011   Mean   :2012   Mean   :2013   Mean   :2014  
##  3rd Qu.:2010   3rd Qu.:2011   3rd Qu.:2012   3rd Qu.:2013   3rd Qu.:2014  
##  Max.   :2014   Max.   :2015   Max.   :2016   Max.   :2017   Max.   :2018  
##  NA's   :5      NA's   :5      NA's   :5      NA's   :5      NA's   :5     
##      YEAR_9              geometry 
##  Min.   :2015   MULTIPOLYGON :40  
##  1st Qu.:2015   epsg:4326    : 0  
##  Median :2015   +proj=long...: 0  
##  Mean   :2015                     
##  3rd Qu.:2015                     
##  Max.   :2017                     
##  NA's   :6

5. Trazado de gráficas

library(RColorBrewer)
library(leaflet)

Se van a trazar los municipios con su producción de CAFE ya que es uno de los cultivos con mayor área sembrada en el departamento; correspondiente para un solo año:

bins <- c(0, 200, 400, 600, 800, 1000, 1500, 2000)
pal <- colorBin("YlOrRd", domain = ant_munic_stat$`Produccion_(t)_12`, bins = bins)

mapa <- leaflet(data = ant_munic_stat) %>%
 addTiles() %>%
  addPolygons(label = ~`Produccion_(t)_12`,
              popup = ~MPIO_CNMBR,
              fillColor = ~pal(`Produccion_(t)_12`),
              color = "#444444",
              weight = 1,
              smoothFactor = 0.5,
              opacity = 1.0,
              fillOpacity = 0.5,
              highlightOptions = highlightOptions(color = "white", weight = 2, bringToFront = TRUE )
  ) %>%
  addProviderTiles(providers$OpenStreetMap) %>%
   addLegend("bottomright", pal = pal, values = ~`Produccion_(t)_12`,
          title = "Producción de café en Norte de Santander [Ton] (2018)", 
            opacity = 1)
mapa

Se concluye que el municipio con mayor producción de CAFE es LOURDES, con 1717 toneladas en el año 2018, seguido de TOLEDO con 1707 toneladas.

sessionInfo()
## R version 3.6.3 (2020-02-29)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 18363)
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=Spanish_Colombia.1252  LC_CTYPE=Spanish_Colombia.1252   
## [3] LC_MONETARY=Spanish_Colombia.1252 LC_NUMERIC=C                     
## [5] LC_TIME=Spanish_Colombia.1252    
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets  methods   base     
## 
## other attached packages:
##  [1] leaflet_2.0.3       RColorBrewer_1.1-2  cowplot_1.0.0      
##  [4] ggrepel_0.8.2       GSODR_2.0.1         rnaturalearth_0.1.0
##  [7] viridis_0.5.1       viridisLite_0.3.0   sf_0.8-1           
## [10] raster_3.0-12       maptools_0.9-9      rgeos_0.5-2        
## [13] sp_1.4-1            forcats_0.5.0       stringr_1.4.0      
## [16] dplyr_0.8.4         purrr_0.3.3         readr_1.3.1        
## [19] tidyr_1.0.2         tibble_2.1.3        ggplot2_3.3.0      
## [22] tidyverse_1.3.0     here_0.1           
## 
## loaded via a namespace (and not attached):
##  [1] nlme_3.1-144            fs_1.3.2                lubridate_1.7.4        
##  [4] httr_1.4.1              rprojroot_1.3-2         tools_3.6.3            
##  [7] backports_1.1.5         R6_2.4.1                KernSmooth_2.23-16     
## [10] DBI_1.1.0               colorspace_1.4-1        withr_2.1.2            
## [13] tidyselect_1.0.0        gridExtra_2.3           compiler_3.6.3         
## [16] cli_2.0.2               rvest_0.3.5             xml2_1.2.5             
## [19] labeling_0.3            scales_1.1.0            classInt_0.4-2         
## [22] digest_0.6.25           foreign_0.8-75          rmarkdown_2.1          
## [25] pkgconfig_2.0.3         htmltools_0.4.0         dbplyr_1.4.2           
## [28] fastmap_1.0.1           htmlwidgets_1.5.1       rlang_0.4.5            
## [31] readxl_1.3.1            rstudioapi_0.11         shiny_1.4.0            
## [34] generics_0.0.2          farver_2.0.3            jsonlite_1.6.1         
## [37] crosstalk_1.0.0         magrittr_1.5            Rcpp_1.0.3             
## [40] munsell_0.5.0           fansi_0.4.1             lifecycle_0.2.0        
## [43] stringi_1.4.6           yaml_2.2.1              grid_3.6.3             
## [46] promises_1.1.0          crayon_1.3.4            lattice_0.20-38        
## [49] haven_2.2.0             hms_0.5.3               knitr_1.28             
## [52] pillar_1.4.3            codetools_0.2-16        reprex_0.3.0           
## [55] glue_1.3.1              evaluate_0.14           leaflet.providers_1.9.0
## [58] data.table_1.12.8       modelr_0.1.6            vctrs_0.2.3            
## [61] httpuv_1.5.2            cellranger_1.1.0        gtable_0.3.0           
## [64] assertthat_0.2.1        xfun_0.12               mime_0.9               
## [67] xtable_1.8-4            broom_0.5.5             e1071_1.7-3            
## [70] later_1.0.0             class_7.3-15            units_0.6-5            
## [73] ellipsis_0.3.0