Ana María Montaño Hernández Abril 20/2020
Norte de Santander, es uno de los departamentos de Colombia, ubicado al noreste del país, limitando con Venezuela al oriente, al sur con Boyacá, y al occidente con Santander y Cesar. Tiene una superficie de 21658 km2 para el año 2019, y una población de 1367716 habitantes. Su capital es Cúcuta. En cuanto a su economía, la principal actividad económica del departamento es la agricultura, desarrollándose en las vertientes de las cordilleras y sobresaliendo cultivos como el café, maíz, arroz, yuca, caña de azúcar, cacao, trigo, plátano y palma africana. Su economía, también se complementa con el explotación petrolera en la zona del Tibú. Por lo tanto, en este cuaderno de R se ilustran las Estadísticas Agrícolas para Norte de Santander, en Colombia.
Cuando se desea comprender lo que está sucediendo en un territorio, es esencial la exploración de estadísticas no espaciales. Para ello, existen librerías de R útiles para explorar y resumir estadísticas, como dplyr y tidyverse. Por otro lado, las operaciones geoespaciales pueden mejorar la comprensión de problemas que afectan las regiones geográficas. Por ejemplo, si se desea averiguar cuál es la ubicación de aquellos municipios cuyos rendimientos de cosecha son sobresalientes (o, más bajos que el promedio), es necesario unir datos no espaciales con datos espaciales para la exploración. Esto ya se realizó usando QGIS, ahora se realizará usando R. Además, también se pueden explorar uniones espaciales. Estas operaciones se basan en la intersección entre dos objetos espaciales, a menudo puntos y polígonos. Existen varias formas en que podemos unir objetos, que pueden incluir opciones específicas como cruces, cerca, dentro, toques, etc.
rm(list = ls())
Ahora, se instalan las librerías que se necesitan (here, tidyverse, rgeos, maptools, raster, sf, viridis, rnaturalearth, GSODR, ggrepel y cowplot) Luego, se cargan todas las librerías anteriores.
warning= FALSE
library(here)
## here() starts at C:/Users/user/Documents/Intro_to_R
library(tidyverse)
## -- Attaching packages ------------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.0 v purrr 0.3.3
## v tibble 2.1.3 v dplyr 0.8.4
## v tidyr 1.0.2 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.5.0
## -- Conflicts --------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(rgeos)
## Loading required package: sp
## rgeos version: 0.5-2, (SVN revision 621)
## GEOS runtime version: 3.6.1-CAPI-1.10.1
## Linking to sp version: 1.4-1
## Polygon checking: TRUE
library(maptools)
## Checking rgeos availability: TRUE
library(raster)
##
## Attaching package: 'raster'
## The following object is masked from 'package:dplyr':
##
## select
## The following object is masked from 'package:tidyr':
##
## extract
library(sf)
## Linking to GEOS 3.6.1, GDAL 2.2.3, PROJ 4.9.3
library(viridis)
## Loading required package: viridisLite
library(rnaturalearth)
library(GSODR)
library(ggrepel)
library(cowplot)
##
## ********************************************************
## Note: As of version 1.0.0, cowplot does not change the
## default ggplot2 theme anymore. To recover the previous
## behavior, execute:
## theme_set(theme_cowplot())
## ********************************************************
Previamente, se descargaron los datos estadísticos en formato csv, en Estadísticas Municipales Agropecuarias. Luego, en Excel se eliminaron las filas de los municipios de departamentos diferentes a Norte de Santander, y se guardó este archivo con el nombre EVA_NORTEDESANTANDER.csv. Ahora, se va a leer el archivo csv.
datos <- read_csv2("C:/Users/user/Documents/Norte de Santander/EVA2_NORTEDESANTANDER.csv")
## Using ',' as decimal and '.' as grouping mark. Use read_delim() for more control.
## Parsed with column specification:
## cols(
## COD_DEP = col_double(),
## DEPARTAMENTO = col_character(),
## COD_MUN = col_double(),
## MUNICIPIO = col_character(),
## GRUPO = col_character(),
## SUBGRUPO = col_character(),
## CULTIVO = col_character(),
## YEAR = col_number(),
## `Area_Sembrada(ha)` = col_number(),
## `Area_Cosecha(ha)` = col_number(),
## `Produccion_(t)` = col_number(),
## `Rendimiento(t/ha)` = col_double(),
## ESTADO = col_character(),
## NOMBRE = col_character(),
## CICLO = col_character()
## )
head(datos)
tail(datos)
Ahora, se usa la librería dplyr para explorar el contenido del objeto datos. Primero, se obtiene un resumen del rendimiento (es decir, el rendimiento promedio durante varios años) por grupo y municipio.
datos %>%
group_by(MUNICIPIO, GRUPO) %>%
summarise(rend_prom = mean(`Rendimiento(t/ha)`, na.rm = TRUE)) -> rend_resumen
head(rend_resumen)
También, se puede calcular el rendimiento promedio por GRUPO en los municipios de Norte de Santander:
datos %>%
group_by(GRUPO) %>%
summarise(rend_dep = mean(`Rendimiento(t/ha)`, na.rm = TRUE)) -> rend_nortedesantander
rend_nortedesantander
Con la tabla anterior se puede observar que los rendimientos más altos corresponden a HORTALIZAS, FRUTALES Y TUBERCULOS Y PLATANOS. Luego, se pueden ver cuáles son los municipios con mayor rendimiento para cada grupo de cultivos en el año 2018.
datos %>%
filter(YEAR==2018) %>%
group_by(GRUPO, MUNICIPIO) %>%
summarize(max_rend = max(`Rendimiento(t/ha)`, na.rm = TRUE)) %>%
slice(which.max(max_rend)) -> rend_max_18
rend_max_18
En seguida, se van a observar cuáles son los municipios con mayor área cosechada para cada grupo de cultivos en el año 2018:
datos %>%
filter(YEAR==2018) %>%
group_by(GRUPO,MUNICIPIO) %>%
summarize(max_area_cosecha = max(`Area_Cosecha(ha)`, na.rm = TRUE)) %>%
slice(which.max(max_area_cosecha)) -> area_cosecha_max
area_cosecha_max
Hay que tener en cuenta que el área más grande cosechada en el año 2018 correspondió al GRUPO OLEAGINOSAS en el municipio de TIBU. Cabe mencionar, que la economía de TIBU depende principalmente de la explotación petrolera, pero además de esto, cuenta con grandes hectáreas de cultivos de cacao, yuca, maíz y palma de aceite, esta última se encuentra en constante aumento. Dicho lo anterior, se va a seleccionar la producción de palma de aceite (toneladas) en TIBU para cada año:
datos %>%
filter(MUNICIPIO== "TIBU" & SUBGRUPO== "PALMA DE ACEITE") %>%
group_by(YEAR, CULTIVO) -> tibu_palmadeaceite
tibu_palmadeaceite
Se va a realizar una exploración gráfica básica y para esto se va a usar la librería ggplot2:
g <- ggplot(aes(x=YEAR, y= `Produccion_(t)`/1000), data = tibu_palmadeaceite) + geom_bar(stat = "identity") + labs(y= "Producción de palma de aceite [Ton x 1000]")
g + ggtitle("Evolución de la producción de palma de aceite en Tibu desde 2007 hasta 2018") + labs(caption = "Basado en datos de EMA (DANE, 2018)")
En esta gráfica se puede observar que la producción de palma de aceite en el municipio de Tibú ha estado en constante aumento hasta el año 2018. Además, según el palmicultor Roque Julio Gómez (2015), el crecimiento en el área sembrada y por tanto, en la producción, se debe a que la palma es un cultivo alternativo en Tibú debido a la construcción de la planta procesadora de palma en este municipio. También, según la revista LA OPINIÓN, este comportamiento de aumento se debe al apoyo del Gobierno Nacional y la llegada de recursos internacionales.
Ahora, se va a investigar qué cultivos tuvieron la mayor área cosechada en 2018:
datos %>%
filter(YEAR== 2018) %>%
group_by(GRUPO) %>%
summarize(sum_area_cosecha = sum(`Area_Cosecha(ha)`, na.rm = TRUE)) %>%
arrange(desc(sum_area_cosecha)) -> total_area_cosecha
total_area_cosecha
También, es posible ver que el grupo de cultivos OTROS PERMANENTES tuvo la mayor parte del área cosechada en 2018 para Norte de Santander. Pero, ¿Qué cultivos pertenecen a este GRUPO? Si se desea, se puede buscar más información en DANE, la agencia gubernamental a cargo de las estadísticas nacionales en Colombia. Además, se puede buscar esta información en los mismos datos que ya se tienen:
datos %>%
filter(GRUPO== "OTROS PERMANENTES" & YEAR== 2018) %>%
group_by(CULTIVO) %>%
summarize(sum_cosecha = sum(`Area_Cosecha(ha)`, na.rm = TRUE)) %>%
arrange(desc(sum_cosecha)) -> total_cosecha
total_cosecha
De los cultivos pertenecientes al grupo OTRO PERMANENTES, se pudo observar que el café tiene gran importancia en la agricultura de Norte de Santander, debido a su alta área de cosecha. En seguida, se van a observar cuáles son los municipios con mayor área cosechada para cada cultivo permanente en 2018:
datos %>%
filter(YEAR== 2018 & GRUPO=="OTROS PERMANENTES") %>%
group_by(CULTIVO, MUNICIPIO) %>%
summarize(max_area2 = max(`Area_Cosecha(ha)`, na.rm = TRUE)) %>%
slice(which.max(max_area2)) -> area_cosecha2
area_cosecha2
Se vuelve a los datos de cultivos permanentes. Antes de trazar la gráfica, se necesita agregar al objeto total_area_cosecha, un nuevo campo con abreviaturas para cada GRUPO de cultivos, de modo que la gráfica se verá ordenada.
total_area_cosecha$Cultivo <- abbreviate(total_area_cosecha$GRUPO, 3)
Ahora, se traza la gráfica y se va a usar la librería ggplot2:
g <- ggplot(aes(x= Cultivo, y= sum_area_cosecha), data = total_area_cosecha) + geom_bar(stat = "identity") + labs(y= "Área total cosechada [ha]")
g + ggtitle("Área total cosechada por grupos de cultivo en 2018 para Norte de Santander") + theme(plot.title = element_text(hjust = 0.5)) + labs(caption = "Basado en datos de EMA (DANE, 2018) ")
A continuación, se observa el comportamiento en la producción de los cultivos de arroz y yuca en el municipio de Cúcuta, ya que son cultivos de gran importancia economica.
datos %>%
filter(MUNICIPIO== "CUCUTA" & SUBGRUPO== "ARROZ") %>%
group_by(YEAR, CULTIVO) -> CUCUTA_arroz
CUCUTA_arroz
g <- ggplot(aes(x=YEAR, y= `Produccion_(t)`/1000), data = CUCUTA_arroz) + geom_bar(stat = "identity") + labs(y= "Producción de arroz [Ton x 1000]")
g + ggtitle("Evolución de la producción de arroz en Cúcuta desde 2007 hasta 2018") + labs(caption = "Basado en datos de EMA (DANE, 2018)")
Con la gráfica anterior se puede observar que la producción de arroz en la capital, ha sido variable a lo largo de estos años. Según EL TIEMPO, 2012, el cultivo de arroz ha estado siendo vigilado y controlado por el ICA, ya que la producción se ha visto afectada por el virus de la hoja blanca, que es el principal problema fitosanitario que actualemnte afecta estos cultivos. Es necesario tomar medidas para controlar este virus, ya que esto afecta directamente la economía del municipio y a su vez a miles de productores. Cabe mencionar que Cúcuta y El Zulia, donde se concentra el 76% del área sembrada, son las zonas más afectadas con la presencia de enfermedades como Rhizoctonia solani, Helminthosporium en la hoja y Manchado del grano.
Ahora, se observa el comportamiento de la yuca en este mismo municipio:
datos %>%
filter(MUNICIPIO== "CUCUTA" & SUBGRUPO== "YUCA") %>%
group_by(YEAR, CULTIVO) -> CUCUTA_yuca
CUCUTA_yuca
g <- ggplot(aes(x=YEAR, y= `Produccion_(t)`/1000), data = CUCUTA_yuca) + geom_bar(stat = "identity") + labs(y= "Producción de yuca [Ton x 1000]")
g + ggtitle("Evolución de la producción de yuca en Cúcuta desde 2007 hasta 2018") + labs(caption = "Basado en datos de EMA (DANE, 2018)")
Por el contrario, la gráfica anterior muestra que la producción de yuca se encuentra en declive, siendo muy baja para el año 2018, en comparación al año 2007. Puede deberse a que la yuca esta siendo sustituida por otros cultivos que se adaptan mejor a los suelos y condiciones de la zona.
Para realizar la unión (join),es buena idea usar el shapefile correspondiente al Marco Geoestadístico Departamental que está disponible en el Geoportal del DANE; para este caso el que corresponde a Norte de Santander. Primero, se empieza leyendo los datos usando la librería sf
ant_munic <- sf:: st_read("C:/Users/user/Documents/Norte de Santander/54_NORTE DE SANTANDER/ADMINISTRATIVO/MGN_MPIO_POLITICO.shp")
## Reading layer `MGN_MPIO_POLITICO' from data source `C:\Users\user\Documents\Norte de Santander\54_NORTE DE SANTANDER\ADMINISTRATIVO\MGN_MPIO_POLITICO.shp' using driver `ESRI Shapefile'
## Simple feature collection with 40 features and 9 fields
## geometry type: MULTIPOLYGON
## dimension: XY
## bbox: xmin: -73.63379 ymin: 6.872201 xmax: -72.04761 ymax: 9.290847
## epsg (SRID): 4326
## proj4string: +proj=longlat +datum=WGS84 +no_defs
Pero, ¿Qué es ant_munic?
ant_munic
Tenga en cuenta, que ant_munic es una colección de características simples. Una característica simple se refiere a un estándar formal (ISO 19125-1:2004) que describe cómo los objetos de la vida real pueden ser representados en el computador, haciendo énfasis en la geometría espacial de estos objetos. También, describe cómo estos objetos se pueden almacenar y recuperarse de bases de datos. Además, muestra las operaciones geométricas que se pueden definir para estos objetos. R ha carecido de una implementación completa de características simples, haciendo que las conversiones a veces sean complicadas, pero el paquete sf intenta suplir estas deficiencias a largo plazo.
También, hay que mencionar que estos datos utilizan el sistema de referencia de coordenadas geográficas WGS1984 (Código EPSG: 4326) Se puede usar la función left_join para unir los municipios y las estadísticas agrícolas seleccionadas. Ahora, para ver cuál es la función de left_join se escirbe en la consola de R el código: ?left_join y en la parte de ayudas se obtiene:
left_join: Función genérica que sirve para unir dos fuentes de datos (x, y).X y Y, generalmente deben ser del mismo origen de datos, pero si la copia es VERDADERA, y se copiará automáticamente en el mismo origen que x.
Se va a verificar lo anterior:
datos %>% filter(MUNICIPIO=="CUCUTA") -> med_datos
med_datos
class(med_datos$COD_MUN)
## [1] "numeric"
datos2 <- datos
datos2$TEMP <- as.character(datos2$COD_MUN)
datos2$MPIO_CCDGO <- as.factor(datos2$TEMP)
head(datos2)
Hay que asegurarse de verificar, en el objetos datos 2, las características del nuevo atributo MPIO_CCDGO. Luego, se va a filtrar un solo año y a seleccionar solo dos atributos relevantes:
datos2 %>% filter(CULTIVO =="CAFE") -> datos3
head(datos3)
tail(datos3)
class(datos3)
## [1] "spec_tbl_df" "tbl_df" "tbl" "data.frame"
datos4 <- datos3 %>% dplyr::select(MUNICIPIO, MPIO_CCDGO, YEAR, `Produccion_(t)`, `Rendimiento(t/ha)`)
datos4
datos4 %>%
gather("YEAR", "Produccion_(t)", "Rendimiento(t/ha)" , key = variable, value = number)
head(datos4)
A continuación, viene una tarea clave. Implica varios pasos para poder convertir la tabla de atributos de formato largo a formato ancho.
datos4 %>%
group_by(MPIO_CCDGO) %>%
mutate(Visit = 1:n()) %>%
gather("YEAR", "Produccion_(t)", "Rendimiento(t/ha)" , key = variable, value = number) %>%
unite(combi, variable, Visit) %>%
spread(combi, number) -> datos5
head(datos5)
tail(datos5)
También se hará una copia de la colección de características simples, para evitar daños en la original:
ant_munic2 <- ant_munic
ant_munic_stat = left_join(ant_munic2, datos5, by= "MPIO_CCDGO")
summary(ant_munic_stat)
## DPTO_CCDGO MPIO_CCDGO MPIO_CNMBR MPIO_CRSLC MPIO_NAREA
## 54:40 54001 : 1 ABREGO : 1 1911 : 2 Min. : 44.95
## 54003 : 1 ARBOLEDAS : 1 1930 : 2 1st Qu.: 164.39
## 54051 : 1 BOCHALEMA : 1 1555 : 1 Median : 345.88
## 54099 : 1 BUCARASICA: 1 1570 : 1 Mean : 546.41
## 54109 : 1 CÁCHIRA : 1 1580 : 1 3rd Qu.: 678.45
## 54125 : 1 CÁCOTA : 1 1583 : 1 Max. :2680.08
## (Other):34 (Other) :34 (Other):32
## MPIO_NANO DPTO_CNMBR Shape_Leng Shape_Area
## Min. :2017 NORTE DE SANTANDER:40 Min. :0.4550 Min. :0.003686
## 1st Qu.:2017 1st Qu.:0.6974 1st Qu.:0.013460
## Median :2017 Median :1.0266 Median :0.028313
## Mean :2017 Mean :1.3434 Mean :0.044807
## 3rd Qu.:2017 3rd Qu.:1.7969 3rd Qu.:0.055629
## Max. :2017 Max. :4.0863 Max. :0.220099
##
## MUNICIPIO Produccion_(t)_1 Produccion_(t)_10 Produccion_(t)_11
## Length:40 Min. : 0.00 Min. : 2.0 Min. : 31.0
## Class :character 1st Qu.: 59.25 1st Qu.: 209.5 1st Qu.: 209.5
## Mode :character Median : 287.00 Median : 413.0 Median : 659.0
## Mean : 378.00 Mean : 573.7 Mean : 722.8
## 3rd Qu.: 560.50 3rd Qu.: 925.0 3rd Qu.:1128.2
## Max. :1695.00 Max. :1341.0 Max. :1668.0
## NA's :4 NA's :6 NA's :8
## Produccion_(t)_12 Produccion_(t)_13 Produccion_(t)_14 Produccion_(t)_15
## Min. : 30.0 Min. :45 Min. :110 Min. :61
## 1st Qu.: 213.5 1st Qu.:45 1st Qu.:110 1st Qu.:61
## Median : 662.0 Median :45 Median :110 Median :61
## Mean : 724.2 Mean :45 Mean :110 Mean :61
## 3rd Qu.:1105.0 3rd Qu.:45 3rd Qu.:110 3rd Qu.:61
## Max. :1717.0 Max. :45 Max. :110 Max. :61
## NA's :8 NA's :39 NA's :39 NA's :39
## Produccion_(t)_16 Produccion_(t)_17 Produccion_(t)_18 Produccion_(t)_19
## Min. :66 Min. :105 Min. :123 Min. :149
## 1st Qu.:66 1st Qu.:105 1st Qu.:123 1st Qu.:149
## Median :66 Median :105 Median :123 Median :149
## Mean :66 Mean :105 Mean :123 Mean :149
## 3rd Qu.:66 3rd Qu.:105 3rd Qu.:123 3rd Qu.:149
## Max. :66 Max. :105 Max. :123 Max. :149
## NA's :39 NA's :39 NA's :39 NA's :39
## Produccion_(t)_2 Produccion_(t)_20 Produccion_(t)_21 Produccion_(t)_22
## Min. : 0.00 Min. :112 Min. :100 Min. :96
## 1st Qu.: 63.75 1st Qu.:112 1st Qu.:100 1st Qu.:96
## Median : 287.00 Median :112 Median :100 Median :96
## Mean : 380.53 Mean :112 Mean :100 Mean :96
## 3rd Qu.: 560.50 3rd Qu.:112 3rd Qu.:100 3rd Qu.:96
## Max. :1695.00 Max. :112 Max. :100 Max. :96
## NA's :4 NA's :39 NA's :39 NA's :39
## Produccion_(t)_3 Produccion_(t)_4 Produccion_(t)_5 Produccion_(t)_6
## Min. : 2.0 Min. : 0.0 Min. : 1.0 Min. : 1.0
## 1st Qu.: 54.0 1st Qu.: 114.0 1st Qu.: 64.0 1st Qu.: 57.5
## Median : 194.0 Median : 468.0 Median : 262.0 Median : 275.0
## Mean : 290.7 Mean : 625.1 Mean : 350.4 Mean : 348.7
## 3rd Qu.: 456.0 3rd Qu.: 854.5 3rd Qu.: 477.5 3rd Qu.: 445.5
## Max. :1263.0 Max. :2991.0 Max. :1671.0 Max. :1732.0
## NA's :5 NA's :5 NA's :5 NA's :5
## Produccion_(t)_7 Produccion_(t)_8 Produccion_(t)_9 Rendimiento(t/ha)_1
## Min. : 3.0 Min. : 3.0 Min. : 4.0 Min. :0.1500
## 1st Qu.: 93.5 1st Qu.: 92.0 1st Qu.: 199.5 1st Qu.:0.3400
## Median : 340.0 Median : 332.0 Median : 428.0 Median :0.3900
## Mean : 435.3 Mean : 431.9 Mean : 592.3 Mean :0.4386
## 3rd Qu.: 660.5 3rd Qu.: 686.0 3rd Qu.: 985.5 3rd Qu.:0.5000
## Max. :2020.0 Max. :1487.0 Max. :1544.0 Max. :1.2500
## NA's :5 NA's :5 NA's :6 NA's :5
## Rendimiento(t/ha)_10 Rendimiento(t/ha)_11 Rendimiento(t/ha)_12
## Min. :0.6000 Min. :0.480 Min. :0.480
## 1st Qu.:0.8025 1st Qu.:0.840 1st Qu.:0.860
## Median :0.9000 Median :1.120 Median :1.140
## Mean :0.8935 Mean :1.073 Mean :1.087
## 3rd Qu.:0.9800 3rd Qu.:1.120 3rd Qu.:1.140
## Max. :1.1400 Max. :1.820 Max. :1.870
## NA's :6 NA's :8 NA's :8
## Rendimiento(t/ha)_13 Rendimiento(t/ha)_14 Rendimiento(t/ha)_15
## Min. :0.28 Min. :0.76 Min. :0.56
## 1st Qu.:0.28 1st Qu.:0.76 1st Qu.:0.56
## Median :0.28 Median :0.76 Median :0.56
## Mean :0.28 Mean :0.76 Mean :0.56
## 3rd Qu.:0.28 3rd Qu.:0.76 3rd Qu.:0.56
## Max. :0.28 Max. :0.76 Max. :0.56
## NA's :39 NA's :39 NA's :39
## Rendimiento(t/ha)_16 Rendimiento(t/ha)_17 Rendimiento(t/ha)_18
## Min. :0.56 Min. :0.67 Min. :0.73
## 1st Qu.:0.56 1st Qu.:0.67 1st Qu.:0.73
## Median :0.56 Median :0.67 Median :0.73
## Mean :0.56 Mean :0.67 Mean :0.73
## 3rd Qu.:0.56 3rd Qu.:0.67 3rd Qu.:0.73
## Max. :0.56 Max. :0.67 Max. :0.73
## NA's :39 NA's :39 NA's :39
## Rendimiento(t/ha)_19 Rendimiento(t/ha)_2 Rendimiento(t/ha)_20
## Min. :0.96 Min. :0.2700 Min. :0.99
## 1st Qu.:0.96 1st Qu.:0.3450 1st Qu.:0.99
## Median :0.96 Median :0.4100 Median :0.99
## Mean :0.96 Mean :0.4406 Mean :0.99
## 3rd Qu.:0.96 3rd Qu.:0.5250 3rd Qu.:0.99
## Max. :0.96 Max. :0.7300 Max. :0.99
## NA's :39 NA's :5 NA's :39
## Rendimiento(t/ha)_21 Rendimiento(t/ha)_22 Rendimiento(t/ha)_3
## Min. :1.12 Min. :1.14 Min. :0.1100
## 1st Qu.:1.12 1st Qu.:1.14 1st Qu.:0.1950
## Median :1.12 Median :1.14 Median :0.2700
## Mean :1.12 Mean :1.14 Mean :0.2877
## 3rd Qu.:1.12 3rd Qu.:1.14 3rd Qu.:0.3550
## Max. :1.12 Max. :1.14 Max. :0.5200
## NA's :39 NA's :39 NA's :5
## Rendimiento(t/ha)_4 Rendimiento(t/ha)_5 Rendimiento(t/ha)_6
## Min. :0.270 Min. :0.2200 Min. :0.2200
## 1st Qu.:0.490 1st Qu.:0.4100 1st Qu.:0.4200
## Median :0.580 Median :0.5100 Median :0.5100
## Mean :0.628 Mean :0.5266 Mean :0.5471
## 3rd Qu.:0.785 3rd Qu.:0.6450 3rd Qu.:0.6750
## Max. :1.150 Max. :0.9500 Max. :1.0000
## NA's :5 NA's :5 NA's :5
## Rendimiento(t/ha)_7 Rendimiento(t/ha)_8 Rendimiento(t/ha)_9 YEAR_1
## Min. :0.3600 Min. :0.3900 Min. :0.5800 Min. :2007
## 1st Qu.:0.4850 1st Qu.:0.5250 1st Qu.:0.7725 1st Qu.:2007
## Median :0.5300 Median :0.5800 Median :0.8700 Median :2007
## Mean :0.6109 Mean :0.6554 Mean :0.8662 Mean :2007
## 3rd Qu.:0.6600 3rd Qu.:0.7150 3rd Qu.:0.9500 3rd Qu.:2007
## Max. :1.4300 Max. :1.4700 Max. :1.1200 Max. :2011
## NA's :5 NA's :5 NA's :6 NA's :4
## YEAR_10 YEAR_11 YEAR_12 YEAR_13 YEAR_14
## Min. :2016 Min. :2007 Min. :2008 Min. :2009 Min. :2010
## 1st Qu.:2016 1st Qu.:2017 1st Qu.:2018 1st Qu.:2009 1st Qu.:2010
## Median :2016 Median :2017 Median :2018 Median :2009 Median :2010
## Mean :2016 Mean :2017 Mean :2018 Mean :2009 Mean :2010
## 3rd Qu.:2016 3rd Qu.:2017 3rd Qu.:2018 3rd Qu.:2009 3rd Qu.:2010
## Max. :2018 Max. :2017 Max. :2018 Max. :2009 Max. :2010
## NA's :6 NA's :8 NA's :8 NA's :39 NA's :39
## YEAR_15 YEAR_16 YEAR_17 YEAR_18 YEAR_19
## Min. :2011 Min. :2012 Min. :2013 Min. :2014 Min. :2015
## 1st Qu.:2011 1st Qu.:2012 1st Qu.:2013 1st Qu.:2014 1st Qu.:2015
## Median :2011 Median :2012 Median :2013 Median :2014 Median :2015
## Mean :2011 Mean :2012 Mean :2013 Mean :2014 Mean :2015
## 3rd Qu.:2011 3rd Qu.:2012 3rd Qu.:2013 3rd Qu.:2014 3rd Qu.:2015
## Max. :2011 Max. :2012 Max. :2013 Max. :2014 Max. :2015
## NA's :39 NA's :39 NA's :39 NA's :39 NA's :39
## YEAR_2 YEAR_20 YEAR_21 YEAR_22 YEAR_3
## Min. :2008 Min. :2016 Min. :2017 Min. :2018 Min. :2009
## 1st Qu.:2008 1st Qu.:2016 1st Qu.:2017 1st Qu.:2018 1st Qu.:2009
## Median :2008 Median :2016 Median :2017 Median :2018 Median :2009
## Mean :2008 Mean :2016 Mean :2017 Mean :2018 Mean :2009
## 3rd Qu.:2008 3rd Qu.:2016 3rd Qu.:2017 3rd Qu.:2018 3rd Qu.:2009
## Max. :2012 Max. :2016 Max. :2017 Max. :2018 Max. :2013
## NA's :4 NA's :39 NA's :39 NA's :39 NA's :5
## YEAR_4 YEAR_5 YEAR_6 YEAR_7 YEAR_8
## Min. :2010 Min. :2011 Min. :2012 Min. :2013 Min. :2014
## 1st Qu.:2010 1st Qu.:2011 1st Qu.:2012 1st Qu.:2013 1st Qu.:2014
## Median :2010 Median :2011 Median :2012 Median :2013 Median :2014
## Mean :2010 Mean :2011 Mean :2012 Mean :2013 Mean :2014
## 3rd Qu.:2010 3rd Qu.:2011 3rd Qu.:2012 3rd Qu.:2013 3rd Qu.:2014
## Max. :2014 Max. :2015 Max. :2016 Max. :2017 Max. :2018
## NA's :5 NA's :5 NA's :5 NA's :5 NA's :5
## YEAR_9 geometry
## Min. :2015 MULTIPOLYGON :40
## 1st Qu.:2015 epsg:4326 : 0
## Median :2015 +proj=long...: 0
## Mean :2015
## 3rd Qu.:2015
## Max. :2017
## NA's :6
library(RColorBrewer)
library(leaflet)
Se van a trazar los municipios con su producción de CAFE ya que es uno de los cultivos con mayor área sembrada en el departamento; correspondiente para un solo año:
bins <- c(0, 200, 400, 600, 800, 1000, 1500, 2000)
pal <- colorBin("YlOrRd", domain = ant_munic_stat$`Produccion_(t)_12`, bins = bins)
mapa <- leaflet(data = ant_munic_stat) %>%
addTiles() %>%
addPolygons(label = ~`Produccion_(t)_12`,
popup = ~MPIO_CNMBR,
fillColor = ~pal(`Produccion_(t)_12`),
color = "#444444",
weight = 1,
smoothFactor = 0.5,
opacity = 1.0,
fillOpacity = 0.5,
highlightOptions = highlightOptions(color = "white", weight = 2, bringToFront = TRUE )
) %>%
addProviderTiles(providers$OpenStreetMap) %>%
addLegend("bottomright", pal = pal, values = ~`Produccion_(t)_12`,
title = "Producción de café en Norte de Santander [Ton] (2018)",
opacity = 1)
mapa
Se concluye que el municipio con mayor producción de CAFE es LOURDES, con 1717 toneladas en el año 2018, seguido de TOLEDO con 1707 toneladas.
sessionInfo()
## R version 3.6.3 (2020-02-29)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 18363)
##
## Matrix products: default
##
## locale:
## [1] LC_COLLATE=Spanish_Colombia.1252 LC_CTYPE=Spanish_Colombia.1252
## [3] LC_MONETARY=Spanish_Colombia.1252 LC_NUMERIC=C
## [5] LC_TIME=Spanish_Colombia.1252
##
## attached base packages:
## [1] stats graphics grDevices utils datasets methods base
##
## other attached packages:
## [1] leaflet_2.0.3 RColorBrewer_1.1-2 cowplot_1.0.0
## [4] ggrepel_0.8.2 GSODR_2.0.1 rnaturalearth_0.1.0
## [7] viridis_0.5.1 viridisLite_0.3.0 sf_0.8-1
## [10] raster_3.0-12 maptools_0.9-9 rgeos_0.5-2
## [13] sp_1.4-1 forcats_0.5.0 stringr_1.4.0
## [16] dplyr_0.8.4 purrr_0.3.3 readr_1.3.1
## [19] tidyr_1.0.2 tibble_2.1.3 ggplot2_3.3.0
## [22] tidyverse_1.3.0 here_0.1
##
## loaded via a namespace (and not attached):
## [1] nlme_3.1-144 fs_1.3.2 lubridate_1.7.4
## [4] httr_1.4.1 rprojroot_1.3-2 tools_3.6.3
## [7] backports_1.1.5 R6_2.4.1 KernSmooth_2.23-16
## [10] DBI_1.1.0 colorspace_1.4-1 withr_2.1.2
## [13] tidyselect_1.0.0 gridExtra_2.3 compiler_3.6.3
## [16] cli_2.0.2 rvest_0.3.5 xml2_1.2.5
## [19] labeling_0.3 scales_1.1.0 classInt_0.4-2
## [22] digest_0.6.25 foreign_0.8-75 rmarkdown_2.1
## [25] pkgconfig_2.0.3 htmltools_0.4.0 dbplyr_1.4.2
## [28] fastmap_1.0.1 htmlwidgets_1.5.1 rlang_0.4.5
## [31] readxl_1.3.1 rstudioapi_0.11 shiny_1.4.0
## [34] generics_0.0.2 farver_2.0.3 jsonlite_1.6.1
## [37] crosstalk_1.0.0 magrittr_1.5 Rcpp_1.0.3
## [40] munsell_0.5.0 fansi_0.4.1 lifecycle_0.2.0
## [43] stringi_1.4.6 yaml_2.2.1 grid_3.6.3
## [46] promises_1.1.0 crayon_1.3.4 lattice_0.20-38
## [49] haven_2.2.0 hms_0.5.3 knitr_1.28
## [52] pillar_1.4.3 codetools_0.2-16 reprex_0.3.0
## [55] glue_1.3.1 evaluate_0.14 leaflet.providers_1.9.0
## [58] data.table_1.12.8 modelr_0.1.6 vctrs_0.2.3
## [61] httpuv_1.5.2 cellranger_1.1.0 gtable_0.3.0
## [64] assertthat_0.2.1 xfun_0.12 mime_0.9
## [67] xtable_1.8-4 broom_0.5.5 e1071_1.7-3
## [70] later_1.0.0 class_7.3-15 units_0.6-5
## [73] ellipsis_0.3.0