Las notas presentadas en este cuaderno se encuentran inspiradas en el material dictado por la Dra. Carolina Guevara, profesora e investigadora de la Escuela Politécnica Nacional, en la materia de Economía Geográfica.
Acorde a William Strange (2005), la aglomeración urbana es la concentración espacial de la actividad económica en las ciudades, y puede tomar la forma de concentración en grupos industriales o en centros de empleo en una ciudad. De hecho, acorde a Rosenthal y Strange (2020), las ciudades existen porque las empresas y los trabajadores se benefician de la concentración espacial, sea que estos beneficios vengan de las ventajas naturales de ciertas locaciones o de la diversidad o costo reducido existente en una locación.
Ahora si bien la aglomeración espacial se mide principalmente en la ramas de las ciencias sociales como la economía, también puede ser útil en otras. ¿Puedes darnos un ejemplo? Para una aplicación en R puedes revisar Spagreg.
En este sentido, la aglomeración espacial puede ser calculado a través de un índice de concentración espacial, el cual debe cumplir ciertas propiedades que veremos a continuación.
El índice de Gini es una de las formas más comunes para medir la desigualdad de ingresos. Específicamente, este índice, creado por Gini (1921) es una medida de económica que sirve para calcular la desigualdad (generalmente de ingresos) que existe entre los ciudadanos de un territorio. El valor del índice de Gini se encuentra entre 0 y 1, siendo cero la máxima igualdad (todos los ciudadanos reciben el mismo ingreso) y uno, la máxima desigualdad (un solo ciudadano recibe todo el ingreso). Formalmente:
\[G = 1-\sum_{k=1}^{n-1}{(X_{k+1}-X_k)(Y_{k+1}+Y_k)}\]
Este indicador también puede ser utilizado para medir concentración espacial con la siguiente variante:
\[G^s = 1-\sum_{n=1}^{R}\frac{1}{R}\left[\lambda_{r(n-1)}^{s}+\lambda_{r(n)}^{s}\right]\]
Donde:
\[\lambda_r^s = \frac{x_r^s}{x^s}\]
\[x^s = \sum_{r=1}^{R}x_r^s\]
En estas expresiones \(G^s\) es el índice de concentración espacial para la industria \(s\), \(x_r^s\) es el nivel de producción (o cualquier otra variable) del sector \(s\) en la región \(r\), \(R\) es el número total de regiones y \(\lambda_r^s\) representa la producción acumulada.
Veamos un ejemplo de cómo calcular este índice, para lo cual utilizaremos los datos del valor agregado bruto generado en la industria minera. Estos datos se encuentran publicados en el Banco Central del Ecuador dentro de los datos de cuentas nacionales para el año 2019.
Así, carguemos primero las librerías y datos necesarios.
library(tidyverse)
library(rio)
library(janitor)
library(ineq)
library(raster)
library(sf)
select <- dplyr::select
urlData <- "https://contenido.bce.fin.ec/documentos/Estadisticas/SectorReal/CuentasProvinciales/Can2019.xlsx"
vabCantonal <- import(urlData, sheet = "VAB CANTONAL", skip=6, col_names = T)
vabCantonal <- clean_names(vabCantonal, case = "big_camel")
vabCantonal %>% head()
## Provincia CodigoProvincia Canton CodigoCanton
## 1 AZUAY 01 Cuenca 0101
## 2 AZUAY 01 Girón 0102
## 3 AZUAY 01 Gualaceo 0103
## 4 AZUAY 01 Nabón 0104
## 5 AZUAY 01 Paute 0105
## 6 AZUAY 01 Pucará 0106
## AgriculturaGanaderiaSilviculturaYPesca ExplotacionDeMinasYCanteras
## 1 92901.6333 69016.8075
## 2 1156.8227 547.0558
## 3 3247.1864 146.1811
## 4 5462.3922 0.0000
## 5 17059.8574 1271.9488
## 6 960.6457 243.5328
## Manufactura SuministroDeElectricidadYDeAgua Construccion Comercio
## 1 902215.8441 77681.5980 835958.4638 499822.1721
## 2 413.2325 748.3246 1928.1020 1206.8836
## 3 5826.5158 2521.9962 11509.9088 7240.4787
## 4 445.7913 511.2121 1156.1756 536.1197
## 5 360.4693 1273.0672 1499.5474 5335.4366
## 6 155.2286 460.6113 617.1312 190.6662
## AlojamientoYServiciosDeComida TransporteInformacionYComunicaciones
## 1 142403.75695 372734.9497
## 2 166.08824 2846.7211
## 3 1724.34787 6354.6614
## 4 114.66497 3235.2821
## 5 1065.35237 4733.2919
## 6 95.84822 900.7397
## ActividadesFinancieras ActividadesProfesionalesEInmobiliarias
## 1 305127.2084 480667.173
## 2 320.3896 2132.897
## 3 13135.7567 10551.449
## 4 1532.8302 1182.075
## 5 7732.2505 6931.882
## 6 1255.4721 1106.544
## AdministracionPublica Ensenanza Salud OtrosServicios EconomiaTotal
## 1 499691.418 212807.297 220835.389 67250.20168 4779113.91
## 2 4131.210 4258.006 5158.619 187.50876 25201.86
## 3 10211.582 16730.150 10032.581 1332.97573 100565.77
## 4 3027.118 5231.151 0.000 309.73468 22744.55
## 5 4760.008 9891.655 7646.571 422.91676 69984.25
## 6 2930.304 3298.101 0.000 69.52587 12284.35
Ahora seleccionemos las variables de interés y realicemos limpieza:
vabCantonal <- vabCantonal %>%
select(Provincia, CodigoProvincia, Canton, CodigoCanton,
VabMineria = ExplotacionDeMinasYCanteras) %>%
filter(!is.na(CodigoCanton))
vabCantonal %>% head()
## Provincia CodigoProvincia Canton CodigoCanton VabMineria
## 1 AZUAY 01 Cuenca 0101 69016.8075
## 2 AZUAY 01 Girón 0102 547.0558
## 3 AZUAY 01 Gualaceo 0103 146.1811
## 4 AZUAY 01 Nabón 0104 0.0000
## 5 AZUAY 01 Paute 0105 1271.9488
## 6 AZUAY 01 Pucará 0106 243.5328
Ahora calcularemos el índice de Gini de concentración espacial en esta industria:
gini_vabCantonal = vabCantonal %>%
arrange(VabMineria) %>%
mutate(lambda = cumsum(VabMineria)/sum(VabMineria)) %>%
mutate(lambda_sum = (lag(lambda)+lambda)*1/nrow(.))
gini_vabCantonal %>% head()
## Provincia CodigoProvincia Canton CodigoCanton VabMineria lambda
## 1 AZUAY 01 Nabón 0104 0 0
## 2 AZUAY 01 San Fernando 0107 0 0
## 3 AZUAY 01 Sigsig 0109 0 0
## 4 AZUAY 01 Oña 0110 0 0
## 5 AZUAY 01 El Pan 0112 0 0
## 6 AZUAY 01 Sevilla De Oro 0113 0 0
## lambda_sum
## 1 NA
## 2 0
## 3 0
## 4 0
## 5 0
## 6 0
gini_vabCantonal %>%
summarise(G = 1-sum(lambda_sum, na.rm = T))
## G
## 1 0.9769369
ineq(vabCantonal$VabMineria, type = "Gini")
## [1] 0.9769369
Como podemos notar, el índice de Gini es casi 1, indicando alta concentración espacial de esta actividad económica. Veámoslo de manera con la curva de Lorenz.
gini_vabCantonal %>%
ggplot(aes(x=cumsum(rep(1/nrow(.), nrow(.))), y=lambda_sum))+
geom_point()+
geom_line()+
labs(title="Curva de Lorenz para la distribución espacial de la actividad minera",
x = "1/N",
y = "Proporción acumulada de VAB")
## Warning: Removed 1 rows containing missing values (geom_point).
## Warning: Removed 1 row(s) containing missing values (geom_path).
Para notarlo de mejor manera, veamos la proporción de producción en cada cantón. Esto lo podemos hacer como se ve a continuación:
ec_cantones <- getData("GADM", country="ECU", level=2)
# Corregimos parroquias repetidas
ec_cantones <- ec_cantones[!(ec_cantones$NAME_2=="Saquisili" & ec_cantones$CC_2=="0506") &
!is.na(ec_cantones$NAME_2) & !is.na(ec_cantones$CC_2),]
ec_cantones$CC2 <- ifelse(ec_cantones$NAME_2=="Mejía" & ec_cantones$CC_2=="1602","1605",ec_cantones$CC_2)
Como se puede notar, hemos descargado los datos geográficos de los cantones del Ecuador a través de la función getData, disponible en la librería raster. Evidentemente Ecuador no es el único país cuyos datos están disponibles.
Ahora que tenemos los datos listos, añadiremos el valor agregado bruto y la proporción que genera cada cantón a este dataset, a través del código del cantón (CC_2) para verlo gráficamente.
ec_cantones <- merge(ec_cantones, vabCantonal %>% select(CodigoCanton, VabMineria),
by.x=c("CC_2"), by.y="CodigoCanton")
ec_cantones@data %>% head()
## CC_2 GID_0 NAME_0 GID_1 NAME_1 NL_NAME_1 GID_2 NAME_2
## 15 0115 ECU Ecuador ECU.1_1 Azuay <NA> ECU.1.1_1 Camilo Ponce Enriquez
## 11 0111 ECU Ecuador ECU.1_1 Azuay <NA> ECU.1.2_1 Chordeleg
## 1 0101 ECU Ecuador ECU.1_1 Azuay <NA> ECU.1.3_1 Cuenca
## 12 0112 ECU Ecuador ECU.1_1 Azuay <NA> ECU.1.4_1 El Pan
## 2 0102 ECU Ecuador ECU.1_1 Azuay <NA> ECU.1.5_1 Girón
## 14 0114 ECU Ecuador ECU.1_1 Azuay <NA> ECU.1.6_1 Guachapala
## VARNAME_2 NL_NAME_2 TYPE_2 ENGTYPE_2 HASC_2 CC2 VabMineria
## 15 <NA> <NA> Canton Canton <NA> 0115 9460.2653
## 11 <NA> <NA> Canton Canton EC.AZ.CH 0111 540.0703
## 1 <NA> <NA> Canton Canton EC.AZ.CU 0101 69016.8075
## 12 <NA> <NA> Canton Canton EC.AZ.EP 0112 0.0000
## 2 <NA> <NA> Canton Canton EC.AZ.GR 0102 547.0558
## 14 <NA> <NA> Canton Canton EC.LJ.GO 0114 0.0000
Una vez unidos los datos, realizamos la visualización:
ec_cantones %>%
st_as_sf() %>%
mutate(ProporcionMineria = VabMineria/sum(VabMineria, na.rm=T)) %>%
ggplot()+
geom_sf(aes(fill=ProporcionMineria))+
scale_fill_gradientn(colors = rev(terrain.colors(5)))
En esta gráfica podemos notar que toda la producción minera se concentra en un solo cantón. Es más, se concentra en una sola región (amazónica). ¿Qué pasa si calculamos el índice de concentración únicamente para esta región? (queda como ejercicio para el lector).
¿Has entendido todos los conceptos? No dudes en hacer preguntas. ¡Nos vemos en una próxima ocasión!