1. Introducción

Las notas presentadas en este cuaderno se encuentran inspiradas en el material dictado por la Dra. Carolina Guevara, profesora e investigadora de la Escuela Politécnica Nacional, en la materia de Economía Geográfica.

Acorde a William Strange (2005), la aglomeración urbana es la concentración espacial de la actividad económica en las ciudades, y puede tomar la forma de concentración en grupos industriales o en centros de empleo en una ciudad. De hecho, acorde a Rosenthal y Strange (2020), las ciudades existen porque las empresas y los trabajadores se benefician de la concentración espacial, sea que estos beneficios vengan de las ventajas naturales de ciertas locaciones o de la diversidad o costo reducido existente en una locación.

Ahora si bien la aglomeración espacial se mide principalmente en la ramas de las ciencias sociales como la economía, también puede ser útil en otras. ¿Puedes darnos un ejemplo? Para una aplicación en R puedes revisar Spagreg.

En este sentido, la aglomeración espacial puede ser calculado a través de un índice de concentración espacial, el cual debe cumplir ciertas propiedades que veremos a continuación.

2. Propiedades de un índice ideal de concentración espacial

3. El índice de Gini como índice de concentración espacial

El índice de Gini es una de las formas más comunes para medir la desigualdad de ingresos. Específicamente, este índice, creado por Gini (1921) es una medida de económica que sirve para calcular la desigualdad (generalmente de ingresos) que existe entre los ciudadanos de un territorio. El valor del índice de Gini se encuentra entre 0 y 1, siendo cero la máxima igualdad (todos los ciudadanos reciben el mismo ingreso) y uno, la máxima desigualdad (un solo ciudadano recibe todo el ingreso). Formalmente:

\[G = 1-\sum_{k=1}^{n-1}{(X_{k+1}-X_k)(Y_{k+1}+Y_k)}\]

Este indicador también puede ser utilizado para medir concentración espacial con la siguiente variante:

\[G^s = 1-\sum_{n=1}^{R}\frac{1}{R}\left[\lambda_{r(n-1)}^{s}+\lambda_{r(n)}^{s}\right]\]

Donde:

\[\lambda_r^s = \frac{x_r^s}{x^s}\]

\[x^s = \sum_{r=1}^{R}x_r^s\]

En estas expresiones \(G^s\) es el índice de concentración espacial para la industria \(s\), \(x_r^s\) es el nivel de producción (o cualquier otra variable) del sector \(s\) en la región \(r\), \(R\) es el número total de regiones y \(\lambda_r^s\) representa la producción acumulada.

Veamos un ejemplo de cómo calcular este índice, para lo cual utilizaremos los datos del valor agregado bruto generado en la industria minera. Estos datos se encuentran publicados en el Banco Central del Ecuador dentro de los datos de cuentas nacionales para el año 2019.

Así, carguemos primero las librerías y datos necesarios.

library(tidyverse)
library(rio)
library(janitor)
library(ineq)
library(raster)
library(sf)

select <- dplyr::select
urlData <- "https://contenido.bce.fin.ec/documentos/Estadisticas/SectorReal/CuentasProvinciales/Can2019.xlsx"
vabCantonal <- import(urlData, sheet = "VAB CANTONAL", skip=6, col_names = T)
vabCantonal <- clean_names(vabCantonal, case = "big_camel")
vabCantonal %>% head()
##   Provincia CodigoProvincia   Canton CodigoCanton
## 1     AZUAY              01   Cuenca         0101
## 2     AZUAY              01    Girón         0102
## 3     AZUAY              01 Gualaceo         0103
## 4     AZUAY              01    Nabón         0104
## 5     AZUAY              01    Paute         0105
## 6     AZUAY              01   Pucará         0106
##   AgriculturaGanaderiaSilviculturaYPesca ExplotacionDeMinasYCanteras
## 1                             92901.6333                  69016.8075
## 2                              1156.8227                    547.0558
## 3                              3247.1864                    146.1811
## 4                              5462.3922                      0.0000
## 5                             17059.8574                   1271.9488
## 6                               960.6457                    243.5328
##   Manufactura SuministroDeElectricidadYDeAgua Construccion    Comercio
## 1 902215.8441                      77681.5980  835958.4638 499822.1721
## 2    413.2325                        748.3246    1928.1020   1206.8836
## 3   5826.5158                       2521.9962   11509.9088   7240.4787
## 4    445.7913                        511.2121    1156.1756    536.1197
## 5    360.4693                       1273.0672    1499.5474   5335.4366
## 6    155.2286                        460.6113     617.1312    190.6662
##   AlojamientoYServiciosDeComida TransporteInformacionYComunicaciones
## 1                  142403.75695                          372734.9497
## 2                     166.08824                            2846.7211
## 3                    1724.34787                            6354.6614
## 4                     114.66497                            3235.2821
## 5                    1065.35237                            4733.2919
## 6                      95.84822                             900.7397
##   ActividadesFinancieras ActividadesProfesionalesEInmobiliarias
## 1            305127.2084                             480667.173
## 2               320.3896                               2132.897
## 3             13135.7567                              10551.449
## 4              1532.8302                               1182.075
## 5              7732.2505                               6931.882
## 6              1255.4721                               1106.544
##   AdministracionPublica  Ensenanza      Salud OtrosServicios EconomiaTotal
## 1            499691.418 212807.297 220835.389    67250.20168    4779113.91
## 2              4131.210   4258.006   5158.619      187.50876      25201.86
## 3             10211.582  16730.150  10032.581     1332.97573     100565.77
## 4              3027.118   5231.151      0.000      309.73468      22744.55
## 5              4760.008   9891.655   7646.571      422.91676      69984.25
## 6              2930.304   3298.101      0.000       69.52587      12284.35

Ahora seleccionemos las variables de interés y realicemos limpieza:

vabCantonal <- vabCantonal %>% 
  select(Provincia, CodigoProvincia, Canton, CodigoCanton,
         VabMineria = ExplotacionDeMinasYCanteras) %>% 
  filter(!is.na(CodigoCanton))
vabCantonal %>% head()
##   Provincia CodigoProvincia   Canton CodigoCanton VabMineria
## 1     AZUAY              01   Cuenca         0101 69016.8075
## 2     AZUAY              01    Girón         0102   547.0558
## 3     AZUAY              01 Gualaceo         0103   146.1811
## 4     AZUAY              01    Nabón         0104     0.0000
## 5     AZUAY              01    Paute         0105  1271.9488
## 6     AZUAY              01   Pucará         0106   243.5328

Ahora calcularemos el índice de Gini de concentración espacial en esta industria:

gini_vabCantonal = vabCantonal %>% 
  arrange(VabMineria) %>% 
  mutate(lambda = cumsum(VabMineria)/sum(VabMineria)) %>% 
  mutate(lambda_sum = (lag(lambda)+lambda)*1/nrow(.))
gini_vabCantonal %>% head()
##   Provincia CodigoProvincia         Canton CodigoCanton VabMineria lambda
## 1     AZUAY              01          Nabón         0104          0      0
## 2     AZUAY              01   San Fernando         0107          0      0
## 3     AZUAY              01         Sigsig         0109          0      0
## 4     AZUAY              01            Oña         0110          0      0
## 5     AZUAY              01         El Pan         0112          0      0
## 6     AZUAY              01 Sevilla De Oro         0113          0      0
##   lambda_sum
## 1         NA
## 2          0
## 3          0
## 4          0
## 5          0
## 6          0
gini_vabCantonal %>% 
  summarise(G = 1-sum(lambda_sum, na.rm = T))
##           G
## 1 0.9769369
ineq(vabCantonal$VabMineria, type = "Gini")
## [1] 0.9769369

Como podemos notar, el índice de Gini es casi 1, indicando alta concentración espacial de esta actividad económica. Veámoslo de manera con la curva de Lorenz.

gini_vabCantonal %>% 
  ggplot(aes(x=cumsum(rep(1/nrow(.), nrow(.))), y=lambda_sum))+
  geom_point()+
  geom_line()+
  labs(title="Curva de Lorenz para la distribución espacial de la actividad minera",
       x = "1/N",
       y = "Proporción acumulada de VAB")
## Warning: Removed 1 rows containing missing values (geom_point).
## Warning: Removed 1 row(s) containing missing values (geom_path).

Para notarlo de mejor manera, veamos la proporción de producción en cada cantón. Esto lo podemos hacer como se ve a continuación:

ec_cantones <- getData("GADM", country="ECU", level=2) 
# Corregimos parroquias repetidas
ec_cantones <- ec_cantones[!(ec_cantones$NAME_2=="Saquisili" & ec_cantones$CC_2=="0506") &
                            !is.na(ec_cantones$NAME_2) & !is.na(ec_cantones$CC_2),]
ec_cantones$CC2 <- ifelse(ec_cantones$NAME_2=="Mejía" & ec_cantones$CC_2=="1602","1605",ec_cantones$CC_2)

Como se puede notar, hemos descargado los datos geográficos de los cantones del Ecuador a través de la función getData, disponible en la librería raster. Evidentemente Ecuador no es el único país cuyos datos están disponibles.

Ahora que tenemos los datos listos, añadiremos el valor agregado bruto y la proporción que genera cada cantón a este dataset, a través del código del cantón (CC_2) para verlo gráficamente.

ec_cantones <- merge(ec_cantones, vabCantonal %>% select(CodigoCanton, VabMineria), 
                     by.x=c("CC_2"), by.y="CodigoCanton")
ec_cantones@data %>% head()
##    CC_2 GID_0  NAME_0   GID_1 NAME_1 NL_NAME_1     GID_2                NAME_2
## 15 0115   ECU Ecuador ECU.1_1  Azuay      <NA> ECU.1.1_1 Camilo Ponce Enriquez
## 11 0111   ECU Ecuador ECU.1_1  Azuay      <NA> ECU.1.2_1             Chordeleg
## 1  0101   ECU Ecuador ECU.1_1  Azuay      <NA> ECU.1.3_1                Cuenca
## 12 0112   ECU Ecuador ECU.1_1  Azuay      <NA> ECU.1.4_1                El Pan
## 2  0102   ECU Ecuador ECU.1_1  Azuay      <NA> ECU.1.5_1                 Girón
## 14 0114   ECU Ecuador ECU.1_1  Azuay      <NA> ECU.1.6_1            Guachapala
##    VARNAME_2 NL_NAME_2 TYPE_2 ENGTYPE_2   HASC_2  CC2 VabMineria
## 15      <NA>      <NA> Canton    Canton     <NA> 0115  9460.2653
## 11      <NA>      <NA> Canton    Canton EC.AZ.CH 0111   540.0703
## 1       <NA>      <NA> Canton    Canton EC.AZ.CU 0101 69016.8075
## 12      <NA>      <NA> Canton    Canton EC.AZ.EP 0112     0.0000
## 2       <NA>      <NA> Canton    Canton EC.AZ.GR 0102   547.0558
## 14      <NA>      <NA> Canton    Canton EC.LJ.GO 0114     0.0000

Una vez unidos los datos, realizamos la visualización:

ec_cantones %>% 
  st_as_sf() %>% 
  mutate(ProporcionMineria = VabMineria/sum(VabMineria, na.rm=T)) %>% 
  ggplot()+
  geom_sf(aes(fill=ProporcionMineria))+
  scale_fill_gradientn(colors = rev(terrain.colors(5)))

En esta gráfica podemos notar que toda la producción minera se concentra en un solo cantón. Es más, se concentra en una sola región (amazónica). ¿Qué pasa si calculamos el índice de concentración únicamente para esta región? (queda como ejercicio para el lector).

¿Has entendido todos los conceptos? No dudes en hacer preguntas. ¡Nos vemos en una próxima ocasión!