ZONFICACION

Cuando analizamos datos geográficos lo ideal es tenerlos al nivel más granular (y significativo) posible; sin embargo, dado distintas situaciones que deben ser consideradas en el levantamiento de información (principalmente costos), los datos geográficos suelen ser agregados por zonas. Por ejemplo, en lugar de tener datos sobre individuos con o sin empleo, tenemos tasas de desempleo agregadas a nivel provincial.

El nivel de agregación al que los datos son analizados podrían influir sobre los resultados que obtengamos. Es por ello que el problema que los investigadores enfrentan al analizar datos agregados se conoce como inferencia ecológica.

Una vez que tengamos nuestros datos simulados, realizaremos el primer paso necesario en cualquier proceso de análisis de datos: exploración. En este caso particular dicha exploración debe ser geográfica y no geográfica.

Ingreso ordenado

Para ello veremos los valores del ingreso ordenados de menor a mayor.

Histograma del ingreso

La distribución del ingreso la podemos observar con el siguiente histograma.

Como podemos notar, son mucho más frecuentes los valores de ingreso bajo.

Mapa del ingreso

A continuación tenemos la distribución geográfica del ingreso en un gráfico bidimensional.

Así mismo, los valores de ingreso alto se ubican en las esquinas del territorio.

Índice de Gini

Ahora, en base a estos datos, calculemos el índice de Gini. Este índice, creado por Gini (1921) es una medida de económica que sirve para calcular la desigualdad (generalmente de ingresos) que existe entre los ciudadanos de un territorio.

El valor del índice de Gini se encuentra entre 0 y 1, siendo cero la máxima igualdad (todos los ciudadanos reciben el mismo ingreso) y uno, la máxima desigualdad (un solo ciudadano recibe todo el ingreso). Formalmente:

Supongamos entonces que los hogares fueron agrupados por algún tipo de zona censal. Por objetivos de comparación, crearemos varias combinaciones de estos distritos con rásters y calcularemos nuevamente el índice de Gini, basado en datos agregados (ingreso medio).

Al realizar los gráficos agregados con distintos niveles de ráster se puede observar que mientras más pequeña es la agregación, mejor se captura el patrón real de los datos. Revisemos ahora si es que capturamos la distribución de los datos reales. En esta gráfica podemos notar que, pese a que la frecuencia con la agregación más pequeña tiene la distribución de ingreso más similar a la original, ésta no es igual.

## [[1]]
## [1] 0.2936912
## 
## [[2]]
## [1] 0.272314
## 
## [[3]]
## [1] 0.04284505
## 
## [[4]]
## [1] 0.3772084
## 
## [[5]]
## [1] 0.4459655
## 
## [[6]]
## [1] 0.4847319

Ninguno de estos valores es igual al 0.5877254 de los datos desagregados, y todos indican un menor nivel de desigualdad al que existe realmente.