1. Introducción

La información espacial es susceptible de ser analizada estadísticamente a diferencia de cualquier otro tipo de información, sin embargo, un conjunto de datos recogidos en diversos puntos proporciona una serie de información sobre el cual puede aplicarse técnicas estadísticas habituales, ya que, cada uno de estos datos tiene asociada una coordenada la misma que aporta información adicional que puede emplearse para obtener resultados estadísticos de diversa índole. El presente trabajo de investigación desarrollara un análisis espacial partiendo del conjunto de datos original y con la ayuda de algunas técnicas que permitan manejar los mismo y así extraer nueva información empleando herramientas espaciales para el cálculo de entidades o la realización de geoprocesamiento a partir de la interpolación de datos utilizando el software adecuado.

2. Objetivos

2.1 Objetivo General

-Desarrollar aplicaciones de geoprocesamiento que complementen los conocimientos sobre interpolación y estructuras espaciales utilizando los software R y QGIS.

2.2 Objetivos Específicos

-Investigar en diversas fuentes bibliográficas como: libros, portales, páginas web entre otros, información acerca de la interpolación y estructura espacial: conceptos básicos, clasificación y sus aplicaciones. -Resolver en R y QGIS aplicaciones acerca de interpolación y estructura espacial.

3. Desarrollo

3.1. INTERPOLACIÓN ESPACIAL

La interpolación espacial es el proceso de utilizar puntos con valores conocidos para estimar valores desconocidos en otros puntos, los métodos de interpolación más usados son:

3.1.1. Distancia Inversa Ponderada

IDW por sus siglas en inglés, en este método los puntos de demostración se ponderan durante la interpolación de tal manera que la influencia de un punto en relación con otros disminuye con la distancia desde el punto desconocido que se desea crear. La ponderación es iluminada a los puntos de demostración mediante la utilización de un coeficiente de ponderación que controla cómo la influencia de la ponderación decae mientras la distancia hacia el punto nuevo se incrementa. Mientras más grande sea el coeficiente de ponderación menor será el efecto que los puntos tendrán si están lejos del punto desconocido durante el proceso de interpolación. Conforme el coeficiente se incrementa, el valor de los puntos desconocidos se aproxima al valor del punto de observación más cercano.

Desventajas

La calidad del resultado de interpolación puede disminuir si la distribución de los puntos de datos de la muestra es desigual. Además, los valores máximos y mínimos en la superficie interpolada pueden ocurrir únicamente en los puntos de datos de la muestra. Esto a menudo resulta en pequeños picos y pozos alrededor de los puntos de datos de la muestra.

3.1.2. Redes irregulares Trianguladas

TIN por sus siglas en inglés, el algoritmo común es llamado Triangulación de Delaunay que intenta crear una superficie formada por triángulos de puntos vecinos mas cercanos, se crean circunferencias alrededor de los puntos de muestra seleccionados y sus interacciones se conectan a una red de triángulos no traslapados y tan compactos como sea posibles.

Desventaja

Las superficies no son lisas y pueden dar una apariencia irregular. Esto es causado por pendientes discontinuos entre los límites de los triángulos y los puntos de datos de muestra. Además, la triangulación generalmente no es adecuada para la extrapolación más allá de la zona que contiene los puntos de datos de muestra recolectados.

3.1.3 Spline

El método estima valores usando una función matemática que minimiza la curvatura general de la superficie, lo que resulta en una superficie suave que pasa exactamente por los puntos de entrada. Matemáticamente, las Splines son funciones polinómicas por tramos que, en vez de emplear un único polinomio para ajustar a todo un intervalo, se emplea uno distinto más acorde para cada tramo.

Aplicación

Para nuestro ejemplo de interpolación utilizamos una capa de información de tipo puntual, la cual contiene información sobre los picos de las montañas y sus elevaciones en Suramérica.

Fig.1 “Capa de información que contiene las elevaciones de las montañas en Suramérica”

QGIS proporciona diferentes métodos de interpolación para el ejemplo se utilizará Interpolación IDW la misma que se encuentra en la opción Caja de Herramientas se procede a completar la información en base a los parámetros de análisis, en nuestro caso el atributo a interpolar serán las elevaciones de las montañas en Suramérica

Fig.2 “Interpolación IDW”

El mapa de interpolacion obtenido es el siguiente

Fig.3 “Mapa de interpolación resultante”

Para una mejor visualización se modificará los colores desde Propiedad de la capa-simbología

Fig. 4 “Simbología de la capa”

Una vez conforme con la configuración de la capa, esta se presentará de la siguiente forma

Fig. 5 “Mapa resultante de interpolar la variable elevacion con el método IDW”

Se puede apreciar que los colores bajos indican elevaciones bajas con respecto a las montañas en Suramérica y los colores fríos elevaciones prominentes.

3.2. ESTRUCTURAS ESPACIALES

3.2.1. Análisis de vencidad

La aplicación del método del vecino más próximo hace evidente la estructura espacial de un área de estudio a partir de las distancias entre localizaciones puntuales del área de estudio. Permite determinar asociaciones espaciales de cercanía y con ello realizar una aproximación al espacio funcional considerando que la interacción espacial de cada localización se producirá inicialmente con la localización más cercana (Buzai y Galbán, 2021).

Durante el año de 1954, Clark y Evans desarrollaron esta técnica en el ámbito del análisis ecológico de poblaciones donde posteriortemente tuvo una gran propagación en múltiples casos de aplicación en los cuales se cuenta con puntos distribuidos espacialmente en una región.

El procedimiento se basa en el cálculo del promedio de las distancias medidas empíricamente, como realidad observada en relación con la distancia promedio teórica o esperada (Buzai y Galbán, 2021).

3.2.2. Análisis por cuadrantes

La aplicación del método de cuadrantes resulta de utilidad para verificar si la estructura espacial de un área de estudio a partir de concentraciones en la distribución de entidades puntuales se produce con un patrón propio que se encuentre alejado a la aleatoriedad (Buzai y Galbán, 2021).

Si bien la técnica fue aplicada inicialmente en el ámbito de la ecología vegetal hacia la década de 1920 para el estudio de la distribución espacial de las comunidades vegetales, se incorpora con fuerza en los estudios geográficos cuatro décadas después en el contexto del paradigma cuantitativo inicialmente para el análisis urbano a escala regional.Thomas (1977) ha publicado la primera sistematización del método, sirviendo de base a los posteriores aportes didácticos (Buzai y Galbán, 2021).

Para medirlo se utiliza el test \(x^2\) (Chi-cuadrado) que permite realizar una clara comparación entre las frecuencias observadas empíricamente y las frecuencias esperadas (Buzai y Galbán, 2021).

3.2.3. Autocorrelación espacial

La autocorrelación espacial es un procedimiento intrínsecamente geográfico que nos puede decir mucho acerca del comportamiento de la información georreferenciada a diferentes escalas, en particular el tipo de asociación existente entre unidades espaciales vecinas (Celemín, 2009).

El concepto de autocorrelación espacial se basa en la afirmación que considera que en el espacio geográfico todo se encuentra relacionado con todo, pero los espacios más cercanos están más relacionados entre sí que con los más alejados. Esta consideración fue presentada por Tobler (1970) como la primera ley de la Geografía.

Si bien este principio funciona con claridad en variables físico-naturales, mientras que en el análisis socioespacial (variables sociales, demográficas, económicas, entre otras) este aspecto debe medirse en cada caso de estudio en particular debido a que los aspectos humanos pueden apartarse de esta ley con mayor facilidad (Buzai y Galbán, 2021).

En un análisis de autocorrelación espacial no se intenta medir la asociación entre dos variables diferentes en un mismo espacio, sino la correlación que una misma variable tiene entre unidades espaciales contiguas, es decir, su propio comportamiento en una perspectiva horizontal(Buzai y Galbán, 2021).

Demuestra de qué manera influye la contigüidad espacial en cada variable analizada al poner atención en una unidad espacial considerada central y sus vecinas, a partir de lo cual pueden aparecer las siguientes situaciones:

(1) Similitud: El valor de las unidades espaciales vecinas es próximo y por lo tanto se verifica una autocorrelación espacial positiva.

(2) Disimilitud: El valor de las unidades espaciales vecinas es muy lejano, existiendo un comportamiento contrario verificado a través de una autocorrelación espacial negativa.

(3) Aleatoriedad: No se comprueba autocorrelación espacial.

Una autocorrelación espacial positiva y negativa indican una tendencia al agrupamiento y la dispersión respectivamente. En este sentido, todo procedimiento de medición de la existencia de autocorrelación espacial intenta verificar que la distribución obtenida no se produce de forma aleatoria.

El procedimiento básico de autocorrelación espacial corresponde a una perspectiva univariada, aunque también existe la posibilidad de realizar un cálculo bivariado en donde se utilizan los datos de dos variables, uno para la unidad espacial central y otro para sus vecinos (Buzai y Galbán, 2021).

Aplicación

En esta ocasión se realizó el análisis espacial del comportamiento de la cantidad de homicidios por barrio para la Ciudad de Cali en el año 2019, esto mediante la aplicación del Indicador Local de Asociación Espacial (LISA, por sus siglas en inglés).

Este tipo de análisis de “autocorrelación espacial”, según Buzai (2021) están considerados muchas veces en la bibliografía especializada dentro de los denominados Análisis Exploratorio de Datos Espaciales (AEDE) por la importancia que revisten al momento de describir y visualizar las distribuciones espaciales con el objetivo de identificar y visualizar la asociación espacial, los agrupamientos (clusters) o puntos calientes (hot spots) y las estructuras espaciales (Castro, 2022). Tal como se mencionó en las de líneas arriba, en esta ocasión analizaremos el comportamiento espacial (si existen o no agrupamientos) de los barrios en función de la cantidad de homicidios, los datos provienen de la Policia Nacional en conjunto con el Centro de Investigación y Documentación Socioeconómica de la Universidad del Valle.

Librerías y complementos

library(pacman)
pacman::p_load(raster, showtext, rgdal, rgeos, stringr, sf, rJava, readxl, tidyverse, fs, gtools, rgeoda)

g <- gc(reset = TRUE)
rm(list = ls())
options(scipen = 999)

Nota: Si no tiene la librería “pacman”, proceda primero a instalarla.

Agregar fuentes

Se hace uso de la función “font_add_google” en la cual haremos un tipo de letra desde R utilizando esta base de datos de Google Fonts

font_add_google(family = 'Fira', name = 'Fira code')
font_add_google(family = 'Roboto', name = 'Roboto condensed' )
showtext_auto()

Base de datos

Procedemos a cargar nuestros datos:

shpf <- st_read('homicidios_barrios_2019.gpkg')
Reading layer `homicidios_barrios_2019' from data source 
  `C:\Users\Usuario\Documents\homicidios_barrios_2019.gpkg' using driver `GPKG'
Simple feature collection with 297 features and 6 fields
Geometry type: POLYGON
Dimension:     XY
Bounding box:  xmin: -76.59076 ymin: 3.331819 xmax: -76.46125 ymax: 3.505871
Geodetic CRS:  WGS 84
cmns <- st_read('comunas.gpkg')
Reading layer `comunas' from data source `C:\Users\Usuario\Documents\comunas.gpkg' using driver `GPKG'
Simple feature collection with 22 features and 1 field
Geometry type: MULTIPOLYGON
Dimension:     XY
Bounding box:  xmin: 1054098 ymin: 860192.1 xmax: 1068492 ymax: 879441.5
Projected CRS: MAGNA-SIRGAS / Cali urban grid
cmns <- st_transform(cmns, crs = st_crs(4326))
mpio <- st_read('mpios_valle.gpkg')
Reading layer `mpios_valle' from data source 
  `C:\Users\Usuario\Documents\mpios_valle.gpkg' using driver `GPKG'
Simple feature collection with 42 features and 10 fields
Geometry type: MULTIPOLYGON
Dimension:     XY
Bounding box:  xmin: -77.54977 ymin: 3.091239 xmax: -75.70724 ymax: 5.047394
Geodetic CRS:  WGS 84

Análisis

. Agregamos al dato shpf, la cantidad de homicidios y a su vez, un identificador único. . En la siguiente línea, se calcula el peso tipo reina, es decir, con cuantos vecinos limita cada polígono a orden 1 (Ejemplo: Un barrio X con cuantos vecinos limita). . Calculamos con moran la cantidad de homicidios para ese año.

shpf <- mutate(shpf, gid = 1:nrow(shpf))
qnwg <- queen_weights(shpf, order = 1)
morn <- local_moran(qnwg, st_drop_geometry(shpf['y2019']))
#Sacamos las etiquetas que no son significantes
mran_lbls <- lisa_labels(morn) 
#Colores a utilizar
mran_clrs <- setNames(lisa_colors(morn), mran_lbls)
#Agregamos a nuestro código el tipo de "cluster" y luego, lo transformamos a un sistema de canal geográfico
shpf_clst <- shpf %>%
  st_drop_geometry() %>%
  select(gid) %>%
  mutate(cluster_num = lisa_clusters(morn) + 1, 
         cluster = factor(mran_lbls[cluster_num], levels = mran_lbls)) %>%
  right_join(shpf, by = "gid") %>%
  st_as_sf() %>% 
  st_transform(x = ., crs = st_crs(4326))

Mapa sencillo

Hacemos un mapa sencillo de cómo es el comportamiento de mis datos

ggplot(shpf_clst, aes(fill = cluster)) +
  geom_sf(color = "white", size = 0) +
  scale_fill_manual(values = mran_clrs, na.value = "green") +
  theme_dark()

Mapa optimizado

ggplot() +
  geom_sf(data = shpf_clst, aes(fill = cluster), color = 'white', size = 0) + 
  scale_fill_manual(values = mran_clrs, na.value = 'green') +
  geom_sf(data = cmns, col = 'grey10', fill = NA) +
  geom_sf_text(data = cmns, aes(label = COMUNA), size = 10, col = '#76766F', family = 'Roboto') +
  geom_sf(data = mpio, fill = NA, col = 'grey10') +
  theme_bw() + 
  coord_sf(xlim = extent(cmns)[1:2], ylim = extent(cmns)[3:4]) +
  ggtitle(label = 'Análisis LISA - Cantidad de homicidios en Cali', 
          subtitle = 'Año 2019') +
  labs(x = 'Longitude', y = 'Latitude', fill = 'Cluster', caption = 'Centro de Investigación y Documentación Socioeconómica (CIDSE)') +
  theme(axis.text.x = element_text(size = 19, family = 'Roboto'), 
        axis.text.y = element_text(size = 19, family = 'Roboto', angle = 90, hjust = 0.5),
        axis.title.x = element_text(size = 26, family = 'Roboto'), 
        axis.title.y = element_text(size = 26, family = 'Roboto'),
        legend.text = element_text(size = 19, family = 'Roboto'),
        plot.title = element_text(size = 30, face = 'bold', hjust = 0.5, family = 'Roboto'),
        plot.subtitle = element_text(size = 30, face = 'bold', hjust = 0.5, family = 'Roboto'),
        legend.title = element_text(size = 26, family = 'Roboto', face = 'bold'),
        legend.position = c(0.815, 0.2),
        panel.background = element_rect(fill = "white"),
        plot.caption = element_text(size = 10, face = 'bold', family = 'Roboto'),
        panel.grid.major = element_line(color = gray(.5), linetype = "dashed", size = 0.1))  

Resultados:

Podemos observar que todo el oriente de Cali, es una zona con alta peligrosidad porque hay muchos homicidios tanto en el interior como a sus alrededor, ya que los barrios en la zona centro tienen bajos homicios y las zonas externas, contienen altos homicidios, por lo cual se manifiesta que si existe agrupamientos de los barrios en función de la cantidad de homicidios.

CONCLUSIONES

Una vez finalizado el trabajo de investigación podemos concluir lo siguiente: Existen varios métodos de interpolación que puedes aplicarse en diversas situaciones, algunos de ellos son más exactos y útiles que otros pero el tiempo de ejecución no es tan óptimo, sin embargo todos tienen ventajas y desventajas, pero al momento de seleccionar un método se debe tomar en cuenta los datos de la muestra, el tipo de superficie que se calculara con un mínimo porcentaje de error, para obtener los resultados que deseamos.

Las Estructuras Espaciales permiten analizar como una variable incide sobre otra, para así poder obtener los puntos más cercanos que corresponden a cada una de las medias presentadas.

La Autocorrelación Espacial manifiesta la relación entre lo que ocurre en un punto determinado del espacio y lo que sucede en lugares cercanos al mismo, lo que significa que una variable estará espacialmente autocorrelacionada cuando los valores observados en un punto o región dependan de los valores observados en regiones vecinas, de forma que se produzca una cierta continuidad geográfica en la distribución de esta variable.

BIBLIOGRAFÍA