\(\\\)
\(\\\)
\(\\\)
Estudiar las técnicas de interpolación espacial y estructuras espaciales.
Realizar un estudio teórico y práctico de los métodos de interpolación espacial más utilizados.
Identificar las ventajas y desventajas de los diferentes métodos de interpolación estudiados.
Comprender como funciona la interpolación como parte del análisis espacial.
El análisis espacial es el estudio y exploración razonada de una gran cantidad de datos cuantitativos y cualitativos con el fin de establecer las características, dinámicas y comportamientos de diversos procesos en un espacio determinado es por ello que define los elementos que lo conforman y la forma como se encuentran relacionados, con el objetivo de extraer información nueva permitiendo proponer alternativas encaminadas a favorecer el entorno espacial estudiado proporcionando una explicación objetiva de la dinámica espacial.
De esta manera, se puede utilizar un Sistema de Información Geográfica (SIG) para realizar un análisis espacial puesto que proporciona instrumentos utiles para calcular estadísticas de las entidades y realizar actividades de geoprocesamiento como la interpolación de datos.
La interpolación tiene como objetivo estimar el valor que adquiere cualquier localización a partir de valores conocidos medidos en localizaciones puntuales distribuidas en el interior del área de estudio.
El procedimiento se realiza cuando la distribución espacial de la variable es continua y no puede ser medida en las infinitas localizaciones, por lo tanto la continuidad se logra a partir de la representación cartográfica de los resultados en una superficie estadística que se genera como modelo.
La interpolación espacial es una temática central de la Geoestadística, término mencionado por Matheron (1962) a partir del inicio teórico-metodológico propuesto por Sichel (1947) y Krige (1951) en el campo de la ciencia aplicada y particularmente en cuanto a la búsqueda y exploración de yacimientos minerales.
El concepto se encuentra compuesto por un “Geo” relacionado a las Ciencias de la Tierra y una “estadística” que alude a la aplicación de metodologías desarrolladas por este campo científico.
Como ejemplo podemos basarnos en la generación de mapas continuos de temperatura para un territorio. Lógicamente no existen infinitas estaciones meteorológicas que permitan conocer el valor exacto de temperatura en cualquier punto de dicho territorio. Para ello se lleva a cabo el proceso de interpolación espacial. Se utilizan los valores de temperatura de la red de estaciones de medición y se realiza una estimación del valor para el resto del territorio donde no existen estaciones de medición.
El resultado obtenido mediante el proceso de interpolación se conoce habitualmente por el nombre de superficie estadística, una superficie continua con valores interpolados a partir de otros conocidos.
Los métodos de interpolación permiten generar superficies continuas a partir de medidas en localizaciones puntuales (muestra o puntos muestrales).Cuando se habla de interpolación espacial mediante Sistemas de Información Geográfica se puede distinguir una serie de métodos que se clasifican según su naturaleza:
Deterministas: generan superficies continuas mediante el grado de similitud o suavizado. Dentro de esta categoría encontramos los métodos globales, locales, IDW y Spline.
Geoestadísticos: generan superficies continuas a partir de las propiedades estadísticas de los datos de partida. Dentro de esta categoría encontramos Kriging y Cokriging.
Las posibilidades en cuanto a métodos de interpolación en QGIS son bastante amplias, aunque mayormente pertenecientes al grupo de los métodos determinísticos definido anteriormente.
Asimismo, en QGIS podemos adecuar cada uno de los métodos y ajustar sus parámetros según las necesidades al realizar el geoproceso para generar las capas de interpolación en base a nuestros puntos con valores de medición.
Los principales métodos de interpolación posibles reunidos en las distintas librerías de las que se nutre este GIS de escritorio son los siguientes:
Si las localizaciones son puntos centrales y se distribuyen en el regional de forma regular, optimizando sus ubicaciones a través de una configuración de triángulos equiláteros,las áreas de influencia trazadas a través de la distancia media entre ellos tendrán forma hexagonal, tal como Christaller (1966) lo representa en la modelización ideal de la teoría de los lugares centrales.
Los hexágonos son los polígonos regulares que permiten realizar el mejor ajuste en los cuales existe la mayor economía en los desplazamientos realizados desde su centro hacia los bordes,solo superado por el círculo, tal cual lo hemos visto en el punto anterior como figura geométrica de mayor compacidad.
Se trata del método más básico y simple de interpolación vectorial. El objetivo que persigue es asignar a todas las localizaciones sin datos el valor del registro más cercano. Esto genera los denominados polígonos de Voronoi o de Thiessen mediante líneas que delimitan el área que pertenece al punto más cercano.
Generalmente se utiliza para modelar el terreno mediante la localización de una serie de vértices cuyos valores de elevación son conocidos. Los vértices se conectan mediante aristas para generar una red de triángulos. El resultado obtenido (el TIN) es una red de triángulos interconectados, cada uno de los cuales representa a una zona homogénea en lo que a la variable estudiada se refiere.
Los cálculos de los polígonos de Voronoi-Thiessen para distribuciones irregulares fueron realizados en el análisis de áreas de influencia en espacios regionales (Principi, 2013) y urbanos (Buzai, 2016) en zonificaciones a través de las áreas de influencia de cada centro y el cálculo de población de demanda potencial en su interior.
Los cálculos de los polígonos de Voronoi-Thiessen para distribuciones irregulares fueron realizados en el análisis de áreas de influencia en espacios regionales (Principi, 2013) y urbanos (Buzai, 2016) en zonificaciones a través de las áreas de influencia de cada centro y el cálculo de población de demanda potencial en su interior.
La lógica analítica de construcción contempla un área de estudio con múltiples localizaciones puntuales \(P = \left \{ p_{1},p_{2},p_{3},..., p_{n}\right \}\) entre las cuales se calculan las distancias lineales (euclidianas) \(D_{ij}=\sqrt{(i_{x}-j_{x})^{2}+(i_{y}-i_{y}^{2})}\) entre las localizaciones puntuales.
Mediante el método de interpolación IDW, los puntos de muestreo se ponderan durante la interpolación. De esta manera, la influencia de un punto en relación con otros se reduce o disminuye a medida que aumenta la distancia entre ellos.
Para el cálculo se utiliza la siguiente fórmula:
\[\hat{Z}_{X_{j}}=\frac{\sum_{i=1}^{n} z(x_{i})*d_{ij}^{-\alpha } }{\sum_{i=1}^{n}d_{ij}^{-\alpha }}\]
Donde:
\(\hat{Z}\) estimador
\(x_{j}\) puntos en los que se realiza la estimación
\(z(x_{j})\) es el valor conocido en las localizaciones vecinas
\(n\) es la cantidad de puntos vecinos utilizados en la estimación.
\(d_{ij}\) es la distancia entre los puntos j e i.
\(\alpha\) es el exponente de ponderación que generalmente es 2.
La herramienta Spline utiliza un método de interpolación que estima valores usando una función matemática que minimiza la curvatura general de la superficie, lo que resulta en una superficie suave que pasa exactamente por los puntos de entrada. Matemáticamente, las Splines son funciones polinómicas por tramos que, en vez de emplear un único polinomio para ajustar a todo un intervalo, se emplea uno distinto más acorde para cada tramo.
El ingeniero en minas Danie G. Krige (1919-2013) propuso un método de interpolación que tomó su nombre (Kriging en inglés y de mayor popularización, krigeage en francés o krigeaje en español) y que también es llamado regresión en procesos gaussianos. Parte del principio que actualmente se conoce como ley de Tobler.
El Kriging con todas sus variantes es uno de los métodos de interpolación probabilístico más utilizado,consideradoscomo óptimos y los mejores predictoreslinealmente insesgados(GiraldoHenao,2002) ya que la media aritmética de una muestra de interpolaciones realizadas con este métodoenunárea escero,y suvarianza esmínima(Bosque Sendra,1997).
La forma genérica de Kriging (Goovaerts,1997):
\[Z(u)=\sum_{\alpha =1)}^{n(u)}\lambda _{\alpha }(u)\left [ Z(u_{\alpha })-m(u_{\alpha }) \right ]+m(u)\]
Donde:
\(Z(u)\) es el valor estimado para cada ubicación \(u\) utilizando \(n(u)\) muestras.
\(\lambda _{\alpha }\) es el peso
\(m(u_{\alpha })\) y \(m(u)\) son los valores esperados o medias aritméticas de las muestras disponibles.
Uno de los conceptos centrales del análisis geográfico es el de densidad. El estudio de las distribuciones espaciales tiene como finalidad ve la frecuencia diferencial con que un hecho se produce en el área de estudio, por lo tanto sus densidades varían y pueden brindar explicaciones a las configuraciones observadas.
La densidad en unidades espaciales discretas se calcula a través de una relación entre el valor de la variable y la superficie.
\[D = \frac{v}{s}\]
Donde:
D es la densidad x es el valor de la variable s las unidades de superficie.
En el cálculo típico de la densidad de población,v se reemplaza por P.
Esta perspectiva tradicional se encuentra fuertemente vinculada a la rigidez que pueden tener las unidades espaciales de captación de datos, en las cuales se considera que el valor de la variable se distribuye de manera homogénea como premisa simplificada de la realidad.
La elección del método de interpolación más apropiado dependerá de la propia naturaleza del conjunto de datos de muestreo que deseemos interpolar.
Así pues, deberíamos conocer previamente:
Tipo de variable a interpolar: cuantitativa o cualitativa y la lógica o necesidad de aplicación de cada método para cada tipo de variable.
Características estadísticas de la muestra: valores máximos, mínimos, media y mediana, desviación estándar.
Distribución espacial de la variables: homogeneidad espacial de los muestreos, distancia media entre puntos de muestreo.
Existencia de valores anómalos: también llamados clústeres, o coldspots que puedan inferir o alterar la superficie de interpolación.
\(\\\)
Para este ejemplo se va a realizar utilizando la interpolación de polígonos de Voronoi para lo cual se ha tomado los datos obtenidos del WFS del Instituto Geográfico Militar de Ecuador.
library(httr)
library(ows4R)
library(dplyr)
library(sf)
library(tidyverse)
library(mapview)
library(deldir)
## Cargar los datos
wfs_igm_ec <- "http://www.geoportaligm.gob.ec/p_geoinformacion/wms"
url <- parse_url(wfs_igm_ec)
url$query <- list(service = "WFS", version = "1.0.0", request = "GetFeature", typename = "Infraestructura_Servicios:IS_EstablecimientoSalud", bbox = "695435.4, 9553697, 702943.2, 9560856", outputFormat = "application/json")
request <- build_url(url)
salud_igm <- st_read(request) %>%
mutate(institucion = if_else(str_detect(descripcio, "IESS"),"SEGURO SOCIAL", "PÚBLICO"))
Reading layer `OGRGeoJSON' from data source
`http://www.geoportaligm.gob.ec/p_geoinformacion/wms?service=WFS&version=1.0.0&request=GetFeature&typename=Infraestructura_Servicios%3AIS_EstablecimientoSalud&bbox=695435.4%2C%209553697%2C%20702943.2%2C%209560856&outputFormat=application%2Fjson'
using driver `GeoJSON'
Simple feature collection with 13 features and 5 fields
Geometry type: POINT
Dimension: XY
Bounding box: xmin: 697175.8 ymin: 9554668 xmax: 701274.3 ymax: 9559738
Projected CRS: WGS 84 / UTM zone 17S
mapview(salud_igm, zcol = "institucion")
# extraer la matriz de coordenadas
coordenadas <- sf::st_coordinates(salud_igm)
# crear la paleta de colores en función del atributo `gid`
pal <- colorRampPalette(RColorBrewer::brewer.pal(9,"YlGnBu"))
colores <- pal(length(unique(salud_igm$gid))) # Lista de colores
colores_variable <- recode(salud_igm$gid, !!!purrr::set_names(colores, sort(unique(salud_igm$gid))))
# Generar los segmentos límite de las regiones de voronoi
voronoi_bordes <- deldir::deldir(x = coordenadas[,1], y = coordenadas[,2], eps = 1e-09, sort = TRUE, plotit = FALSE,digits = 6, suppressMsge = TRUE)
# Convertir los bordes a polígonos
voronoi_poligonos <- deldir::tile.list(voronoi_bordes)
# Hacer el plot
{plot(voronoi_poligonos, fillcol = colores_variable, close = TRUE,
showpoints = TRUE, pch = 20, cex = 4, col.pts = "grey70")
plot(voronoi_bordes, wlines = "triang", add = TRUE, cmpnt_col = c("grey50", "black", NA), cmpnt_lty = 2)
text(coordenadas, labels = salud_igm$gid, col = "grey20")}
library(dismo)
# ggplot2 + dismo + Colores Brewer: Paleta "YlGnBu"
as(salud_igm, "Spatial") %>% dismo::voronoi() %>% st_as_sf() %>%
ggplot() + geom_sf(aes(fill = gid)) + geom_sf_label(aes(label = gid)) +scale_fill_gradientn(colors = RColorBrewer::brewer.pal(9,"YlGnBu"))
# ggplot2 + sf + Colores Brewer: Paleta "YlGnBu"
g <- sf::st_geometry(salud_igm)
bb <- sf::st_as_sfc(st_bbox(salud_igm))
voronoi_sf <- st_voronoi(do.call(c, g), st_geometry(bb)) %>% st_collection_extract() %>% st_sfc(crs = st_crs(salud_igm)) %>%st_sf() %>% st_join(salud_igm)
ggplot(voronoi_sf) + geom_sf(aes(fill = gid)) + geom_sf_label(aes(label = gid)) + scale_fill_gradientn(colors = RColorBrewer::brewer.pal(9, "YlGnBu")) + scale_color_gradientn(colors = RColorBrewer::brewer.pal(9, "YlGnBu")) + coord_sf(xlim = range(st_coordinates(bb)[,1]), ylim = range(st_coordinates(bb)[,2]))
\(\\\)
\(\\\)
La interpolación de Vecino Natural halla el subconjunto de muestras de entrada más cercano a un punto de consulta y aplica ponderaciones sobre ellas basándose en áreas proporcionales para interpolar un valor. También se conoce como interpolación de Sibson o de «robo de área».
Permite determinar asociaciones espaciales de cercanía y con ello realizar una aproximación al espacio funcional considerando que la interacción espacial de cada localización se producirá inicialmente con la localización más cercana.
El procedimiento se basa en el cálculo del promedio de las distancias medidas empíricamente, como realidad observada \(\bar{d}_{o}=\frac{\sum d_{vp}}{n}\) en relación con la distancia promedio teórica o esperada, si la distribución espacial de los puntos fuese aleatoria,obtenida con la aplicación de \(\bar{d}_{a}=\frac{1}{2\sqrt{\frac{n}{A}}}\).
Donde:
\(\bar{d}_{o}\) esla distancia media observada
\(d_{vp}\) es la distancia entre los vecinos más próximos
\(n\) número de puntos
\(\bar{d}_{\alpha}\) es la distancia media aleatoria
\(A\) es la superficie del área de estudio
La aplicación del método de cuadrantes resulta de utilidad para verificar si la estructura espacial de un área de estudio a partir de concentraciones en la distribución de entidades puntuales se produce con un patrón propio que se encuentre alejado a la aleatoriedad.
Si bien la técnica fue aplicada inicialmente en el ámbito de la ecología vegetal hacia la década de 1920 para el estudio de la distribución espacial de las comunidades vegetales, se incorpora con fuerza en los estudios geográficos cuatro décadas después en el contexto del paradigma cuantitativo inicialmente para el análisis urbano a escala regional.Thomas (1977) ha publicado la primera sistematización del método, sirviendo de base a los posteriores aportes didácticos.
Se basa en la afirmación que considera que en el espacio geográfico todo se encuentra relacionado con todo, pero los espacios más cercanos están más relacionados entre sí que con los más alejados. Esta consideración fue presentada por Tobler (1970) como la primera ley de la Geografía.
Si bien este principio funciona con claridad en variables físiconaturales, mientras que en el análisis socioespacial (variables sociales, demográficas, económicas, entre otras) este aspecto debe medirse en cada caso de estudio en particular debido a que los aspectos humanos pueden apartarse de esta ley con mayor facilidad.
En un análisis de autocorrelación espacial no se intenta medir la asociación entre dos variables diferentes en un mismo espacio, sino la correlación que una misma variable tiene entre unidades espaciales contiguas, es decir, su propio comportamiento en una perspectiva horizontal.
Una autocorrelación espacial positiva y negativa indican una tendencia al agrupamiento y la dispersión respectivamente. En este sentido, todo procedimiento de medición de la existencia de autocorrelación espacial intenta verificar que la distribución obtenida no se produce de forma aleatoria.
El procedimiento básico de autocorrelación espacial corresponde a una perspectiva univariada, aunque también existe la posibilidad de realizar un cálculo bivariado en donde se utilizan los datos de dos variables, uno para la unidad espacial central y otro para sus vecinos.
Realizamos el análisis espacial del comportamiento de la cantidad de homicidios por barrio para la Ciudad de Cali en el año 2019, esto mediante la aplicación del Indicador Local de Asociación Espacial (LISA, por sus siglas en inglés).
#### Librerías y complementos
library(pacman)
pacman::p_load(raster, showtext, rgdal, rgeos, stringr, sf, rJava, readxl, tidyverse, fs, gtools, rgeoda)
g <- gc(reset = TRUE)
rm(list = ls())
options(scipen = 999)
#### Agregar fuentes
# Se hace uso de la función "font_add_google" en la cual haremos un tipo de letra desde R utilizando esta base de datos de Google Fonts
font_add_google(family = 'Fira', name = 'Fira code')
font_add_google(family = 'Roboto', name = 'Roboto condensed' )
showtext_auto()
#### Base de datos
#Se Proce a cargar nuestros datos de nuestro directorio:
shpf <- st_read('homicidios_barrios_2019.gpkg')
Reading layer `homicidios_barrios_2019' from data source
`C:\Users\Pchommme\Desktop\PAO 7\ESTADISTICA ESPACIAL\Segundo parcial\Tarea investigativa\homicidios_barrios_2019.gpkg'
using driver `GPKG'
Simple feature collection with 297 features and 6 fields
Geometry type: POLYGON
Dimension: XY
Bounding box: xmin: -76.59076 ymin: 3.331819 xmax: -76.46125 ymax: 3.505871
Geodetic CRS: WGS 84
# datos barrios
cmns <- st_read('comunas.gpkg')
Reading layer `comunas' from data source
`C:\Users\Pchommme\Desktop\PAO 7\ESTADISTICA ESPACIAL\Segundo parcial\Tarea investigativa\comunas.gpkg'
using driver `GPKG'
Simple feature collection with 22 features and 1 field
Geometry type: MULTIPOLYGON
Dimension: XY
Bounding box: xmin: 1054098 ymin: 860192.1 xmax: 1068492 ymax: 879441.5
Projected CRS: MAGNA-SIRGAS / Cali urban grid
# datos comunas
cmns <- st_transform(cmns, crs = st_crs(4326))
mpio <- st_read('mpios_valle.gpkg')
Reading layer `mpios_valle' from data source
`C:\Users\Pchommme\Desktop\PAO 7\ESTADISTICA ESPACIAL\Segundo parcial\Tarea investigativa\mpios_valle.gpkg'
using driver `GPKG'
Simple feature collection with 42 features and 10 fields
Geometry type: MULTIPOLYGON
Dimension: XY
Bounding box: xmin: -77.54977 ymin: 3.091239 xmax: -75.70724 ymax: 5.047394
Geodetic CRS: WGS 84
# datos de los municipios con los que límitan Santiago de Calí
#### Análisis
#Agregamos al dato shpf, la cantidad de homicidios y a su vez, un identificador único.
#En la siguiente línea, se calcula el peso tipo reina, es decir, con cuantos vecinos limita cada polígono a orden 1 (Ejemplo: Un barrio X con cuantos vecinos limita).
#Calculamos con moran la cantidad de homicidios para ese año.
shpf <- mutate(shpf, gid = 1:nrow(shpf))
qnwg <- queen_weights(shpf, order = 1)
morn <- local_moran(qnwg, st_drop_geometry(shpf['y2019']))
# Procedemos a realizar unos gráficos
plot(st_geometry(shpf))
# GRÁFICO DE LOS BARRIOS DE CALÍ
plot(st_geometry(cmns))
# GRÁFICO DE LAS COMUNAS MAPAS
plot(st_geometry(mpio))
# GRÁFICO DE LOS MUNICIPIOS MAPA
#Sacamos las etiquetas que no son significantes
mran_lbls <- lisa_labels(morn)
#Colores a utilizar
mran_clrs <- setNames(lisa_colors(morn), mran_lbls)
#Luego Agregamos a nuestro código el tipo de "cluster" y luego,
#lo transformamos a un sistema de canal geográfico
shpf_clst <- shpf %>%
st_drop_geometry() %>%
select(gid) %>%
mutate(cluster_num = lisa_clusters(morn) + 1,
cluster = factor(mran_lbls[cluster_num], levels = mran_lbls)) %>%
right_join(shpf, by = "gid") %>%
st_as_sf() %>%
st_transform(x = ., crs = st_crs(4326))
#### Mapa sencillo
# Hacemos un mapa sencillo de cómo es el comportamiento de mis datos
ggplot(shpf_clst, aes(fill = cluster)) +
geom_sf(color = "white", size = 0) +
scale_fill_manual(values = mran_clrs, na.value = "green") +
theme_dark()
En esta investigación se aprendió a manipular información espacial para extraer información nueva y significativa a partir de los datos originales.
Es evidente que la Autocorrelacion espacial no se intenta medir la asociación entre dos variables diferentes en un mismo espacio, sino la correlación que una misma variable tiene entre unidades espaciales contiguas
Una vez estudiado la teoría y realizado la práctica podemos decir que la interpolacion espacial es un proceso en el que se utiliza puntos con valores conocidos con el fin de estimar valores desconocidos en otros puntos.