INTRODUCCIÓN
El análisis espacial es el proceso de manipular información espacial para extraer información nueva y significativa de los datos originales. El análisis espacial generalmente se realiza utilizando un sistema de información geográfica (SIG). GIS generalmente proporciona herramientas de análisis espacial para calcular estadísticas de entidades y realizar operaciones de geoprocesamiento, como la interpolación de datos. En hidrología, los usuarios pueden enfatizar la importancia del análisis topográfico y el modelado hidrológico (modelado del movimiento del agua dentro y fuera de la tierra). En la gestión de la vida silvestre, los usuarios están interesados en las funciones analíticas que manejan la ubicación de los puntos de vida silvestre y su relación con el medio ambiente. Cada usuario tendrá diferentes cosas que le interesen dependiendo del tipo de trabajo que esté realizando. De aqui nace la necesidad de conocer sobre como ejecutar la interpolacion espacial y las estructuras espaciales.
OBJETIVO
El objetivo de la investigacion es conocer sobre la interpolacion espacial y las estructuras espaciales en los programas Qgis y Rstudio.
MARCO TEÓRICO
Interpolación espacial
La interpolación espacial es el proceso de utilizar puntos con valores conocidos para estimar valores desconocidos en otros puntos. Por ejemplo, para realizar un mapa de precipitación (lluvia) para el país no se encontrarán suficientes estaciones meteorológicas distribuidas uniformemente para cubrir toda la región. La interpolación espacial puede estimar las temperaturas en lugares que no tienen ese dato utilizando lecturas de temperatura conocida en estaciones meteorológicas cercanas.
A este tipo de superficie interpolada con frecuencia se le llama una superficie estadística. Datos de elevación, precipitación, acumulación de nieve, tabla de agua y densidad de población son otros tipos de datos que pueden ser calculados utilizando la interpolación.
Debido al alto costo y a los recursos limitados la recolección de los datos usualmente es llevada a cabo sólo en un número limitado de ubicaciones de puntos seleccionados. En un SIG, la interpolación de esos puntos puede ser aplicada para crear una superficie ráster con estimaciones realizadas para todas las celdas del ráster.
Con el fin de generar un mapa continuo, por ejemplo, un mapa de elevaciones digitales de los puntos de elevación medidos con un dispositivo GPS, se debe utilizar un método de interpolación adecuado para estimar de manera óptima los valores en aquellas ubicaciones en donde no fueron tomadas muestras o mediciones. Los resultados del análisis de interpolación pueden entonces ser utilizados para análisis que cubran el área completa y para el modelado.
Existen muchos métodos de interpolación. En esta introducción se presentarán dos métodos de interpolación ampliamente usados llamados Distancia Inversa Ponderada (IDW por sus siglas en inglés) y Redes Irregulares Trianguladas (TIN por sus siglas en inlgés). Si se requieren métodos adicionales de interpolación, favor de referirse a la sección ‘Otras Lecturas’ al final de este tema.
Distancia Inversa Ponderada (IDW)
En el método de interpolación IDW, los puntos de muestreo se ponderan durante la interpolación de tal manera que la influencia de un punto en relación con otros disminuye con la distancia desde el punto desconocido que se desea crear.
La ponderación es asignada a los puntos de muestreo mediante la utilización de un coeficiente de ponderación que controla cómo la influencia de la ponderación decae mientras la distancia hacia el punto nuevo se incrementa. Mientras más grande sea el coeficiente de ponderación menor será el efecto que los puntos tendrán si están lejos del punto desconocido durante el proceso de interpolación. Conforme el coeficiente se incrementa, el valor de los puntos desconocidos se aproxima al valor del punto de observación más cercano.
Es importante hacer notar que el método de interpolación IDW también tiene algunas desventajas: La calidad del resultado de interpolación puede disminuir si la distribución de los puntos de datos de la muestra es desigual. Además los valores máximos y mínimos en la superficie interpolada pueden ocurrir únicamente en los puntos de datos de la muestra. Esto a menudo resulta en pequeños picos y pozos alrededor de los puntos de datos de la muestra.
En SIG, los resultados de la interpolación usualmente se muestran como una capa ráster de 2 dimensiones.
Red Irregular Triangulada (TIN)
La interpolación TIN es otra herramienta popular en los SIG. Un algoritmo TIN común es llamado Triangulación de Delaunay. Este intenta crear una superficie formada por triángulos de puntos vecinos más cercanos. Para hacer esto se crean circunferencias alrededor de los puntos de muestra seleccionados y sus intersecciones se conectan a una red de triángulos no traslapados y tan compactos como sea posible.
La desventaja principal de la interpolación TIN es que las superficies no son lisas y pueden dar una apariencia irregular. Esto es causado por pendientes discontinuas entre los límites de los triángulos y los puntos de datos de muestra. Además, la triangulación generalmente no es adecuada para la extrapolación más allá de la zona que contiene los puntos de datos de muestra recolectados.
Problemas comunes / Cosas a tener en cuenta
Es importante recordar que no existe un solo método de interpolación que pueda ser aplicado a todas las situaciones. Algunos son más exactos y útiles que otros pero toman más tiempo en calcularse. Todos tienen ventajas y desventajas. En la práctica, la selección de un método de interpolación particular debería depender en los datos de muestra, el tipo de superficies a ser generadas y la tolerancia de errores estimados. Generalmente se recomienda un procedimiento de tres pasos:
Evaluar los datos de muestra. Realice esto para obtener una idea de cómo se distribuyen los datos en el área, ya que esto puede proporcionar pistas acerca de cual método de interpolación utilizar.
Aplicar un método de interpolación que más adecuado tanto para los datos de muestra como para los objetivos del estudio. cuando se tengan dudas, intentar varios métodos, si están disponibles.
Comparar los resultados y encontrar el mejor de ellos y el método más adecuado. Esto puede parecer como un proceso que consume mucho tiempo. Sin embargo, conforme se tenga más experiencia y conocimiento de los diferentes métodos de interpolación, el tiempo requerido para generar la superficie más adecuada se reducirá considerablemente.
DESARROLLO
Aplicación Interpolación
Ejemplo 1:
Aplicamos las siguientes variables para estos la interpolación la cual nos ayudara a saber la longitud de los lugares que presentan proyectos sociales y tengan un Hospital más cercano y sino un distrito de salud más cercano según su longitud esto mediante el sistema de longitud utilizado para los centros de salud. Datos de la primera base de datos geo-estadísticos de ubicación de infraestructura destinada para servicios sociales: CIBV, Adultos Mayores, Personas con discapacidad, Protección especial.
Ilustración 1: Mapa base de infraestructura destinada a servicios sociales
Datos geo-estadísticos acerca de la ubicación de infraestructura correspondiente a Establecimientos de Salud que se encuentren más cercanos a lugares que presenta proyectos sociales.
Ilustración 2: Mapa base de establecimientos de salud.
Para esto ubicamos nuestro cursos sobre los la barra de herramientas y damos click sobre “Procesos” y buscamos “Caja de herramientas” dentro de esto buscamos Interpolación y dentro del mismo seleccionamos con doble click “Interpolación IDW”.
Ilustración 3: Caja de herramientas.
Dentro de este seleccionamos la base que trabajamos como es los Establecimientos de Salud para poder tener sus ubicaciones exactas lo cual nos ayuda a generar datos y puntos más cercanos para poder ubicar a los centros de proyectos sociales que presenta el gobierno.
Ilustración 4: Opción de interpolación aplicando las variables ya utilizadas.
Datos presentando información de la longitud de su ubicación para poder establecer los lugares más cercanos a un hospital o zonal de salud cerca de un proyecto social que necesite de su ayuda aplicando interpolación y poder saber la distancia de su longitud de un hospital a un proyecto social.
Ilustración 5: Mapa de interpolación con grises y negros que generan predicciones.
A partir de aquí se puede ubicar la zona mediante el señalamiento del lugar o punto más cercano al número de la longitud establecido lo cual generara la distancia mediante la longitud más cercana:
Ilustración 6: A la izquierda valores generados a partir de los valores establecidos.
Ejemplo 2: En 1854, el Dr. John Snow utilizó las posibilidades de la cartografía para identificar el origen de un brote de cólera en Londres. El mapa que creó a partir de datos de estudio permitía ver un patrón claro que nadie había observado todavía y, en última instancia, determinó la fuente del brote. Aunque no era cartógrafo, se le considera un pionero de la cartografía de enfermedades para el estudio de la epidemiología. Un sistema de información geográfica (SIG) le permite comparar y analizar datos geográficos para encontrar patrones. Aunque el término SIG no existía en 1854, el mapa de John Snow de las víctimas de cólera le permitió formular preguntas y resolver problemas, como hacemos con el SIG en la actualidad.
Ilustración 7: Mapa base de muertes por Colera.
La siguiente base de información forma parte del estudio donde se analizo que este brote es muy conocido por el médico John Snow que lo llevó a descubrir la causa de la propagación del cólera, estableciendo que se debía al agua proveniente de un pozo contaminado con heces existente en esa calle. Este hallazgo sentó las bases para el cambio de paradigma respecto de la generación de las enfermedades y la definición del concepto de enfermedad infectocontagiosa que se lograra poco después con el aporte de Louis Pasteur. La determinación de la causa de este brote influyó sobre la organización de la salud pública y la mejora de los sistemas de drenaje y toma de agua hacia comienzos del siglo XIX.
Ilustración 8: Puntos que presentan estrellas rojas son los lugares que tienen una llave municipal de agua.
Aplicamos las mismas instrucciones del anterior ejercicio para poder generar una área base sobre el lienzo y poder generar el área que deseamos generar las predicciones a partir de los datos establecidos.
Ilustración 9: Se busco establecer las mismas variables para poder aplicar predicciones.
A partir de aquí se puede ubicar la zona mediante el señalamiento del lugar o punto más cercano al número de muertes que se dieron esto mediante los grises se puede establecer que hay alrededor de 1,47 más muertes en el lugar donde esta señalado el punto azul esto generado a partir de los alrededores con el número de fallecimientos confirmados establecido lo cual generara la distancia mediante la longitud más cercana.
Ilustración 10: Pronósticos de interpolación donde el punto señalo está en color azul.
ESTRUCTURAS ESPACIALES
ESTRUCTURAS ESPACIALES: ANÁLISIS DE AUTOCORRELACIÓN ESPACIAL Los análisis de Autocorrelación Espacial (AE) están considerados muchas veces en la bibliografía especializada dentro de los denominados Análisis Exploratorio de Datos Espaciales (AEDE) por la importancia que revisten al momento de describir y visualizar las distribuciones espaciales con el objetivo de identificar la asociación espacial, los agrupamientos (clusters) o puntos calientes (hot spots) y las estructuras espaciales. Santana Castañeda y Aguilar (2019:112) definen la AE como “la relación entre lo que ocurre en un punto determinado del espacio y lo que sucede en lugares cercanos o vecinos al mismo, lo que significa que una variable estará espacialmente autocorrelacionada cuando los valores observados en un punto o región dependan de los valores observados en regiones vecinas, de forma que se produzca una cierta continuidad geográfica en la distribución de esta variable”.
Ejemplo 1: En 1854, el Dr. John Snow utilizó las posibilidades de la cartografía para identificar el origen de un brote de cólera en Londres. El mapa que creó a partir de datos de estudio permitía ver un patrón claro que nadie había observado todavía y, en última instancia, determinó la fuente del brote. Aunque no era cartógrafo, se le considera un pionero de la cartografía de enfermedades para el estudio de la epidemiología. Un sistema de información geográfica (SIG) le permite comparar y analizar datos geográficos para encontrar patrones. Aunque el término SIG no existía en 1854, el mapa de John Snow de las víctimas de cólera le permitió formular preguntas y resolver problemas, como hacemos con el SIG en la actualidad.
Introducción al k Nearest Neighbors (kNN) en R La lógica detrás del algoritmo kNN es muy sencilla: me guardo la tabla de datos de entrenamiento y cuando me llegue un nuevo dato, encuentro los k observaciones (vecinos) más cercanos y hago la clasificación en base a esas observaciones. Al fin y al cabo, es de esperar que observaciones cercanas sean similares a la nueva observación.
Como ves, aquí vemos una gran diferencia respecto a la mayoría de algoritmos supervisados, y es que se trata de un algoritmo no paramétrico. Es decir, que el algoritmo no debe aprender el valor de ningún parámetro, por lo que no hay un proceso de entrenamiento como tal.
Así pues, la clave del algoritmo kNN que programaremos en R se basa en tres aspectos clave que debemos conocer:
Conocer las distintas medidas de distancia que existen, cómo funcionan y cuándo usar cada una de las medidas. Entender cómo elegir la cantidad de k vecinos a los que se debe observar. Conocer cómo hace el algortimo kNN las predicciones.
Ilustración 11: Datos de muertes por Colera. .
Se aplica una malla vectorial perteneciente a la estructura espacial de los datos aquí se puede revisar que para poder aplicar una malla se tomara la variable actual donde se dirigirá a los puntos regulares y se realizara de la siguiente manera
Ilustración 12: Aplicación de puntos regulares.
Y nos generara la siguiente malla de datos vectoriales que se podrá conocer una mejor valoración de los datos en sus direcciones sean más exactas a través de sus puntos:
Ilustración 13: Inserción de malla vectorial a los datos.
Aquí podemos aplicar una intersección para poder obtener una selección y mejor orden de los datos teniendo en cuenta que malla provee información acerca de su estructura espacial. Además, la malla puede tener conjuntos de datos asociados que asignan un valor a cada vértice de las muertes diarias ue se han presentado por la colera:
Ilustración 14: Intersección de la información.
Los datos se reordenan de forma que se acoplan a las mallas vectoriales para poder entablar una mejor distribución de la información:
Ilustración 15: Ampliación del mapa para poder verificar el orden de los datos.
Aplicamos un buffer para poder entablar una nueva área de datos y establecer mejor variedad de las áreas que se estudia en las zonas más cercanas a las muertes por Colera:
Ilustración 16: Punto más exacto donde se originó más muertes por la Colera.
EJERCICIO 2 Aplicado a geodatos en la Geometría de Poligonos En Ecuador, de las 338 mil hectáreas en manos de los pequeños y medianos productores que cuentan con riego, el 93% aún utilizan métodos de irrigación tradicionales, con niveles de eficiencia reducida y una limitada capacidad de almacenamiento de agua. El riego es clave en la calidad de los alimentos que se cultivan.
Ilustración 17: Mapa base por polígono.
Y nos generara la siguiente malla de datos vectoriales que se podrá conocer una mejor valoración de los datos en sus direcciones sean más exactas a través de sus puntos donde buscamos generar una malla que pueda cubrir todo el cantón con sus lugares que tengan un mayor riego:
Ilustración 18: Malla vectorial de los datos.
Aquí se ah aplicado una intersección para poder reconocer los lugares donde entablan una mayor conexión de información los cuales tienen un color amarillo para poder reconocer el proceso que se ah entablado.
Ilustración 19: Intersección de los datos se muestran en color amarrillo ordenada la información.
Ilustración 20: El punto más grande presenta una mayor exactitud de lugares de riego del cantón Chorocopte.
Analisis de vecinos próximos
Ilustración 21 :Datos de bombas de agua de la matriz encontrada por Snow para la evaluación de muertes por COLERA
Ilustración 23 :Datos de bombas de agua de la matriz encontrada por Snow para la evaluación de muertes por COLERA
Ilustración 2
Ilustración 24
Ilustración 25 :vecinos mas cercanos
Ilustración 26; disntancia observada
CONCLUSION Interpolar es una estrategia viable para hallar algún valor del que no se tiene conocimiento, y que además, es necesario conoce para lograr algún cálculo para algún problema de aplicación.
Como establece la teroria del vecino mas próximo genera rápidamente un camino corto, pero generalmente no el ideal para la toma de deciciones.
REFERENCIAS BIBLIOGRÁFICAS https://www.um.es/geograf/sigmur/temariohtml/node43_mn.html https://rpubs.com/CDVS/885607