Este cuaderno fue desarrollado para la asignatura de Geomática Básica bajo la dirección del docente Iván Lizarazo, de la facultad de Ciencias Agrarias de la Universidad Nacional de Colombia Sede Bogotá. Se realizará la comparación de tres métodos de interpolación espacial en R utilizando datos de precipitación del departamento de Nariño.
La interpolación predice valores para las celdas de un ráster a partir de una cantidad limitada de puntos de datos de muestra. Puede utilizarse para prever valores desconocidos de cualquier dato de un punto geográfico, tales como: elevación, precipitaciones, concentraciones químicas y niveles de ruido. A su vez, la suposición que hace que la interpolación sea una opción viable es que los objetos distribuidos espacialmente están correlacionados espacialmente; es decir, las cosas que están cerca tienden a tener características similares. Por ejemplo, si se presenta una intensa precipitación, existe alta probabilidad que a 500 metros también la lluvia sea intensa, pero es menos probable que llueva intensamente a 500 kilómetros, es decir las muestras cercanas tienen valores más similares que las muestras de lugares lejanos.
Así, resulta sencillo ver que los valores de los puntos cercanos a los puntos de muestra tienen más posibilidades de ser similares que los que están más alejados. Esta es la base de la interpolación. (ESRI, 2016)
En Colombia hay un número limitado de estaciones meteorológicas que se utilizan para predecir patrones del clima. Aunque sólo se dispone de datos en puntos particulares, es posible predecir el tiempo para todas las ubicaciones dentro de una región, no sólo para aquellos puntos, haciendo uso de la interpolación.
La zona de estudio es el departamento de Nariño. Este departamento se compone de 64 municipios, con 230 corregimientos, agrupados en cinco provincias (Gobernación de Nariño, 2020).
Se encuentra localizado en el suroccidente de la Republica de Colombia, entre los 00º31‟34” y 02º41‟08” de latitud norte y los 75º51‟19” y 79º01‟34” de longitud oeste. Al norte, limita con el departamento del Cauca; al sur, con la República del Ecuador; al oriente, con el departamento del Putumayo y, al occidente, con el Océano Pacífico. La superficie total del departamento es de 33.265 km2, correspondientes al 2,9% de la extensión territorial del país (Fig. 1)(ODDR, 2011).
Las condiciones agro-climáticas de Nariño van desde el nivel del mar hasta alturas superiores a 4.000 metros sobre el nivel del mar (IDEAM, 2005). La cordillera de los Andes tiene gran importancia en la geografía del departamento. Particularmente, el Nudo de los Pastos, entrada de la cordillera al país, y el Macizo Colombiano, la estrella hídrica más importante de Colombia. En el Macizo, considerado por la Unesco como reserva de la biosfera, nacen algunos de los principales ríos de Colombia: el Magdalena, el Cauca, el Caquetá y el Patía (Tocancipa, 2003.Citado en Restrepo, 2009). Esta zona se constituye en un punto importante de comunicación que facilita el tránsito hacía otros departamentos del sur del país. Históricamente, el Macizo Colombiano ha sido lugar de colonización y confrontación por la tierra. Las vías de comunicación terrestre en el departamento son precarias, especialmente en el centro oeste, siendo necesario el uso de vías de acceso fluvial. Las cabeceras municipales de Pasto, Tumaco, Ipiales y El Charco cuentan con aeropuertos (ODDR. 2011).
Nariño cuenta con diversas actividades agrícolas. Las más importantes son: el cultivo de papa, la caña panelera, el cacao, entre otras(Joaquín, 2007)
Fig. 1 Mapa político de Nariño
Los datos de precipitación provienen del Grupo de Riesgos Climáticos de precipitación infrarroja con datos de estación (CHIRPS) el cual es un conjunto de datos de precipitación cuasi global de más de 35 años. Con un alcance de 50 ° S-50 ° N (y todas las longitudes) y desde 1981 hasta el presente, CHIRPS incorpora nuestra climatología interna, CHPclim, imágenes satelitales con resolución de 0.05 ° y datos de estaciones in situ para crear series de tiempo de lluvia cuadriculadas para análisis de tendencias y monitoreo estacional de sequías.
En este cuaderno se utilizan los datos de precipitación de la zona de Nariño, obteniodos por medio del conjunto de datos del grupo de Riesgos Climáticos de precipitación Infrarroja con Estaciones (CHIRPS), de los últimos cinco días del mes de abril del año 2020, es decir del 26 al 30 de abril.
Por otra parte se utilizaron tres métodos diferentes para realizar el proceso de interpolación, el primero es el método por polígonos de Thiessen, el segundo es por IDW y el tercero corresponde a Kriging.
El método de los polígonos de Thiessen consiste en delimitar áreas de influencia a partir de un conjunto de puntos. Se fundamenta en realizar la unión de los puntos entre sí, trazando las mediatrices de los segmentos de unión. Las intersecciones de estas mediatrices determinan una serie de polígonos en un espacio bidimensional alrededor de un conjunto de puntos de control, de manera que el perímetro de los polígonos generados sea equidistante a los puntos vecinos y designan su área de influencia (Villegas, 2011). El tamaño y la configuración de los polígonos depende de la distribución de los puntos originales. Este método es especialmente apropiado cuando los datos son cualitativos (Moreno, 2008).
Figura 2. Polígono Thiessen
IDW o en español Ponderación de distancia inversa, es el método en el cual se estima los valores de las celdas calculando promedios de los valores de los puntos muestreados en la proximidad determinada de cada celda de procesamiento. Cuanto más cerca está un punto del centro de la celda que se está estimando, más influencia tendrá en el proceso de cálculo del promedio (ESRI, 2016). Así este método supone que con el aumento de la distancia, el valor de la variable entre dos puntos implica menor similitud, siempre y cuando la variable sea continua en el espacio, ello justifica el uso de factores de ponderación dependiente de una función inversa de la distancia (Aragón et al., 2019). Lo anterior se puede expresar como:
Donde n es el número de puntos de precipitación más cercanos; si n=1, corresponde al método de los polígonos de Thiessen, por lo que sí n>1, representa una mejora a dicho método; b es un exponente positivo que pondera la distancia (b>1); en aplicaciones prácticas, es frecuente el empleo de b=2, por lo que el método se convierte en inverso de la distancia al cuadrado. Al definir un valor de potencia más alto, se puede poner más énfasis en los puntos más cercanos. Entonces, los datos cercanos tendrán más influencia y la superficie tendrá más detalles (será menos suave). A medida que aumenta la potencia, los valores interpolados comienzan a acercarse al valor del punto de muestra más cercano. Al especificar un valor más bajo de potencia, los puntos circundantes adquirirán más influencia que los que están más lejos, lo que resulta en una superficie más suave.
El valor del nodo se calcula promediando la suma ponderada de todos los puntos. Los puntos de datos que se encuentran progresivamente más lejos del nodo influyen en el valor calculado mucho menos que aquellos que se encuentran más cerca del nodo (Anónimo, 2014).
Las características de la superficie interpolada también pueden controlarse limitando los puntos de entrada que se utilizan en el cálculo de cada valor de celda de salida. Limitar la cantidad de puntos de entrada considerados puede mejorar la velocidad de procesamiento.
Finalmente, también se pueden usar barreras, estas corresponden a un dataset de polilínea utilizado como línea de corte que limita la búsqueda de los puntos de muestra de entrada. Una polilínea puede representar un acantilado, una cresta u otra interrupción en un paisaje. Solo se considerarán los puntos de muestra de entrada que estén del mismo lado de la barrera que la celda de procesamiento actual (ESRI, 2016).
Kriging es una técnica de interpolación geoestadística que considera tanto la distancia como el grado de variación entre los puntos de datos conocidos al estimar valores en áreas desconocidas. Con la rutina de Kriging se incluye la capacidad de construir un semivariograma de los datos que se utiliza para ponderar los puntos de muestra cercanos al interpolar. También proporciona un medio para que los usuarios comprendan y modelen las tendencias direccionales (por ejemplo, norte-sur, este-oeste) de sus datos.
Se podría decir que Kriging es una técnica de media móvil ponderada, similar en algunos aspectos a la interpolación de ponderación de distancia inversa (IDW). La comparación de las dos técnicas proporciona información sobre los beneficios de Kriging, pues Kriging puede usar diferentes funciones de ponderación dependiendo de la distancia y orientación de los puntos de muestra con respecto al nodo, y la forma en que se agrupan los puntos de muestra.
Para hacer una predicción con Kriging, son necesarias dos tareas: 1. Descubrir las reglas de dependencia + Creación de variogramas y funciones de covarianza para estimar los valores de dependencia estadística que depende de nuestro modelo de autocorrelación. 2. Hacer las predicciones + Prediciendo realmente los valores desconocidos.
Debido a estas dos tareas distintas, se ha dicho que Kriging usa los datos dos veces: la primera vez para estimar la autocorrelación espacial de los datos y la segunda vez para hacer las predicciones.
Existen tres métodos diferentes de interpolación de Kriging; Kriging ordinario, Kriging simple y Kriging universal. En este caso usamos el método de Kriging universal, el cual representa un verdadero enfoque geoestadístico para interpolar una superficie de tendencia de un área. El método implica un proceso de dos etapas donde la superficie que representa la deriva de los datos se construye en la primera etapa y los residuos de esta superficie se calculan en la segunda etapa (Anónimo, 2014).
A contnuación se muestran los resultados luego de realizar los debidos procesos para cada método de interpolación, dichos procedimientos se encuentran a detalle en los anexos.
Después de realizada la interpolación por polígonos Thiessen se obtiene
Figura 4. Interpolación por Polígonos de Thiessen
A continuación se observa el mapa de Nariño con los datos de precipitación interpolados bajo el método IDW utilizando un parámetro de potencia de 2, anteriormente descrito.
Figura 5. Interpolación IDW
Para ajustar la elección del parámetro de potencia, se realizó una validación para medir el error en los valores interpolados (Fig 6.), obteniendo un error cuadrado medio de 8.75.
Figura 6. Validación de error de interpolación
Finalmente, además de generar una superficie interpolada, se realizó un mapa de intervalo de confianza del 95% del modelo de interpolación, se ilustra en un porcentaje bajo de los puntos.
Figura 7. Intervalo de confianza del 95% modelo IDW
Figura 8. Modelo polinomial de 1° grado
Seguido, se debe ajustar el modelo de variograma, primero se crear dicho modelo de variograma, calculado sobre los datos de tendencia.
Figura 9. Modelo de Variograma
Finalmente, se genera la superficie interpolada Kriged, usando el modelo de variograma, obteniendo la siguiente figura:
Figura 10. Interpolación Kriging de tpo universal
Después de haber representado gráficamente cada método de interpolación se puede analizar con respecto a la interpolación por medio de polígonos de Thiessen que este no presenta mayores complicaciones en su aplicación. No requiere de una inversión excesiva de tiempo para su desarrollo. Sin embargo, un limitante que tiene el método es que no se puede estimar el error asociado, ya que esta técnica construye polígonos mediante la asignación por cada punto de un área de interés un valor del punto de muestra que sea más cercano. Además crea superficies escalonadas, donde los valores pueden cambiar drásticamente en distancias cortas, es decir, el valor estimado esta representado dentro del área de cada polígono, lo cual no es muy eficiente al hacer una interpolación, en este caso del departamento de Nariño, la información brindada por este mapa no es de gran utilidad a pequeña escala.
Por otra parte, con IDW, cada nodo de la cuadrícula se estima utilizando puntos de muestra que se encuentran dentro de un radio circular. El grado de influencia que tendrá cada uno de estos puntos en el valor calculado se basa en la distancia ponderada de cada punto de muestra desde el nodo de la cuadrícula que se estima. En otras palabras el uso de este método supone que la variable que se está mapeando disminuye en influencia con la distancia desde su ubicación muestreada. Y la relación general entre la cantidad de influencia que tiene un punto de muestra con respecto a su distancia está determinada por la configuración de potencia (o exponente) de IDW. Es efectivamente un interpolador de media móvil que generalmente se aplica a datos muy variables. La desventaja de la técnica de interpolación IDW es que trata todos los puntos de muestra que caen dentro del radio de búsqueda de la misma manera. Por ejemplo, si se especifica una potencia (o exponente) de 1, se utiliza una función de disminución de la distancia lineal para determinar los pesos de todos los puntos que se encuentran dentro del radio de búsqueda. Esta misma función también se usa para todos los puntos, independientemente de su orientación geográfica hacia el nodo (norte, sur, etc.) a menos que se implemente una búsqueda sectorizada. Se observa una interpolación más suavizada en la superficie de departamento a comparación del método Polígonos de Thiessen.
Finalmente en Kriging, la influencia se basa no solo en la distancia entre los puntos medidos y la ubicación de predicción, sino también en la disposición espacial general entre los puntos medidos, lo que la hace el método más preciso de interpolación. Para usar la disposición espacial en los pesos, se debe cuantificar la autocorrelación espacial. Este método aplicado correctamente, permite al usuario derivar pesos que dan como resultado estimaciones óptimas e imparciales, ya que intenta minimizar la varianza del error y establecer la media de los errores de predicción en cero para que no haya sobreestimaciones o subestimaciones.
La efectividad de Kriging depende de la especificación correcta de varios parámetros que describen el semivariograma y el modelo de la deriva (es decir, cómo cambia el valor medio a lo largo de la distancia). Debido a que Kriging es un interpolador robusto, incluso una selección ingenua de parámetros proporcionará una estimación comparable a muchos otros procedimientos de estimación de cuadrícula. La compensación para estimar la solución óptima para cada punto por Kriging es el tiempo de cálculo. Dado el tiempo adicional de prueba y error necesario para seleccionar los parámetros apropiados, Kriging debe aplicarse donde se requieren mejores estimaciones, la calidad de los datos es buena y las estimaciones de errores son esenciales.
En este trabajo se implementaron tres métodos de interpolación de variables; Polígonos de Thiessen, inverso de la distancia ponderada y Kriging universal para la distribución espacial de valores de precipitación en la zona correspondiente al departamento de Nariño, determinando que el método que menos se acerca a las condiciones reales de la precipitación es el de Plígono Thiessen, por el contrario los métodos IDW y Kriging presentaban una interpolación más suavizada para todo el departamento, sin embargo entre estos dos se destaca el modelo Kriging a que al tener un modelo de variograma permite tener mayor control de los valores que se están interpolando, pues integra la relación y orientación de los mismos.
ODDR. 2011. Caracterización del departamento de Nariño. Universidad Nacional de Colombia. Recuperado de: http://sipersn.udenar.edu.co:90/sipersn/docs/DocumentosInformacionSecundaria/Documentosdesoporte/Caracterizaci%C3%B3n%20de%20desarme%20Narino.pdf; consulta: junio 2020.
Moreano, R. 2008. Sistema de Información para la Interpolación espacial y temporal de datos sobre el tiempo atmosférico y el clima del Ecuador.
Villegas, P. 2011. Polígonos de Thiessen en ArcGis. En: Agua y SIG, https://aguaysig.com/poligonos-de-thiessen-en-arcgis/#:~:text=El%20m%C3%A9todo%20de%20los%20pol%C3%ADgonos,de%20un%20conjunto%20de%20puntos.&text=Una%20limitante%20que%20tiene%20el,partir%20de%20un%20solo%20punto; consulta: junio 2020.
Aragón, J., G. Aguilar, U. Velázquez, M. Jiménez & A. Maya. 2019. Distribución espacial de variables hidrológicas. Implementación y evaluación de métodos de interpolación. Ingeniería, investigación y tecnología, 20(2). Doi: 10.22201/fi.25940732e.2019.20n2.023.
ESRI. 2016. Comparar métodos de interpolación. En: ArcMap, Conceptos del conjunto de herramientas de Interpolación, https://desktop.arcgis.com/es/arcmap/10.3/tools/spatial-analyst-toolbox/comparing-interpolation-methods.htm; consulta: junio 2020.
Gobernación de Nariño. 2020. Mapa del departamento de Nariño. En: https://xn--nario-rta.gov.co/index.php/departamento/mapa; consulta: junio 2020.
Introducción al análisis espacial. 2014. Recuperado de: http://planet.botany.uwc.ac.za/nisl/GIS/spatial/chap_1_15.htm; consulta: junio 2020.
IDEAM. (2005). Atlas Climatológico de Colombia. Bogotá: Imprenta Nacional de Colombia.
Restrepo, J. (2009). Guerras y Violencias en Colombia. Bogotá: Pontificia Universidad Javeriana.
Joaquín, V. (2007). Documentos de trabajo sobre economía regional. En: https://www.banrep.gov.co/documentos/publicaciones%20/regional/documentos/DTSER-87.pdf.
Lizarazo I., 2020, Interpolation of precipitation data, Rpubs, https://rpubs.com/ials2un/rain_interpolation , Consultaado Junio de 2020