#
ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO
Carrera de estadísitica
Estadísitica Espacial

Autores

VARIOGRAMAS E INTERPOLACIÓN DE KRIGGING

1.Introducción

El propósito de este estudio es dar a conocer variogramas e interpolación de kriggin.

Kriging es una herramienta de interpolación IDW (distancia inversa ponderada) y Spline se conocen como métodos determinísticos de interpolación porque están basados directamente en los valores medidos o en fórmulas matemáticas específicas que determinan la suavidad de la superficie resultante.

Se conoce que Kriging es uno de los dos métodos usados comúnmente para la interpolacón espacial de variables geofísicas e hidrológicas.

En este trabajo se pretende analizar el comportamiento de cada modelaminto con diferentes técnicas, utilizando una base en especifico, en donde se detallan cada parámetro y los valores de cada modelamiento.

2.Objetivos

2.1.Objetivo General:

  • Conocer variogramas e interpolación de Krigging mediante mediante técnicas aplicadas en QGIS para explicar cada modelamiento.

2.2.Objetivos Específicos:

  • Explicar los valóres y parámetros mediante la observación de cada modelamiento para identificar el tipo de modelo que se esta desarrolando.
  • Conocer la base de datos (variables) mediante información proporcionada para su correcto manejo y desallorro de cada modelo.

3.Desarrollo de la actividad

VARIOGRAMAS E INTERPOLACIÓN DE KRIGGING

Es necesario conocer que el variograma es un estimador de vaianza probacional, en el cual la población debe tener una tendenecia de estacionariedad, esta a su vez esta relacionada una dirección y distancia (h).

Un variograma es la principal herrmaienta que da soporte a las técnicas de interpolación Kriging, esta herrmaienta permite representar cuantitativamente de variación de un fenómeno relacionado en el espacio.

El variograma modela como dos valores en el espacio o tiempo de ponen en relación.

PRÁCTICA

Para poder expresar mejor el conocimeinto se planteará un ejercicio en donde se trabajará con los datos de nivel de concentración de dióxido de nitrógeno en la ciudad de buenos aires.

ANÁLISIS DE LA DISTRIBUICIÓN NORMAL
Tabla1: Estaditicas descriptivas
Autores: Alison Tucta y Angeles Tipanquiza

En la tabla 1 nos podemos dar cuenta que los datos analizados siguen una distribución normal dado que su asimetría (1.62) y curtosis (1.42) comprenden en un rango de -3 y 3.

ANÁLISIS EXPLORATORIO DE DATOS

Para realizar la práctica se utiliza dos archivos tipo Shape , el primero (Puntos_muestreados_NO2) nos da el nivel de dióxido y el segundo (Luminosidad_urbana_BA_2012_POSGAR-6) nos muestra el mapa de la geografía de buenos aires (geografía de los puntos que fueron muestreados) los mismo que nos ayudaran a hacer una estimación y finalmente agregamos el mapa base OpenStreetMap como se ve en la figura1.

Figura1:Concentración de dióxido de nitrógeno en la ciudad de buenos aires.
Autores: Alison Tucta y Angeles Tipanquiza

Nota: Observamos que existe una cantidad favorable de puntos los mismos que nos permitirán estimar o realizar la interpolación de krigging.

Interpolación Kriging

Paso1

Abrimos Smart map una vez comprobado que los datos siguen una distribución normal ya no hay la necesidad de eliminar datos atípicos, en este caso des enmarcamos la opción Eliminate Outliers, seleccionamos Z dado que en esa variable se encuentran almacenados los niveles de dióxido de nitrógeno los cuales se van a estimar (132 puntos) e Importamos, como se ve en la figura 2.

Figura2:Smart-Map Selección Data.
Autores: Alison Tucta y Angeles Tipanquiza

PASO 2:

En la pestaña Grid se observa el índice de Moran.

  1. Planteamiento de Hipótesis: \[H_o: Índice\ Moran = 0; No\ existe\ autocorrelación\ espacial\] \[H_1: Índice\ Moran ≠ 0 ; Existe\ autocorrelación\ espacial\]
  2. Nivel de significancia

\[alfa = 0.05\]

  1. Cálculos en el software
Figura3: Índice de Moran
Autores: Alison Tucta y Angeles Tipanquiza
  1. Región de rechazo o no rechazo \[Si\ p \leq 0.05, se\ rechaza\ la\ hipótesis\ H_0\] \[Si p > 0.05, no\ se\ rechaza\ la\ hipótesis\ H_0\]
  2. Decisión estadística

Como se puede observar en la figura 3 hay un polígono de dimensiones en X y Y de 500 pixeles con un p-value =0.001 < alfa=0.05 y un índice de Moran de un 0.901 por lo cual se rechaza la hipótesis nula concluyendo así que representa que existe una alta correlación espacial de los datos.

MODELOS DE VARIOGRAMAS
Modelo Exponencial

El modelo exponencial tambien se puede decir que nos ofrece una buena estimación, esta trabaja en función a la distancia.

Figura4: Modelo Exponencial
Autores: Alison Tucta y Angeles Tipanquiza

En la pestaña Interpolation – Ordinary Kriging seleccione Calculate con una distancia máxima de 60.000 y un Lag(h) de 4474.288.

Se puede observar que el modelo exponencial tiene una varianza de 0.053, un error cuadrático medio (RMSE) de 0.001 y un coeficiente de correlación positiva fuerte de 0.856 como se puede observar en la figura 4.

Validación cruzada

Para la validación cruzada vamos a obserbar el error cuadrático medio (RMSE) y el coeficiente de correlación final del modelo, para eso se debe tener en cuenta las cantidades con las cuales se trabaja, se debe dirig a la ventana Interpolación en donde se debe ubucarse en la ventana Ordinar y Kringin marcando la opción varienace (Figura 6)

Figura5: Validación cruzada
Autores: Alison Tucta y Angeles Tipanquiza

En la figura 5 se observa una tabla donde se muestran las coordenadas en x y las coordenadas en y en la misma tabla se puede observar el z observado el cual es el z que se pide a estimar, en cuanto al z predict es la predicción.

Para saber si el modelo es bueno hay que tener en cuenta el error cuadrado medio que es de 0.057 y el coeficiente de correlacón que es de 0.939 que se acerca a 1 por lo tanto es bueno el modelo despues de la validación cruzada,e estos resultados se encuentran en la parte superior del gráfico en la figura 5, respecto al gráfico se pude observar el comportamiento de los datos.

Interpolación completa

Una vez obtenido el modelo en la opción interpole en la opción interpolate, una vez interpolado se observa un mapa generado en nuetra ventana principal llamada 1 Kring Z Grid Map, llamado se puede observar el nivel de conentración del nivel de Dioxido de nitrógeno como se muestra en la figura 6.

Figura6: Interpolación completa
Autores: Alison Tucta y Angeles Tipanquiza

Corte de capa

Se puede hacer modificaciones de de tal manera que se pueda ver como en la figura 7 en donde se plantea donde se encuentra el nivel de diosxido de nitrogeno más concetrado de manera más clara, y se puede decir que esta más intensificado en las ciudades como: el Palomar, Loma hermosa, Pablo podesta, Villa Boss.

Figura7: Concentración de dióxido de carbono en Buenos Aires.
Autores: Alison Tucta y Angeles Tipanquiza

Modelo Gaussiano

El modeo Gaussiano nos ofrece mucha información entorno a las medidad de tendencia central y a su vez nos permite analizar el comportamieno de datos y la estimación.

Figura8: Modelo Gaussiano
Autores: Alison Tucta y Angeles Tipanquiza

En la pestaña Interpolation – Ordinary Kriging seleccione Calculate con una distancia máxima de 60.000 y un Lag(h) de 4474.288.

Se puede observar que el modelo gaussiano tiene una varianza de 0.071, un error cuadrático medio (RMSE) de 0.000 y un coeficiente de correlación positiva fuerte de 0.981 como se puede observar en la figura 8.

Validación cruzada

Para la validación cruzada vamos a obserbar el error cuadrático medio (RMSE) y el coeficiente de correlación final del modelo, para eso se debe tener en cuenta las cantidades con las cuales se trabaja, se debe dirigir a la ventana Interpolación en donde se debe ubucar en la ventana Ordinar y Kringin marcando la opción varienace (Figura 9)

Figura9: Validación cruzada
Autores: Alison Tucta y Angeles Tipanquiza

En la figura 9 se observa una tabla donde se muestran las coordenadas en x y las coordenadas en y en la misma tabla se puede observar el z observado el cual es el z que se pide a estimar, en cuanto al z predict es la predicción.

Para saber si el modelo es bueno hay que tener en cuenta el error cuadrado medio que es de 0.102 y el coeficiente de correlacón que es de 0.824 que se acerca a 1 por lo tanto es bueno el modelo despues de la validación cruzada,e estos resultados se encuentran en la parte superior del gráfico en la figura 5, respecto al gráfico se pude observar el comportamiento de los datos.

Interpolación completa

Una vez obtenido el modelo en la opción interpole en la opción interpolate, una vez interpolado se observa un mapa generado en nuetra ventana principal llamada 1 Kring Z Grid Map, llamado se puede observar el nivel de conentración del nivel de Dioxido de nitrógeno como se muestra en la figura 10.

Figura10: Interpolación completa
Autores: Alison Tucta y Angeles Tipanquiza

Corte de capa

Se puede hacer modificaciones de de tal manera que se pueda ver como en la figura 11 en donde se plantea donde se encuentra el nivel de diosxido de nitrogeno más concetrado de manera más clara en este modelo, y se puede decir que esta más intensificado en las ciudades como:El palomar exactamente cerca del Aereopuerto El Palomar, Ciudad Jardin Lomas del Palomar en el lugar del colegio Militar de la Nación

Figura11: Concentración de dióxido de carbono en Buenos Aires.
Autores: Alison Tucta y Angeles Tipanquiza

Modelo esférico

El variograma de tipo esférico considera una normalización a 1 es decir que todos los datos no superan el 1, este modelo se dice que es el que mejor resultados nos ofrece al momento de estimar, esta trabaja en función a la distancia.

En la pestaña Interpolation – Ordinary Kriging seleccione Calculate con una distancia máxima de 60.000 y un Lag(h) de 4474.288.

Se puede observar que el modelo esférico tiene una varianza de 0.053, un error cuadrático medio (RMSE) de 0.000 y un coeficiente de correlación positiva fuerte de 0.953 como se puede observar en la figura 12.

Figura12: Modelo Esférico
Autores: Alison Tucta y Angeles Tipanquiza

Validación cruzada

Seleccione Cross Validation, en la tabla se puede observar que los valores de Z predichos tienen una buena aproximación, cuenta un error cuadrático medio de 0.057 y un coeficiente de correlación positivo fuerte de 0.938 los mismos que sirven para verificar si el modelo es bueno, como se puede observar en la figura 13.

Figura13: Validación cruzada
Autores: Alison Tucta y Angeles Tipanquiza

Interpolación completa

Seleccionamos Interpolate, se genera una capa denominada 1 Krig Z Grid Map, para hacerla una capa fija seleccionas Exportar Guardar como generando la capa fija Interpolacion Completa observando la interpolación de la mayor concentración de dióxido como se observa en la figura 14.

Figura14: Interpolación completa
Autores: Alison Tucta y Angeles Tipanquiza

Corte de capa

En la opción Ráster- Extracción – Cortar ráster como capa de máscara generando así la capa Cortado, en Propiedades modificas Transparencia =0 y observar donde se muestra la mayor concentración de dióxido de nitrógeno en las ciudades como San Fernando, Vicente López, Villa Ballester, Villa Maipu, Sur Ner entre otros como se ve en la figura 15.

Figura15: Concentración de dióxido de carbono en Buenos Aires.
Autores: Alison Tucta y Angeles Tipanquiza

Modelo Lineal

En la pestaña Interpolation – Ordinary Kriging seleccione Calculate con una distancia máxima de 60.000 y un Lag(h) de 4474.288.

Se puede observar que el modelo exponencial tiene una varianza de 0.053, un error cuadrático medio (RMSE) de 0.002 y un coeficiente de correlación positiva moderada de 0.671 como se puede observar en la figura 16.

Figura16:Modelo Lineal
Autores: Alison Tucta y Angeles Tipanquiza

Validación cruzada

Seleccione Cross Validation, en la tabla se puede observar que los valores de Z predichos tienen una buena aproximación, cuenta un error cuadrático medio de 0.073 y un coeficiente de correlación positivo fuerte de 0.913 los mismos que sirven para verificar si el modelo es bueno, como se puede observar en la figura 17.

Figura17: Validación cruzada
Autores: Alison Tucta y Angeles Tipanquiza

Interpolación completa

Seleccionamos Interpolate, se genera una capa denominada 1 Krig Z Grid Map, para hacerla una capa fija seleccionas Exportar Guardar como generando la capa fija Interpolacion Completa Lineal observando la interpolación de la mayor concentración de dióxido como se observa en la figura 18.

Figura18: Interpolación completa
Autores: Alison Tucta y Angeles Tipanquiza

Corte de capa

En la opción Ráster- Extracción – Cortar ráster como capa de máscara generando así la capa Cortado, en Propiedades modificas Transparencia =0 y observar donde se muestra la mayor concentración de dióxido de nitrógeno en las ciudades como San Fernando, Tigre,San Isisdro, Vicente López, San Isidro, Santa María entre otros como se ve en la figura 19.

Figura19: Concentración de dióxido de carbono en Buenos Aires.
Autores: Alison Tucta y Angeles Tipanquiza

Modelo Lineal to Still

En la pestaña Interpolation – Ordinary Kriging seleccione Calculate con una distancia máxima de 60.000 y un Lag(h) de 4474.288. Se puede observar que el modelo exponencial tiene una varianza de 0.053, un error cuadrático medio (RMSE) de 0.000 y un coeficiente de correlación positiva fuerte de 0.979 como se puede observar en la figura 20.

Figura20:Modelo Lineal to still
Autores: Alison Tucta y Angeles Tipanquiza

Validación cruzada

Seleccione Cross Validation, en la tabla se puede observar que los valores de Z predichos tienen una buena aproximación, cuenta un error cuadrático medio de 0.057 y un coeficiente de correlación positivo fuerte de 0.938 que tiende a 1 los mismos que sirven para verificar si el modelo es bueno, como se puede observar en la figura 21.

Figura21: Validación cruzada
Autores: Alison Tucta y Angeles Tipanquiza

Interpolación completa

Seleccionamos Interpolate, se genera una capa denominada 1 Krig Z Grid Map, para hacerla una capa fija seleccionas Exportar Guardar como generando la capa fija Interpolacion Completa Linear to Sill observando la interpolación de la mayor concentración de dióxido como se observa en la figura 22.

Figura22: Interpolación completa
Autores: Alison Tucta y Angeles Tipanquiza

Corte de capa

En la opción Ráster- Extracción – Cortar ráster como capa de máscara generando así la capa Cortado, en Propiedades modificas T5ransparencia =0 y observar donde se muestra la mayor concentración de dióxido de nitrógeno en las ciudades como San Fernando, Villa Ballester, Villa Martelli, San Isidro, Vicente López, Virreyes, entre otros como se ve en la figura 23.

Figura23: Concentración de dióxido de carbono en Buenos Aires.
Autores: Alison Tucta y Angeles Tipanquiza

ANÁLISIS DEL MEJOR MODELO
Tabla 2: Comparación de modelos
RMSE R^2
Exponencial 0.057 0.939
Gaussiano 0.102 0.824
Esférico 0.057 0.938
Lineal 0.073 0.913
Lineal to still 0.057 0.938
Autores: Alison Tucta y Angeles Tipanquiza

CONCLUSIONES

Una vez hecho el análisis comparativo en la tabla 2 de todos los modelos nos podemos dar cuenta que el modelo exponencial es el mejor modelo ya que posee un valor de error cuadrado medio de 0.057 y un coeficiente de correlación de 0.939 mayor al de los demás modelos por lo que se acerca a 1 y por ende se tomaría como el mejor modelo, sin embargo no hay que desmerecer los buenos modelos que le siguen que es el modelo esférico y el modelo to still.

RECOMENDACIONES

Para el análisis se debe considerar la zona geográfica donde se está trabajando en este caso fue Buenos Aires Argentina (EPSG:5348).

REFERENCIAS BIBLIOGRÁFICAS