Escuela Superior Politécnica de Chimborazo

Facultad de Ciencias

Carrera de Estadística

Trabajo Grupal

Integrantes: Cristofer Altamirano

\(\; \;\; \; \; \;\; \;\;\; \;\; \; \; \;\) Fernando Carrillo

\(\; \;\; \; \; \;\; \;\;\; \;\; \; \; \;\) Doménica Castillo

Asignatura: Estadística Espacial

Fecha: 2022-07-07

Variogramas e interpolación de Kriging

Introducción

\(\;\)

\(\; \;\; \; \; \;\; \;\;\) El presente trabajo está enfocado en analizar el comportamiento de cada modelo de Variogramas y su interpolación de Kriging, haciendo uso del software Q-gis, con la base de datos proporcionada en clases. El kriging y el kriging universal son dos métodos usados comúnmente para la interpolación espacial de variables geofísicas e hidrológicas. Uno de los pasos claves para la aplicación de un krigeado es que se debe definir una función de correlación espacial llamada variograma. El variograma es un componente esencial para la estimación de recursos, permite a los geólogos tener un gran entendimiento de la correlación espacial de la información geológica, además de tener control del proceso de interpolación que es usado para el modelamiento de bloques. También nos permiten estudiar el comportamiento de La anisotropía y la isotropía de la variable de estudio(Gutiérrez-López et al., 2011).

\(\;\)

Objetivos

Objetivo General:

Interpretar y analizar el comportamiento de cada modelo de Variogramas y su interpolación de Krigging, mediante el software Q-gis haciendo uso base de datos proporcionada y poniendo en práctica las técnicas vistas en clase par así verificar que modelo es el mejor.

Objetivos Específicos:

  • Analizar los diferentes modelos segun sea el error cuadrado medio y el coheficiente de correlación para así determianr cual sera el mejor.

  • Emplear a la base de datos en conjunto la interpolación de Kriging haciendo uso del software QGis

  • Determinar en donde se presenta la mayor consentración del dióxido de nitrógeno en ciudad de Buenos Aires

Desarrollo

\(\;\)

En la figura 1 se puede observar que se ha importado la base de datos con la cual se va a trabajar, cual contiene las zonas mas afectadas por la concentración de dióxido de nitrógeno en las zonas pobladas de buenos aires.

\(\;\)

Figura 1: Importación de datos

\(\;\)

Seguido a esto, hacemos uso del comando Smart-Map, en la pestaña “Data” desactivamos Eliminate Outliers puesto que los datos siguen una distribución normal y damos clic en importar, como se puede observar en la figura 2.

\(\;\)

Figura 2: Pestaña Data

\(\;\)

En la figura 3 en la pestaña “Gird” podemos observar el índice de moran de 0.901, lo que nos indica que existe un alto grado de interpolación cuyo valor de p es 0.001

\(\;\)

Figura 3: Índice de Moran

\(\;\)

Modelo lineal

Seguido a esto se realiza la validación cruzada en la pestaña “Cross Validation”, como se observa en la figura 5. Obteniendo como resultado 4 columnas, 2 de ellas son las coordenadas de X y Y, estas siguen siendo igual que en la pestaña Data, 2 columnas más de Z observado y Z predicho el cual tiene una aproximación permisible, El error cuadrático medio es igual a 0.073 y la correlación es igual a 0.913. Puesto que el valor del error cuadrático medio es pequeño y la correlación esta próxima a 1, se puede decir que el modelo es bueno.

\(\;\)

Figura 4: Modelo lineal

\(\;\)

Seguido a esto se realiza la validación cruzada en la pestaña “Cross Validation”, como se observa en la figura 5. Obteniendo como resultado 4 columnas, 2 de ellas son las coordenadas de X y Y, estas siguen siendo igual que en la pestaña Data, 2 columnas más de Z observado y Z predicho el cual tiene una aproximación permisible, El error cuadrático medio es igual a 0.073 y la correlación es igual a 0.913. Puesto que el valor del error cuadrático medio es pequeño y la correlación esta próxima a 1, se puede decir que el modelo es bueno.

\(\;\)

Figura 5: Validación cruzada

\(\;\)

En la figura 6 se observa el análisis del variograma y de la validación cruzada al realizar la interpolación, que nos ayuda a identificar donde es que se encuentra la mayor concentración de dióxido de nitrógeno.

\(\;\)

Figura 6: Mapa Interpolado de Kriging

\(\;\)

Pasos para detectar las zonas más afectadas por la concentración de Dióxido de Nitrógeno en Buenos Aires

\(\;\)

\(\; \;\; \; \; \;\; \;\;\) 1.- Al momento de interpolar se genera una capa llamada 1_Krig_Z_Grid_Map que señala el comportamiento de la interpolación.

\(\; \;\; \; \; \;\; \;\;\) 2.- Se debe guardar la capa anterior por lo cual damos clic sobre la misma elegimos exportar seguido a esto elegimos guardar como y le \(\; \;\; \; \; \;\; \;\;\; \;\;\;\) damos un nombre.

\(\; \;\; \; \; \;\; \;\;\) 3.- Vamos a cortar la capa para poder visualizar mejor, elegimos raster, extracción y se corta como ráster por capa de mascara.

\(\; \;\; \; \; \;\; \;\;\) 4.- En la capa cortado (máscara), se cambian los colores para una mejor visualización, dando clic en propiedades en la opción tipo de \(\; \;\; \; \; \;\; \;\;\; \;\;\;\) renderizador elegimos Pseudocolor manobanda y elegimos el color que deseemos.

\(\; \;\; \; \; \;\; \;\;\) 5.- Procedemos a ordenamos las capas: Puntos_muestrados, Luminosidad_urbana, Cortado de mascara, Interpolación del modelo lineal, \(\; \;\; \; \; \;\; \;\;\; \;\;\;\;\) 1_Krig_Z_Grid_Map y OpenStreeMap.

\(\; \;\; \; \; \;\; \;\;\) 6.- Se desmarca las capas Interpolación del modelo lineal, 1_Krig_Z_Grid_Map y OpenStreeMap.

\(\;\)

En la figura 7 se muestran como deberían quedar las capas después de seguir todos los pasos mencionados.

\(\;\)

Figura 7: Capas ordenadas

\(\;\)

Finalmente, en la figura 8 se muestra el Mapa de afectación por Dióxido de Nitrógeno en zonas pobladas de Buenos Aires, según el modelo lineal usado. Se observa que Villa Ballester, Villa Ciudad, José León Suárez, Jardín el Libertador, San Andrés, Villa Maipú, Loma Hermosa, etc. Son algunas de las zonas pobladas que se encuentran más afectadas por el dióxido.

\(\;\)

Figura 8: Mapa de contracción de afectación por Dióxido de Nitrógeno en Buenos Aires

\(\;\)

Modelo linear to Sill

En la pestaña Interpolation, la máxima distancia es de 60000, el valor del lag(H) es de 4474.288 que debe ser cercano al valor de A, se señala la varianza para que se nos muestre, como se observar en la figura 9. La dirección del variograma está superando a la varianza que cuenta con un valor de 0.053 aproximadamente y tiene una correlación alta de 0.979.

\(\;\)

Figura 9: Modelo Linear to Sill

\(\;\)

Seguido a esto se realiza la validación cruzada en la pestaña “Cross Validation”, como se observa en la figura 10. Obteniendo como resultado 4 columnas, 2 de ellas son las coordenadas de X y Y, estas siguen siendo igual que en la pestaña Data, 2 columnas más de Z observado y Z predicho el cual tiene una aproximación permisible, El error cuadrático medio es igual a 0.057 y la correlación es igual a 0.938. Puesto que el valor del error cuadrático medio es pequeño y la correlación esta próxima a 1, se puede decir que el modelo es muy bueno.

\(\;\)

Figura 10: Validación cruzada para el modelo Linear to Sill

\(\;\)

En la figura 11 se observa el análisis del variograma y de la validación cruzada al realizar la interpolación, que nos ayuda a identificar donde es que se encuentra la mayor concentración de dióxido de nitrógeno.

\(\;\)

Figura 11: Mapa Interpolado de Kriging

\(\;\)

Se han seguido los mismos pasos que en el primero modelo para detectar las zonas más afectadas por la concentración de Dióxido de Nitrógeno en Buenos Aires como se observa en la figura 12, obteniendo el Mapa, según el modelo Linear to Sill, Villa Tesei, Villa Sarmiento, Haedos, San Andrés, Villa Ballester, José León Suárez,José León Súarez, etc. Son algunas de las zonas pobladas que se encuentran más afectadas por el dióxido.

\(\;\)

Figura 12: Mapa de contracción de afectación por Dióxido de Nitrógeno en Buenos Aires

\(\;\)

Modelo Exponencial

\(\;\)

En la pestaña Interpolation, la máxima distancia es de 60000, el valor del lag(H) es de 4474.288 que debe ser cercano al valor de A, se señala la varianza para que se nos muestre, como se observar en la figura 13. La dirección del variograma está superando a la varianza que cuenta con un valor de 0.053 aproximadamente y tiene una correlación baja de 0.856.

\(\;\)

Figura 13: Modelo Exponencial

\(\;\)

Seguido a esto se realiza la validación cruzada en la pestaña “Cross Validation”, como se observa en la figura 14. Obteniendo como resultado 4 columnas, 2 de ellas son las coordenadas de X y Y, estas siguen siendo igual que en la pestaña Data, 2 columnas más de Z observado y Z predicho el cual tiene una aproximación permisible, El error cuadrático medio es igual a 0.057 y la correlación es igual a 0.939. Puesto que el valor del error cuadrático medio es pequeño y la correlación está próxima a 1, se puede decir que el modelo no muy bueno.

\(\;\)

Figura 14: Validación cruzada para el modelo Exponencial

\(\;\)

En la figura 15 se observa el análisis del variograma y de la validación cruzada al realizar la interpolación, que nos ayuda a identificar donde es que se encuentra la mayor concentración de dióxido de nitrógeno.

\(\;\)

Figura 15: Mapa Interpolado de Kriging

\(\;\)

Se han seguido los mismos pasos que en el primero modelo para detectar las zonas más afectadas por la concentración de Dióxido de Nitrógeno en Buenos Aires como se observa en la figura 16, obteniendo el Mapa, según el modelo exponencial, Villa Tesei, Villa Sarmiento, Haedos, San Andrés, Villa Ballester, José León Suárez, etc. Son algunas de las zonas pobladas que se encuentran más afectadas por el dióxido.

\(\;\)

Figura 16: Mapa de contracción de afectación por Dióxido de Nitrógeno en Buenos Aires

\(\;\)

Modelo Esférico

\(\;\)

En la pestaña Interpolation, se trabajará para los modelos por lo cual se ha modificado la máxima distancia hasta 60000, el valor del lag(H) es de 4474.288 que debe ser cercano al valor de A, se señala la varianza para que se nos muestre, como se observar en la figura 17. La dirección del variograma está superando a la varianza que cuenta con un valor de 0.053 aproximadamente y tiene una correlación alta de 0.953.

\(\;\)

Figura 17: Modelo Esférico

\(\;\)

Seguido a esto se realiza la validación cruzada en la pestaña “Cross Validation”, como se observa en la figura 18. Obteniendo como resultado 4 columnas, 2 de ellas son las coordenadas de X y Y, estas siguen siendo igual que en la pestaña Data, 2 columnas más de Z observado y Z predicho el cual tiene una aproximación permisible, El error cuadrático medio es igual a 0.057 y la correlación es igual a 0.938. Puesto que el valor del error cuadrático medio es pequeño y la correlación esta próxima a 1, se puede decir que el modelo es muy bueno.

\(\;\)

Figura 18: Validación cruzada para el modelo Esférico

\(\;\)

En la figura 19 se observa el análisis del variograma y de la validación cruzada al realizar la interpolación, que nos ayuda a identificar donde es que se encuentra la mayor concentración de dióxido de nitrógeno.

\(\;\)

Figura 19: Mapa Interpolado de Kriging

\(\;\)

Se han seguido los mismos pasos que en el primero modelo para detectar las zonas más afectadas por la concentración de Dióxido de Nitrógeno en Buenos Aires como se observa en la figura 20, obteniendo el Mapa, según el modelo esférico que Villa Tesei, Villa Sarmiento, San Andrés, Villa Ballester, José León Suárez, etc. Son algunas de las zonas pobladas que se encuentran más afectadas por el dióxido.

\(\;\)

Figura 20: Mapa de contracción de afectación por Dióxido de Nitrógeno en Buenos Aires

\(\;\)

Modelo Gaussian

\(\;\)

En la pestaña Interpolation, se trabajará para los modelos por lo cual se ha modificado la máxima distancia hasta 60000, el valor del lag(H) es de 4474.288 que debe ser cercano al valor de A, se señala la varianza para que se nos muestre, como se observar en la figura 21. La dirección del variograma está superando a la varianza que cuenta con un valor de 0.053 aproximadamente y tiene una correlación alta de 0.981.

\(\;\)

Figura 21: Modelo Gaussiano

\(\;\)

Seguido a esto se realiza la validación cruzada en la pestaña “Cross Validation”, como se observa en la figura 22. Obteniendo como resultado 4 columnas, 2 de ellas son las coordenadas de X y Y, estas siguen siendo igual que en la pestaña Data, 2 columnas más de Z observado y Z predicho el cual tiene una aproximación permisible, El error cuadrático medio es igual a 0.102 y la correlación es igual a 0.824. Puesto que el valor del error cuadrático medio no es tan pequeño y la correlación no esta tan próxima a 1, se puede decir que el modelo es tan bueno.

\(\;\)

Figura 22: Validación cruzada para el modelo Gaussiano

\(\;\)

En la figura 23 se observa el análisis del variograma y de la validación cruzada al realizar la interpolación, que nos ayuda a identificar donde es que se encuentra la mayor concentración de dióxido de nitrógeno.

\(\;\)

Figura 23: Mapa Interpolao de Kriging

\(\;\)

Se han seguido los mismos pasos que en el primero modelo para detectar las zonas más afectadas por la concentración de Dióxido de Nitrógeno en Buenos Aires como se observa en la figura 24, obteniendo el Mapa, según el modelo gaussiano, El Palomar y Ciudad Jardín Lomas del Palomar, son algunas de las zonas pobladas que se encuentran más afectadas por el dióxido.

\(\;\)

Figura 24: Mapa Interpolao de Kriging

\(\;\)

Modelo Gaussian

\(\;\)

Tabla 1: Comparación de los modelos empleados

Conclusiones

Se puede concluir que al analizar el comportamiento de cada modelo de Variogramas y su interpolación de Krigging, se determina que los mejores modelos para determinar la concentración del dióxido de nitrógeno en la ciudad de Buenos Aires es el Linear to Sill, el Exponencial o el Esférico puesto que su error cuadrático medio es pequeño y su coeficiente de correlación es próximo a 1.

Referencias Bibliográficas

  • Gutiérrez-López, A., Ramirez, A. I., Lebel, T., Santillán, O., y Fuentes, C. (2011). El variograma y el correlograma, dos estimadores de la variabilidad de mediciones hidrológicas. Revista Facultad de Ingeniería Universidad de Antioquia, 59, 193-202.