INTEGRANTES:Gabriela López - Henry Gualpa
08/07/2022
Analizar el comportamiento de cada variograma y aplicar el método de interpolación de Kriging a un conjunto de datos sobre las concentraciones de dióxido de nitrógeno (NO2).
• Analizar el comportamiento de cada modelo de Variogramas.
• Identificar cuál es el mejor modelo de Variograma según el error cuadrático medio y el coeficiente de determinación.
\(\\\)
El dióxido de nitrógeno es un líquido a temperatura ambiente, pero se transforma en un gas pardo-rojizo a temperaturas sobre 70°F. La contaminación atmosférica es la presencia en el aire de materias o formas de energía que implican riesgo, daño o molestia grave para las personas y seres de la naturaleza, así como que puedan atacar a distintos materiales, reducir la visibilidad o producir olores desagradables y enfermedades. En ciertas ocasiones la contaminación atmosférica proviene de las emisiones de los vehículos automotores, zonas industriales, quema de basura, entre otros.
Kriging con todas sus variantes es uno de los métodos de interpolación probabilístico más utilizado,considerados como óptimos y los mejores predictoreslinealmente insesgados(GiraldoHenao,2002) ya que la media aritmética de una muestra de interpolaciones realizadas con este método en un área es cero,y su varianza es mínima(Bosque Sendra,1997).
El método de interpolación de Krigging se utiliza especialmente en estudios relacionados a la contaminación del aire en áreas urbanas.
Con la base de datos proporcionada sobre las concentraciones de dióxido de nitrógeno (NO2) en la Megaciudad Buenos Aires se analizará el comportamiento de los diferentes modelos de Variogramasy su interpolación de Kriging.
\(\\\)
Análisis preliminar
Es importante que el área a interpolar esté contenida dentro de la nube de puntos de muestreo.
Figura 1:Nube de puntos
En la figura 1 se observa la nube de puntos de muestreo la cual será utilizada en todo el trabajo.
\(\\\)
Estadísticas descriptivas
El coeficiente de asimetría y el coeficiente de curtosis son importantes para determinar las características de la forma en que están distribuidos los datos.
Tabla 1:Estadísticas descriptivas
Elaborado por:Gabriela López - Henry Gualpa.
En la tabla 1 se observa que el coeficiente de asimetría y curtosis se encuentra dentro de un intervalo de -3 y 3 lo que significa que los datos se encuentran dentro de una distribución normal.
\(\\\)
Índice global de Moran
El índice Global de Moran y su valor p permiten constatar la presencia o ausencia de autocorrelación espacial.
\(\\\)
Figura 2:Índice global de Moran
En la figura 2 el I de Moran = 0,901 indica una alta autocorrelación espacial positiva ,es decir que existe similitud entre el valor de la variable y los valores de las unidades espaciales vecinas.
\(\\\)
Figura 3:Variograma del modelo lineal
\(\\\)
En la figura 3 se oberva que hay una varianza de 0.052 aproximadamente, también se presenta una correlación baja de 0.671 por lo que se consideraría que el modelo lineal no es una buena representación de los datos.
\(\\\)
El error cuadrático medio (RMSE) cuantifica cuán diferente son un conjunto de valores. Cuanto más pequeño es un valor de RMSE, más cercanos son los valores predichos y observados, es decir mejor es el modelo. El coeficiente \(R^{2}\) se encuentra en un rango de 0 a 1 mientras más próximo sea a 1 indicaría una predicción perfecta.
Figura 4:Validación cruzada
\(\\\)
En la figura 4 se observa que el error cuadrático medio (RMSE) es de 0.073 y el coeficiente de determinación es de 0.913 el cual es un valor cercano a 1 por lo que se podría considerar que si es un buen modelo. Además en la tabla se observa que la columna de Z predicho es parcialmente aproximada a la columna de Z observado.
Efecto Nugget o efecto pepita: \(C_{0}=0.022\)
Umbral: \(C_{0} + C = 0.059\)
Alcance: \(A=36741.419\)
\(\\\)
Figura 5:Ventana Interpolated Map
\(\\\)
En la figura 5 se observa que el mapa de la interpolación nos va a ayudar a identificar donde se encuentra la zona con la mayor concentración del nivel de dióxido de nitrógeno en este caso la mayor concentración se encuentra en la zona con color verde.
\(\\\)
Figura 6:Concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
Figura 7:Acercamiento de las concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
En la figura 7 se observa que aplicando el método de Kriging la mayor concentración de NO2 (representada por los colores más oscuros) se encuentra en las localidades de Villa Ballester, General San Martin, Caseros, Boulogne, Sur Mer y las menores concetraciones se distribuyen en el resto del área estudiada (representada por los colores más claros).
\(\\\)
\(\\\)
\(\\\)
\(\\\)
Figura 8:Variograma del modelo lineal al umbral
\(\\\)
En la figura 8 se oberva que la varianza es de 0.052 aproximadamente, la dirección del variograma supera el valor de la varianza, tiene una correlación de 0.978 lo que significa que es una buena representación para los datos.
\(\\\)
Cuanto más pequeño es un valor de RMSE, más cercanos son los valores predichos y observados. Y mientras el coeficiente \(R^{2}\) sea más próximo a 1 indicaría una predicción perfecta.
Figura 9:Validación cruzada del modelo lineal al umbral
\(\\\)
En la figura 9 se observa que el error cuadrático medio (RMSE) es de 0.057 y el coeficiente de determinación es de 0.938 el cual es un valor cercano a 1 por lo que se podría considerar que si es un buen modelo. Además en la tabla se observa que la columna de Z predicho es parcialmente aproximada a la columna de Z observado.
Además, otros parámetros que se consideran en este modelo son:
Efecto Nugget o efecto pepita: \(C_{0}=0.000\)
Umbral: \(C_{0} + C = 0.070\)
Alcance: \(A=30167.742\)
\(\\\)
Figura 10:Ventana Interpolated Map
\(\\\)
En la figura 10 se observa que el mapa de la interpolación nos va a ayudar a identificar donde se encuentra la zona con la mayor concentración del nivel de dióxido de nitrógeno en este caso la mayor concentración se encuentra en la zona con color verde.
\(\\\)
Figura 11:Concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
Figura 12:Acercamiento de la concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
En la figura 12 se observa que aplicando el método de Kriging la mayor concentración de NO2 (representada por los colores más oscuros) se encuentra en las localidades de Vicente López, Villa Ballester, General San Martin, Caseros, Boulogne, Sur Mer y las menores concetraciones se distribuyen en el resto del área estudiada (representada por los colores más claros).
\(\\\)
\(\\\)
\(\\\)
Figura 13:Variograma del modelo exponencial
\(\\\)
En la figura 13 se oberva que la varianza es de 0.053, la dirección del variograma supera el valor de la varianza, no existe estacionariedad de datos, y se presenta una correlación de 0.056 lo cual no es tan alto.
\(\\\)
Cuanto más pequeño es un valor de RMSE, más cercanos son los valores predichos y observados. Y mientras el coeficiente \(R^{2}\) sea más próximo a 1 indicaría una predicción perfecta.
Figura 14:Validación cruzada del modelo exponencial
\(\\\)
En la figura 14 se observa que el error cuadrático medio (RMSE) es de 0.057 y el coeficiente de determinación es de 0.939 el cual es un valor cercano a 1 por lo que se podría considerar que si es un buen modelo. Además en la tabla se observa que la columna de Z predicho es parcialmente aproximada a la columna de Z observado.
Además, otros parámetros que se consideran en este modelo exponencial son:
Efecto Nugget o efecto pepita: \(C_{0}=0.00\)
Umbral: \(C_{0} + C = 0.072\)
Alcance: \(A=53882.334\)
\(\\\)
Figura 15:Ventana Interpolated Map
\(\\\)
En la figura 15 se observa que el mapa de la interpolación nos va a ayudar a identificar donde se encuentra la zona con la mayor concentración del nivel de dióxido de nitrógeno en este caso la mayor concentración se encuentra en la zona con color verde.
\(\\\)
Figura 16:Concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
Figura 17:Acercamiento de las concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
En la figura 17 se observa que aplicando el método de Kriging la mayor concentración de NO2 (representada por los colores más oscuros) se encuentra en las localidades de Villa Tesei, Villa Sarmiento, Ramos Mejía, entre otras y las menores concetraciones se distribuyen en el resto del área estudiada (representada por los colores más claros).
\(\\\)
\(\\\)
\(\\\)
Figura 18:Variograma del modelo esférico
\(\\\)
En la figura 18 se oberva que presenta una varianza de 0.05 aproximadamente, la dirección del variograma supera la varianza, la correlación es de 0.953 y el error cuadrático es de aproximadamente 0, lo que significa que el variograma es una buena representación de los datos.
\(\\\)
Figura 19:Validación cruzada del modelo esférico
\(\\\)
En la figura 19 se observa que el error cuadrático medio (RMSE) es de 0.057 y el coeficiente de determinación es de 0.938 el cual es un valor cercano a 1 por lo que se podría considerar que si es un buen modelo.
Además en la tabla se observa que la columna de Z predicho es parcialmente aproximada a la columna de Z observado.
Además, otros parámetros que se consideran en este modelo lineal son:
Efecto Nugget o efecto pepita: \(C_{0}=0.00\)
Umbral: \(C_{0} + C = 0.070\)
Alcance: \(40983.373\)
\(\\\)
Figura 20:Ventana Interpolated Map
\(\\\)
En la figura 20 se observa que el mapa de la interpolación nos va a ayudar a identificar donde se encuentra la zona con la mayor concentración del nivel de dióxido de nitrógeno en este caso la mayor concentración se encuentra en la zona con color verde.
\(\\\)
Figura 21:Concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
Figura 22:Acercamiento de las concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
En la figura 22 se observa que aplicando el método de Kriging la mayor concentración de NO2 (representada por los colores más oscuros) se encuentra en las localidades de Villa Ballester, General San Martín, Caseros, Boulogne Sur Mer, entre otras y las menores concetraciones se distribuyen en el resto del área estudiada (representada por los colores más claros).
\(\\\)
\(\\\)
\(\\\)
Figura 23:Variograma del modelo gaussiano
\(\\\)
En la figura 23 se oberva que todos los valores superan el umbral, tiene una varianza aproximada de 0.052, tiene estacionalidad por arriba de la varianza y la correlación es de 0.981 lña cual es muy alta lo que significa que es una buena representación de los datos.
\(\\\)
Figura 24:Validación cruzada del modelo Gaussiano
\(\\\)
En la figura 24 se observa que el error cuadrático medio (RMSE) es de 0.102 y el coeficiente de determinación es de 0.824 el cual no es un valor tan cercano a 1 por lo que se podría considerar que no es un buen modelo.
Además en la tabla se observa que la columna de Z predicho no se aproxima a la columna de Z observado.
Además, otros parámetros que se consideran en este modelo son:
Efecto Nugget o efecto pepita: \(C_{0}=0.000\)
Umbral: \(C_{0} + C = 0.071\)
Alcance: \(32164.905\)
\(\\\)
Figura 25:Ventana Interpolated Map
\(\\\)
En la figura 25 se observa que no se aprecia muy bien la zona donde se encuentra la mayor concentración de dióxido de nitrógeno.
\(\\\)
Figura 26:Concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
Figura 27:Acercamiento de las concentraciones de NO2 en la ciudad de Buenos Aires
\(\\\)
En la figura 27 se observa que aplicando el método de Kriging la mayor concentración de NO2 (representada por los colores más oscuros) se encuentra en las localidades de el Palomar y Ciudad Jardín Lomas del Palomar y las menores concetraciones se distribuyen en el resto del área estudiada (representada por los colores más claros).
\(\\\)
\(\\\)
\(\\\)
Mediante la validación cruzada se puede escoger el mejor modelo el cual consiste en seleccionar aquel cuyos errores de predicción sean mínimos.
Tabla 2:Comparación de los modelos
Elaborado por:Gabriela López - Henry Gualpa.
En la tabla 2 se observa que el mejor modelo de variograma es el modelo exponencial ya que presenta un error medio cuadrático bajo y un coeficiente de correlación de 0.939 el cual es muy cercano a 1. \(\\\)
\(\\\)
La interpolación de Kriging es una de las herramientas más eficientes al momento de realizar estimaciones de variables ambientales con distribución continua en el espacio.
El análisis Geoestadístico realizado permitió hacer un manejo detallado de los datos y además nos permitió conocer el grado de autocorrelación entre los puntos muestreados y dar como resultado la estimación.
Al comparar todos los modelos se concluyó que el mejor modelo es el modelo exponencial ya que presenta un error medio cuadrático bajo y un coeficiente de correlación positivo muy alto.
Cómo funciona Kriging—ArcGIS Pro | Documentación. (s. f.). Recuperado 8 de julio de 2022, de https://pro.arcgis.com/es/pro-app/2.8/tool-reference/3d-analyst/how-kriging-works.htm
Gustavo D. Buzai - Eloy Montes Galbán. (2021). Estadística Espacial. Recuperado de: https://fabiolexcastrosighome.files.wordpress.com/2022/03/2021_buzai_montes-galban_espacialidades_9_v1_1.pdf