Al igual que en cualquier otra rama de la estadística en la espacial es de suma importancia el análisis gráfico, tal como sucede en el estudio de las series temporales.
El análisis gráfico nos permite establecer si los datos analizados cumplen algunos supuestos necesarios para la aplicación de la geoestadística y para definir cual es el procedimiento de predicción más conveniente (Giraldo, 2015). Por ejemplo, este análisis permite entontrar o denotar: valores extremos y su ubicación geográfica, la evaluación de la forma de la distribución y el cálculo de medidas de localización, variabilidad y correlación.
Definiciones relevantes
Para proceder con el análisis espacial se tiene que recordar nuevamente que estos datos presentan ciertas particularidades que hacen que algunos conceptos de la estadística clásica no sean aplicables o que en algunos casos sean condicionados. Por esto, para adentrarnos en su estudio es necesario antes tratar ciertas propiedades inherentes a los datos espaciales.
Estos conceptos son las bases para el desarrollo de análisis o modelos espaciales más sofisticados, robustos o complejos, mismos que dependerán del fenómeno de estudio.
La escala es de principal interés a la hora de analizar información geográfica, puesto que dependiendo de esta podemos estudiar fenómenos a distintos niveles de desagregación, obteniendo resultados diferentes.
Por ejemplo, en la siguiente gráfica observamos que en a existen datos agrupados en distintas áreas del recuadro, mismo que contiene una “subregión”, la cual se presenta en b y que se muestra distribuida uniformemente.
Abstrayendo este ejemplo, supongamos que estos puntos representan un país y si vamos acercandonos cada vez más, primero observaremos provincias, luego ciudades, manzanas, casas y llegando hasta árboles. Por lo tanto, dependiendo la escala, un país puede ser representado por un punto al igual que un arbol. Esto será definido por el investigador y dependerá del estudio que se esté desarrollando.
Elegir la escala adecuada para el fenómeno estudiado es de suprema importancia, pues define como los datos espaciales se distribuyen de diferentes formas, con lo que es posible desarrollar diferentes análisis.
Para entender la autocorrelación espacial planteemonos el siguiente análisis:
Supongamos que estamos análizando el número de casos de COVID-19 en una serie de poblaciones cercanas, es esperado que debido que estos lugares están relacionados entre si por diversas razones, la distribución de los registros recogidos puede obedecer en parte a la existencia de dichas relaciones. Por ejemplo, si en una población existe varios casos, esto hace que sea muy probable que las personas puedan contagiar a sus vecinos que a otros núcleos o lugares más alejados.
Por lo anterior, es más probable esperar que alrededor de poblaciones con altos casos de COVID-19 también existan sitios cercanas con la misma situación y, por el contrario, las poblaciones que tienen pocos registros, puede que estén rodeadas por lugares de las mismas características.
Otro ejemplo que puede ser más claro, es cuando existe un derramamiento de petróleo, es esperado que los lugares más cercanos al centro de este evento tienen valores de petróleo más altos y estos van disminuyendo conforme no alejamos, llegando a ser ausentes a una distancia dada.
Los casos planteados anteriormente cumplen con lo que se denomina Primera Ley Geográfica de Tobler (Tobler, 1970), la cual establece que “todo está relacionado con todo, pero las cosas próximas entre sí están más relacionadas que las distantes”.
En otras palabras, el término autocorrelación espacial hace referencia a la existencia de una correlación de la variable consigo misma, de tal modo que los valores de esta variable en un punto guardan relación directa con los de esa misma variable en otros puntos cercanos.
En el caso de los dos ejemplos, cuando los valores altos suelen estar rodeados de valores altos y de forma similar para valores bajos, esto se llama autocorrelación espacial positiva. Sin embargo, puede existir una autocorrelación espacial negativa, si los valores altos se rodean de valores bajos y viceversa.
En caso de no existir ningún tipo de autocorrelación espacial, se tiene que los datos recogidos en una serie de puntos son independientes entre sí y no se afectan mutuamente, con lo que influencia de la distancia podría ser nula.
Las consecuencias de la presencia de autocorrelación espacial son varias y de gran relevancia.
Por una parte, muchos de los análisis estadísticos convencionales o clásicos suponen la independencia espacial de variable, dado que, sí se contemplara una componente espacial, seria necesario considerarla como una variable más, para así obtener resultados correctos.
Cuando existe autocorrelación espacial se pierde parte de la capacidad explicativa de los datos utilizando métodos convecionales. Esto se materializa en mayores varianzas en las estimaciones y peores ajustes de modelos, entre otras consecuencias.
No obstante, puede sacarse también provecho de la existencia de una dependencia espacial. Puesto que los puntos cercanos guardan relación entre ellos y pueden emplearse para estimar el valor de lugares cercanos sin datos disponibles, lo cual es el fundamento principal de los distintos métodos de interpolación espacial.
Otra manera de trabajar con la autocorrelación espacial antes de incorporarla como un elemento más, es proceder a analizar su intensidad, para ver en qué medida la autocorrelación es cierta o no. Así, el estudio de la autocorrelación espacial puede servir para valorar si procede la aplicación de métodos estadísticos que consideren la dependencia espacial o no.
Para determinar lo anterior, se debe utilizar pruebas estadísticas donde analizamos si no podemos rechazar la hipótesis nula de ausencia de dependencia espacial, entonces los inconvenientes anteriormente citados pueden no existir.
Una consideración más que afecta a la autocorrelación espacial, es la selección de escala, esta puede aumentar, disminuir o incluso hacer que cambie de signo, dado que esta se encuentra directamente ligada a este concepto.
Por último, analicemos el siguiente ejemplo:
Sea un monte en el que los árboles grandes están separados a una distancia dada por el efecto de la competencia, y entre los cuales crecen los árboles más pequeños. Supongamos que la distancia media entre árboles grandes es de unos 20 metros. Si hacemos un muestreo en el que medimos la altura media de los árboles en parcelas separadas aproximadamente cada 10 metros, es probable que midamos alternamente una parcela con un árbol grande y una con algunos pequeños, de forma que tendremos una marcada autocorrelación espacial negativa.
Si por el contrario medimos parcelas de un metro de radio separadas a su vez un metro, mediremos muchas parcelas cercanas en las que solo entrarán árboles pequeños que se agrupan bajo los grandes, de tal forma que la autocorrelación espacial que obtendremos será positiva.
Es importante considerar todos estos factores de forma global, pues todos ellos tienen importancia y afectan al trabajo con datos geográficos.
Se puede decir que existe una tendencia espacial cuando los valores de una variable están relacionados con sus propias coordenadas geográficas. Por ejemplo, existe una tendencia a que la temperatura disminuya conforme nos alejamos del Ecuador, por ello, si graficamos un mapa de temperaturas para una región lo sufientemente grande, podremos denotar una tencencia clara de disminución de temperatura conforme vayamos alejándonos de la línea ecuatorial ya sea con dirección norte o sur.
Conocer si existe tendencia en los datos de estudio ayuda a comprenderla y si es posible, debe o tiene que ser cuantificada y eliminada, o trabajar considerando su existencia.
Las concecuencias de la existencia de tendencias son similares a las que se derivan de la presencia de la autocorrelación espacial, ya que invalidan el supuesto de independencia de datos.
La estacionariedad es un supuesto fundamental para el análsis estadístico espacial. Para que un fenómeno se considere estacionario, entre otros aspectos se debe destacar que el nivel promedio de la variable debe ser constante en todos los puntos del área de interés.
Sí se encuentra la existencia de una tendencia en el gráfico de dispersión, esto puede ser muestra de que no se satisface el supuesto de estacionariedad.
Un gráfico que nos permite estudiar la presencia de tendencia y, por tanto, la ausencia de estacionariedad es colocar en el eje de las abcisas la variable que representa la coordenada geográfica y en el eje de las ordenadas la variable cuantitativa de estudio. La observación de la nube de puntos, incluso el ajuste de una línea de tendencia ya sea una regresión lineal u otro tipo de modelo, permitirá establecer de forma empírica la existencia de dicha tendencia. Existen muchos más gráficos para detectar tendencias.