ESCUELA SUPERIOR POLITÉCNICA DE CHIMBORAZO
FACULTAD DE CIENCIAS
ESTADÍSTICA
TEMA: ÍNDICE DE MORAN
INTRODUCCIÓN
OBJETIVOS DE LA INVESTIGACIÓN
2.1. Objetivo General
3.1. Definición teórica
3.2. Definición matemática
3.3. Tipos de autocorrelación
3.3.1. Autocorrelación positiva
3.3.2. Autocorrelación negativa
3.3.3. Autocorrelación nula
3.4. Valor esperado y Significancia
3.5. Desviación estándar
3.6. Interpretación
3.7. Contraste local de autocorrelacion espacial
3.8. Ejemplo
CONCLUSIONES
REFERENCIAS BIBLIOGRÁFICAS
El índice de Moran, es uno de los indicadores locales de asociación espacial más conocidos y extendidos, el cual está sustentado en estudios realizados por Morán en 1948 y Krishna Iyer en 1949, posteriormente fue impulsado por Geary en 1954. Uno de principales avances de estos estudios ha sido el poder de comprender las variaciones globales sino también las locales, esto es lo un punto primordial y fundamental para el desarrollo del análisis espacial, ya que los comportamientos globales suelen ocultar esas especificaciones locales, y es a partir de estas que se resuelven los problemas.
Según Getis, entre los índices que permiten analizar la auto correlación espacial global y local se destaca este Índice de Moran, el cual representa la covarianza global. La Autocorrelación espacial (Índice de Moran global) mide la autocorrelación espacial basada en las ubicaciones y los valores de las entidades simultáneamente. Dado un conjunto de entidades y un atributo asociado, evalúa si el patrón expresado está agrupado, disperso o es aleatorio. La herramienta calcula el valor del Índice I de Moran y una puntuación z y un valor P para evaluar la significancia de ese índice. Los valores P son aproximaciones numéricas del área debajo de la curva de una distribución conocida, limitada por la estadística de prueba.
Objetivo General
• Conocer en que consiste y para qué sirve el Índice de Moran.
Objetivos Específicos
• Conocer la definición teórica y matemática del índice de moran
• Saber el aporte del Índice de Moran en estadística espacial.
• Comprender mediante ejemplos cálculos del Índice de Moran en estadística espacial.
• Realizar un informe de los resultados obtenidos en r-markdown y publicarlo en Rpubs.
Índice de Moran
3.1. Definición teórica
El Índice de Moran es el principal índice para medir la autocorrelación espacial. Su propósito es comparar los valores de cada localización con los valores presentados por las localizaciones contiguas.
3.2. Definición matemática
\[I= \frac{n\sum \left ( c \right )\left ( x_{i} -\bar{x}\right )\left ( x_{j} -\bar{x}\right )}{J\sum \left ( x-\bar{x} \right ) ^{2}}\]
Donde:
Este índice I de Moran toma un valor comprendido entre -1 y 1. Si I es I=0 interpretamos que los datos están distribuidos al azar, si es positivo muestra una tendencia hacia la agrupación, habrá concentración y, si toma un valor negativo, entendemos que hay una dispersión mayor de la que tendríamos si los datos se distribuyen al azar (Goodchild1 & Haining, 2020).
Una interpretación más sencilla de la ecuación anterior es la siguiente:
\[i= \frac{Covarianza ponderada}{Varianza de los valores}\]
3.3. Tipos de autocorrelacin
La autocorrelación espacial permite comprender la variación de un fenómeno en un marco geográfico de análisis.
3.3.1. Autocorrelación positiva
Si el fenómeno analizado tiende a agruparse en zonas uniformes, es decir, si tiende a conformar conglomerados o clústeres, entonces se evidencia la existencia de autocorrelación positiva (Siabato & Manrique, 2018).
Gráfico 1: Autocorrelación espacial positiva
Fuente: (Siabato & Manrique, 2018)
3.3.2. Autocorrelación negativa
Si las medidas de la variable en las unidades colindantes son disímiles, es decir, si el fenómeno tiende a estar disperso, entonces la autocorrelación espacial es negativa. En este caso, si un atributo está presente en un determinado lugar, este tenderá a ser diferente (±σ2 ) en los lugares vecinos (Siabato & Manrique, 2018).
Gráfico 2: Autocorrelación espacial negativa
Fuente: (Siabato & Manrique, 2018)
3.3.3. Autocorrelación nula
Cuando el fenómeno se comporta de forma aleatoria y no se identifica un comportamiento definido o estructurado, se dice que no existe autocorrelación espacial. En términos
prácticos, este último caso implica que la presencia o ausencia de un atributo en un lugar determinado no influye, aparentemente, en la medida de dicho atributo en los lugares vecinos (Siabato & Manrique, 2018).
Gráfico 3: Autocorrelación espacial nula Fuente: (Siabato & Manrique, 2018)
Estos tres comportamientos caracterizan el fenómeno analizado en uno de los tres patrones espaciales básicos: clúster, disperso o aleatorio.
La autocorrelación espacial se interpreta entonces como un índice estadístico descriptivo que permite medir las formas y las maneras como se distribuyen los fenómenos analizados en el espacio geográfico (Goodchild 1986). La autocorrelación espacial mide el grado en el que una variable geográfica está correlacionada con ella misma en dos puntos o zonas diferentes del área de estudio (xi & xi+h, donde h es la distancia entre los puntos), mide la similitud de la variable temática en un área determinada (Siabato & Manrique, 2018).
3.4. Valor esperado y Significancia
El valor esperado del Índice I, bajo la hipótesis nula de ausencia de autocorrelacion espacial y la significatividad del índice I se obtiene con la aplicación de un test de normalidad a partir de contrastar los valores del índice de Moran observado 0(I) y el que se produciría aleatoriamente, considerado como esperado E(I):
\[E\left ( J \right )= \frac{-1}{n-1}\]
3.5. Desviación estándar
Con la finalidad de obtener un puntaje normalizado en una hipótesis nula de normalidad se calcula el desvió estándar de la siguiente forma:
\[\sigma _{1,n}= \sqrt{\frac{n^{2}J+3J^{2}-n\sum L^{2}}{J^{2}\left ( n^{2}-1 \right )^{2}}}\]
Donde
3.6. Interpretación
La herramienta Autocorrelación espacial (I de Moran) es una estadística deductiva, lo que significa que los resultados del análisis siempre se interpretan dentro del contexto de la hipótesis nula. Para la estadística I de Moran global, la hipótesis nula establece que el atributo que se analiza está distribuido en forma aleatoria entre las entidades del área de estudio; es decir, los procesos espaciales que promueven el patrón de valores observado constituyen una opción aleatoria. Cuando el valor P que devuelve esta herramienta es estadísticamente significativo, puede rechazar la hipótesis nula (ArcMap, 2018)
• El valor P no es estadísticamente significativo
No puede rechazar la hipótesis nula. Es posible que la distribución espacial de los valores de entidades sea el resultado de procesos espaciales aleatorios. El patrón espacial observado de los valores de entidades podría ser cualquiera de las tantas versiones posibles de aleatoriedad espacial completa
• El valor P es estadísticamente significativo y la puntuación z es positiva
Puede rechazar la hipótesis nula. La distribución espacial de los valores altos y los valores bajos en el dataset está más agrupada espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran aleatorios.
• El valor P es estadísticamente significativo y la puntuación z es negativa.
Puede rechazar la hipótesis nula. La distribución espacial de los valores altos y los valores bajos en el dataset está más dispersa espacialmente de lo que se esperaría si los procesos espaciales subyacentes fueran aleatorios. Un patrón espacial disperso suele reflejar algún tipo de proceso competitivo: una entidad con un valor alto rechaza a otras entidades con valores altos; del mismo modo, una entidad con un valor bajo rechaza a otras entidades con valores bajos.
3.7. Contraste local de autocorrelacion espacial: Gráfico de dispersión de Moran
El test de Moran es un test global de autocorrelación espacial. El valor obtenido con este test global se puede dividir para conseguir test locales que permitan detectar clusters en donde las observaciones similares a las de su entorno así como detectar outliers.
El grafico de dispersión de es en donde aparecen en el eje de abscisas los valores de la variable de interés y en el eje de las ordenadas esos mismos valores de la variable interés y en el eje de ordenadas esos mismos valores retardados espacialmente, lo que representa sus entornos. También recoge el grado de asociación espacial de cada observación con su entorno y se divide en cuatro cuadrantes que expresan ese grado de asociación. Los cuatro cuadrantes son pares de valores de tipo (bajo, bajo), (alto, alto), (bajo, alto) y (alto, bajo). Los cuadrantes que recogen a los dos últimos tipos de datos, son valores anómalos espacialmente que presentan poca correlación espacial con las observaciones de su entorno (Goodchild1 & Haining, 2020).
3.8. Ejemplo
Supongamos que tenemos interés en estudiar que tenemos interés en estudiar el estilo americano de Nueva York estado compuesto por varios condados. La siguiente matriz de datos trata sobre casos de leucemia en este estado que está conformado por 281 individuos y 12 variables. Los cálculos se generan mediante R y QGis.
Gráfico 4: GIS del ejemplo
Fuente: (Goodchild1 & Haining, 2020)
Se tomó el valor máximo de la distancia de este modelo para crear los demás, en este modelo visualmente ya observamos que no es el mejor debido a que, gráficamente no existe una correlación lineal, analíticamente tomamos en cuenta los siguientes valores:
Gráfico 5: Mapa del estado de Nueva York con zonas unidas
Fuente: (Goodchild1 & Haining, 2020)
Mediante el Índice de Moran podemos decir que hay una concentración espacial mayor de la cabria esperara si los casos se repartieran al azar en todo el estado.
Gráfico de Moran
Gráfico 5: Gráfica de Moran
Fuente: (Goodchild1 & Haining, 2020)
La grafica presenta una recta con pendiente igual al índice de moran I tratando de expresar de esta forma una relación lineal que influye n en la recta de regresión así construida.
• La herramienta Autocorrelación espacial (I de Moran) devuelve cinco valores: el índice de Moran, el índice esperado, la varianza, la puntuación z y el valor P.
• Las estadísticas globales como la herramienta Autocorrelación espacial (I de Moran) evalúan el patrón y la tendencia general de los datos. Son más efectivas cuando el patrón espacial es consistente en toda el área de estudio.
• En general, el Índice de Moran global está delimitado entre -1,0 y 1,0. Esto sucede siempre que los pesos están estandarizados por fila. Cuando los pesos no están estandarizados por fila, puede haber instancias en las que el valor del Índice esté fuera del rango entre -1,0 y 1,0, lo que indica que existe un problema con la configuración del parámetro.
• OLAYA, Víctor. Sistemas de información geográfica. Cuadernos internacionales de tecnología para el desarrollo humano, 2009, no 8, p. 15.
• LARA, Enrique López; SIMEÓN, Carlos Posada; NAVARRO, Jesús Gabriel Moreno. Los sistemas de informacion geográfica. Geoenseñanza, 2006, vol. 11, p. 16.
• Y. C. Kim, Y. Z. (s.f.). Variograms of in situ coal washability data. SOCIETY FOR MINING, METALLURGY, AND EXPLORATION, INC. TRANSACTIONS