1. Introducción GeoXp
- Es un paquete de R para gráficos interactivos de análisis exploratorio de datos espaciales.
- Conjunto de rutinas estadísticas adaptadas a la exploración de datos georreferenciados, una herramienta adaptable, integral y unificada.
- Es una herramienta exploratoria para investigadores y usuarios experimentados en estadísticas espaciales, econometría espacial, geografía, ecología, epidemiología, etc.
Análisis Exploratorio de Datos Espaciales Es el conjunto de técnicas que describen y visualizan las distribuciones espaciales, identifican localizaciones atípicas o “atípicos espaciales” (“spatial outliers”), descubren esquemas de asociación espacial, agrupamientos (“clusters”) o puntos calientes (“hot spots”) y sugieren estructuras espaciales u otras formas de heterogeneidad espacial (Anselin, 1999). Por tanto, el AEDE se correspondería con los métodos de estadística descriptiva espacial.
2. Descripción de las funcionalidades básicas
2.1. Descripción del conjunto de datos
El conjunto de datos que consideramos se refiere a las 226 escuelas secundarias públicas de la región francesa de Midi-Pyrénées en el año escolar 2003-2004 (correspondiente a 175 comunas).
Para cada escuela, consideramos 13 características:
longitude: coordenada x
latitude: coordenada y
namem.city: nombre de la ciudad
index.rurality: Un factor con niveles de ruralidad.
Nb.students: El número de estudiantes por clase.
Occupancy.rate: La tasa de ocupación = [número de estudiantes] / [cantidad de estudiantes para los que la escuela ha sido diseñada].
Cost.per.student: Costo por estudiante.
Nb.students.per.class: Número promedio de estudiantes por clases.
Freq.certifies: Frecuencia de docentes certificados.
Freq.rep.stud: La frecuencia de alumnos que repitieron una clase.
Nb.specialties: La cantidad de especialidades que se ofrecen a los estudiantes en la escuela.
Teachers.age: El promedio de edades de los profesores en la escuela.
# Importando paquete GeoXp
library("GeoXp")
# Datos:
data("mp.school")
# Clase:
class(mp.school)
[1] "data.frame"
# Dimension:
dim(mp.school)
[1] 226 13
# Nombres:
names(mp.school)
[1] "longitude" "latitude"
[3] "name.city" "index.rurality"
[5] "Nb.students" "Occupancy.rate"
[7] "Cost.per.student" "Nb.students.per.class"
[9] "Freq.certifies" "Freq.agreges"
[11] "Freq.rep.stud" "Nb.specialties"
[13] "Teachers.age"
# 6 primeros datos
head(mp.school)
2.2. Principios generales
Es bastante sencillo crear un objeto espacial.
- En nuestro conjunto de datos, las unidades espaciales están representadas por
puntos.
# Seleccionando las coordenadas (longitud, latidud)
mp.school_coord <- cbind(mp.school$longitude, mp.school$latitude)
- Se crea primero un objeto
SpatialPoints que solo contiene las coordenadas de las unidades espaciales
# Convirtiendo coordenadas a objeto de puntos espaciales
mp.school_sp <- SpatialPoints(mp.school_coord)
- Se crea un objeto
SpatialPointsDataFrame que contiene tanto el objeto SpatialPoints como el data.frame:
# Convirtiendo DataFrame a objeto Data Frame de puntos espaciales
mp.school_spdf <- SpatialPointsDataFrame(mp.school_sp, mp.school)
Se pueden utilizar las coordenadas de contornos espaciales poligonales para mejorar la calidad del mapa y ayudar a identificar ubicaciones. En cuanto al formato, se puede utilizar cualquier formato que se pueda importar en R siempre que contenga las coordenadas geográficas.
- Se puede importar un formato shapefile desde ArcView usando la función
readShapePoly del paquete R maptools o la función readOGR del paquete R rgdal.
- Las dos funciones de GeoXp
polylist2list y spdf2list permiten convertir algún objeto espacial al formato de contornos GeoXp.
shp.file <- system.file("shapes/school.shp", package="GeoXp")[1] # Ruta del archivo
shp.file
[1] "C:/Users/EQUIPO/Documents/R/win-library/4.0/GeoXp/shapes/school.shp"
library("rgdal") # Para importar un formato shapefile
mp_map <- readOGR(shp.file) # Leyendo ("SpatialPolygonsDataFrame")
OGR data source with driver: ESRI Shapefile
Source: "C:\Users\EQUIPO\Documents\R\win-library\4.0\GeoXp\shapes\school.shp", layer: "school"
with 8 features
It has 2 fields
mp.contour <- spdf2list(mp_map)$poly # Convierte objeto espacial a coordenadas del contorno
# Grafico de los datos con plot
plot(mp_map, col=rainbow(8))
plot(mp.school_spdf, pch=20, add=T)

3. Funciones descriptivas
Una llamada a una función GeoXp generalmente abre tres ventanas: dos ventanas gráficas R para el gráfico estadístico y el mapa respectivamente, y una ventana Tk para el menú. Luego, el usuario selecciona en el menú el gráfico en el que desea seleccionar puntos primero. Este gráfico se activa y comienza la selección haciendo clic con el mouse.
Las funciones descriptivas se denominan barmap, boxplotmap, histomap, densitymap, histobarmap, dblehistomap, dbledensitymap, polyboxplotmap, ginimap, plot3dmap y scattermap.
Histomap:
La función histomap() dibuja un histograma de una variable dada name.var y un mapa con sitios de coordenadas de coordenadas.
histomap(mp.school_spdf,"Cost.per.student",carte=mp.contour)

- En este mapa, se puede observar las zonas donde los colegios son más costosos, y también se observa un conjunto pequeño en la zona central, puede deberse a que sea una zona urbana y a otros factores.
Barmap:
La función barmap() dibuja un diagrama de barras (barra vertical) de la variable de factor dada name.var y un mapa con los sitios de coordenadas de coordenadas (sp.obj).
barmap(mp.school_spdf,"index.rurality", carte=mp.contour,
col=c("red","green","purple"))

- En el mapa se puede observar, cómo la zona urbana está más centrada, y luego, a sus alrededores, se va distribuyendo la zona rural.
scattermap
La función scattermap dibuja un diagrama de dispersión de las variables dadas indicadas en names.var y un mapa con sitios de coordenadas de coordenadas (sp.obj).
scattermap(mp.school_spdf,
c("Occupancy.rate", "Cost.per.student"),
quantiles=c(0.25, 0.75),
carte=mp.contour,
pch = 15,
cex = 0.9,
xlab = c("Occupancy rate", "Cost per student"))
- Se puede observar que existe una relación inversa entre el costo por estudiantes y el radio de ocupación, por lo que, a mayor número de estudiantes en la escuela, menor es el costo.

boxplotmap
Diagrama de cajas de una variable dada name.var
boxplotmap(mp.school_spdf,"Occupancy.rate", carte=mp.contour)

- Se puede observar, en el diagrama de cajas que hay algunos valores atípicos en el radio de ocupación, por lo que, hay algunas zonas dónde el radio de ocupación, es alto, es decir, donde el número de estudiantes superaron la cantidad de estudiantes para los que la escuela fue diseñada.
Otras funciones:
angleplotmap: vincula un mapa y un gráfico de ángulos (solo el gráfico de ángulos está activo).
barmap: vincula un mapa y un diagrama de barras.
barnbmap: Vincula un mapa y un diagrama de barras del número de vecinos.
boxplotmap: vincula un mapa y un diagrama de caja y bigotes.
clustermap: Vincula un mapa y un mapa de barras de una variable de agrupamiento (método de k-medias).
dbledensitymap: Vincula un mapa y dos estimadores de densidad.
dblehistomap: Vincula un mapa y dos histogramas.
densitymap: vincula un mapa y un estimador de densidad.
driftmap: esta función está destinada a detectar tendencias (no interactivo).
ginimap: vincula un mapa y una gráfica de Gini (curva de Lorenz).
histobarmap: vincula un mapa a un histograma y un diagrama de barras.
histomap: vincula un mapa y un histograma.
histnbmap: Vincula un mapa y un histograma de las distancias entre vecinos.
moranplotmap: vincula un mapa y un diagrama de dispersión de Moran.
neighbormap: vincula un mapa y un diagrama vecino (diagrama de dispersión de variable contra variable para los sitios vecinos).
pcamap: Vincula un mapa y un diagrama de dispersión de los ejes principales del análisis de componentes principales.
plot3dmap: una versión tridimensional del mapa de dispersión.
polyboxplotmap: Vincula un mapa y un diagrama de caja y bigotes.
scattermap: enlaces a un mapa y un diagrama de dispersión bidimensional.
variocloudmap: vincula un mapa y una nube de variogramas (solo la nube de variogramas es activo).
