La librería GWmodel (Modelos ponderados geográficamente (GW)) incluye funciones para calibrar, estadísticas de resumen de GW, análisis de componentes principales de GW, análisis discriminante de GW y varias formas de regresión de GW; algunos de los cuales se proporcionan en formas básicas y robustas (resistentes a valores atípicos).
library(GWmodel)
Son los datos de participación de votantes y personajes sociales en el Gran Dublín para las elecciones generales de 2002 y el censo de 2002. Algunos de sus atributos son:
data('DubVoter')
#class(Dub.voter) # SpatialPolygonsDataFrame
dim(Dub.voter)
head(Dub.voter)
#?Dub.voter
Esta función calcula GWSS básico y robusto. Esto incluye medias ponderadas geográficamente, desviaciones estándar y sesgo.
Estadísticos = gwss(Dub.voter,
vars = c("GenEl2004", "LARent", "Unempl"),
kernel = "bisquare", # Funcion kernel
adaptive = TRUE, # Bw es adaptativo a vecinos mas cercanos
bw = 48) # Ancho de banda
Estadísticos
***********************************************************************
* Package GWmodel *
***********************************************************************
***********************Calibration information*************************
Local summary statistics calculated for variables:
GenEl2004 LARent Unempl
Number of summary points: 322
Kernel function: bisquare
Summary points: the same locations as observations are used.
Adaptive bandwidth: 48 (number of nearest neighbours)
Distance metric: Euclidean distance metric is used.
************************Local Summary Statistics:**********************
Summary information for Local means:
Min. 1st Qu. Median 3rd Qu. Max.
GenEl2004_LM 51.5132 54.0718 55.1561 56.1063 57.5607
LARent_LM 11.0421 14.4222 17.0290 20.2421 31.7201
Unempl_LM 5.7340 6.9811 8.0931 8.9572 9.9021
Summary information for local standard deviation :
Min. 1st Qu. Median 3rd Qu. Max.
GenEl2004_LSD 7.4372 8.6188 8.9408 9.4066 9.8911
LARent_LSD 20.1806 24.3825 26.5003 29.6696 37.4172
Unempl_LSD 4.1540 4.9932 5.4572 5.7331 6.3354
Summary information for local variance :
Min. 1st Qu. Median 3rd Qu. Max.
GenEl2004_LVar 55.312 74.284 79.938 88.484 97.834
LARent_LVar 407.255 594.505 702.265 880.283 1400.046
Unempl_LVar 17.256 24.932 29.782 32.868 40.137
Summary information for Local skewness:
Min. 1st Qu. Median 3rd Qu. Max.
GenEl2004_LSKe -0.80507 -0.68985 -0.57686 -0.45446 -0.0863
LARent_LSKe 0.96624 1.80785 2.08370 2.42642 3.1065
Unempl_LSKe 0.86075 1.19091 1.41118 1.64968 2.1461
Summary information for localized coefficient of variation:
Min. 1st Qu. Median 3rd Qu. Max.
GenEl2004_LCV 0.12932 0.15426 0.16272 0.17508 0.1904
LARent_LCV 1.17356 1.43387 1.58074 1.70126 1.8826
Unempl_LCV 0.57279 0.64790 0.68731 0.70391 0.7601
Summary information for localized Covariance and Correlation between these variables:
Min. 1st Qu. Median 3rd Qu.
Cov_GenEl2004.LARent -280.10224 -198.52680 -166.86324 -145.23307
Cov_GenEl2004.Unempl -43.41703 -35.80206 -32.21179 -28.82365
Cov_LARent.Unempl 59.11462 82.82905 94.62761 108.94614
Corr_GenEl2004.LARent -0.76412 -0.70794 -0.69022 -0.67828
Corr_GenEl2004.Unempl -0.71371 -0.69029 -0.66717 -0.63791
Corr_LARent.Unempl 0.54758 0.62270 0.66601 0.68135
Spearman_rho_GenEl2004.LARent -0.80902 -0.77184 -0.73452 -0.69298
Spearman_rho_GenEl2004.Unempl -0.73661 -0.70675 -0.68729 -0.65235
Spearman_rho_LARent.Unempl 0.72420 0.74965 0.77185 0.78776
Max.
Cov_GenEl2004.LARent -95.9297
Cov_GenEl2004.Unempl -19.8503
Cov_LARent.Unempl 134.7817
Corr_GenEl2004.LARent -0.6346
Corr_GenEl2004.Unempl -0.5598
Corr_LARent.Unempl 0.7025
Spearman_rho_GenEl2004.LARent -0.6079
Spearman_rho_GenEl2004.Unempl -0.6195
Spearman_rho_LARent.Unempl 0.8150
************************************************************************
Como se puede observar, la función gwss calculó para cada variable escogida: GenEl2004, LARent, Unempl, la media, desviación estándar, varianza, asimetría, coeficiente de variación, covarianza y correlación entre las mismas, locales.
Además se agregan algunos parámetros, detalles y paletas de colores, para los gráficos
# Parámetros para graficar
#---------------------------------------------------------------------
# Simbolo Norte
map.na = list("SpatialPolygonsRescale", layout.north.arrow(),
offset = c(329000, 261500), scale = 4000, col = 1)
# Barra 0-5km
map.scale.1 = list("SpatialPolygonsRescale", layout.scale.bar(),
offset = c(326500, 216000), scale = 5000, col = 1,
fill = c("transparent", "blue"))
# 0 km
map.scale.2 = list("sp.text", c(326500, 217900), "0", cex = 0.8, col = 1)
# 5 km
map.scale.3 = list("sp.text", c(331500, 217900), "5km", cex = 0.8, col = 1)
map.layout = list(map.na, map.scale.1, map.scale.2, map.scale.3)
# Paleta de colores
#----------------------------------------------------------------
library("RColorBrewer")
mypalette = brewer.pal(9, "YlGnBu")
mypalette.1 = brewer.pal(8, "Reds")
mypalette.2 = brewer.pal(6, "Greens")
A continuación se grafica la media local para el porcentaje de personas votaron en las elecciones del 2004.
Podemos observar que en el centro del mapa se concentran el menor porcentaje de personas que votaron en las elecciones del 2004, mientras que en el sureste se concentran el mayor porcentaje. Esta variable, varía en las distintas regiones del mapa.
A continuación se grafica la desviación estándar local para el porcentaje de personas que votaron en las elecciones del 2004.
spplot(Estadisticos$SDF,
"GenEl2004_LSD",
key.space = "right",
col.regions = mypalette.1,
cuts = 7,
main = "Desviación estándar GP para GenEl2004",
sp.layout = map.layout)
Esta gráfica indica que en el centro del mapa hubo mayor dispersión en el porcentaje de votantes de las elecciones del 2004, es decir, el porcentajes de votos varió en esa zona. Mientras que en el sureste del mapa hubo menor dispersión y por ende, el porcentaje de votantes fue similar.
A continuación se grafica el coeficiente de variación local para el porcentaje de personas que votaron en las elecciones del 2004.
En estadística, mientras mayor sea el valor del coeficiente de variación hay mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Esta gráfica indica que en el centro del mapa hubo mayor dispersión en el porcentaje de votantes de las elecciones del 2004, es decir, el porcentajes de votos varió en esa zona. Mientras que en el sureste del mapa hubo menor dispersión y por ende, el porcentaje de votantes fue similar. Sin embargo, al variar entre 0.12 y 0.19 indica que el porcentaje de personas que votaron no varió mucho.
A continuación se grafica la correlación local entre el porcentaje de personas que votaron en las elecciones del 2004 y el porcentaje de personas que son renteros de autoridades locales.
spplot(Estadisticos$SDF,
"Corr_GenEl2004.LARent",
key.space = "right",
col.regions = mypalette,
cut=5,
main = "Correlación GP entre LARent y GenEl",
sp.layout = map.layout)
Como se puede observar, los valores de la correlación entre estas dos variables resultaron negativos, por lo que existe una relación inversa de las variables. Es decir, entre menor es el porcentaje de personas renteras de autoridades locales, mayor es el número de personas que votaron y viceversa. Entre más claro es el color, dicha relación inversa se hace más sólida, por ejemplo en el centro del mapa.