Una manera de reducir problemas de multicolinearidad, es remover aquellas variables que se encuentren correlacionadas. Si bien, no existe un consenso respecto al lumbral o límite desde el punto de vista estadístico.
En varios artículos de modelos de distribución de especies, hacen referencia a un umbral de correlación de r=0.8 (Menar, 2002), así como de r=0.7 (Guisan et al, 2017). Para lo cual puede recurrirse a un análisis de correlación entre pares.
Sin embargo, en ocasiones no es posible identificar de manera clara la presencia de correlación, por medio de un análisis de correlación de pares. Por lo cual, es recomendable llevar a cabo un análisis empleando el factor de inflación de la varianza (VIF).
El factor de inflación de la varianza, estima la severidad del efecto de multicolinealidad, midiendo el grado en que la varianza en una regresión aumenta debido a colinealidad, en comparación con el uso de variables no correlacionadas.
Se recomiendan las pruebas VIF, especialmente cuando se añaden numerosas variables a una regresión, ya que detectan la estructura de correlación lineal de las variables.
Realizar la selección de variables empleando el VIF, como una herramienta para su uso en modelos de distribución de especies.
Llevar a cabo un ánalisis de componentes principales de variables descriptoras de la distribución de especies.
Mostrar la bondad de R, en el análisis de grandes volumenes de información; integrando procesos de obtención y manipulación de datos, análisis estadístico y SIG´s.
Crear un fichero html usando markdown para su publicación on-line, como estratégia para compartir y retroalimentar código de R aplicado a un área en particular.
Poner en práctica conocimientos adquiridos, así como el uso de herramientas de cómputo, abordados en el curso.
# Remoción de objetos del ambiente de trabajo (Limpieza)
rm(list=ls())
library(sp) # Manipulación de datos espaciales
library(rgdal) # Operaciones con datos Geoespaciales
library(raster) # Creación de archivos raster
library(dismo) # Modelos de distribución de especies
library(maptools) # Combinar datos espaciales
library(ecospat) # Métodos en ecología espacial
library(ade4)
library(ape)
library(gbm)
# Definir directorio de trabajo
setwd("C:/Users/pedro_000/Desktop/Nueva carpeta")
Variables bioclimaticas de Worldclim ajustadas para México por Cuervo et al, 2013. Las cuales se obtuvieron de la interpolación de datos meteorológicos del periodo de 1910 - 2009. Datos en formatos matriciales, tiff y rst para desplegar directamente en SIG. La resolución espacial es de 30 arcos de segundo (≈1 km),con sistema de referencia latitud/longitud (no proyectadas) y datum WGS84.
# Descarga remota de dataset variables bioclimáticas ajustadas para México
# download.file("http://idrisi.uaemex.mx/images/Clima/BioClim(Tiff).rar", "Nueva carpeta", method = "auto")
# Extracción de archivos de variables bioclimáticas
# unzip(BioClim(Tiff))
Cuervo-Robayo A. P., O. Téllez-Valdés, M. Gómez, C. Venegas-Barrera, J. Manjarrez y E. Martínez-Meyer. (2013). An update of high-resolution monthly climate surfaces for Mexico. International Journal of Climatology. Doi: 10.1002/joc.3848. email: ancuervo@gmail.com link: http://idrisi.uaemex.mx/distribucion/superficies-climaticas-para-mexico
# BIO1 Temperatura media anual
# BIO2 Rango de temperaturas diurnas
# BIO3 Isotermalidad (BIO2/BIO7) (* 100)
# BIO4 Estacionalidad en la temperatura (desviación estándar * 100)
# BIO5 Temperatura máxima del mes más cálido
# BIO6 Temperatura mínima del mes más frío
# BIO7 Rango anual de temperatura (BIO5-BIO6)
# BIO8 Temperatura media del trimestre más lluvioso
# BIO9 Temperatura media del trimestre más seco
# BIO10 Temperatura media del trimestre más cálido
# BIO11 Temperatura media del trimestre más frío
# BIO12 Precipitación anual
# BIO13 Precipitación del mes más lluvioso
# BIO14 Precipitación del mes más seco
# BIO15 Estacionalidad en la precipitación (coeficiente de variación)
# BIO16 Precipitación del trimestre más lluvioso
# BIO17 Precipitación del trimestre más seco
# BIO18 Precipitación del trimestre más cálido
# BIO19 Precipitación del trimestre más frío
Convierte un archivo ASCII que representa datos ráster en un dataset ráster
bio1 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio1.asc")
bio2 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio2.asc")
bio3 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio3.asc")
bio4 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio4.asc")
bio5 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio5.asc")
bio6 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio6.asc")
bio7 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio7.asc")
bio8 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio8.asc")
bio9 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio9.asc")
bio10 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio10.asc")
bio11 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio11.asc")
bio12 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio12.asc")
bio13 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio13.asc")
bio14 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio14.asc")
bio15 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio15.asc")
bio16 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio16.asc")
bio17 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio17.asc")
bio18 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio18.asc")
bio19 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio19.asc")
# Explorar el tamaño del archivo raster, así como la resolución
bbox(bio1); ncol(bio1); nrow(bio1); res(bio1)
## min max
## s1 -122 -79
## s2 13 34
## [1] 5160
## [1] 2520
## [1] 0.008333333 0.008333333
# resolucion 0.0083x0.0083 = 30 arc segundo resolución 30.9x30 m = 927 m aprox. 1 km x 1 km
# Tipo de archivo
class(bio1)
## [1] "RasterLayer"
## attr(,"package")
## [1] "raster"
# Área del raster latitudes 13 a 34 a longitudes de -79 a -122
extent(bio1)
## class : Extent
## xmin : -122
## xmax : -79
## ymin : 13
## ymax : 34
# Proyección del raster
projection(bio1)
## [1] "+proj=longlat +datum=WGS84 +no_defs +ellps=WGS84 +towgs84=0,0,0"
Note that the echo = FALSE
parameter was added to the code chunk to prevent printing of the R code that generated the plot.