Colegio de Postgraduados, México

COA-501 Herramientas de computo para investigadores

Profesor: Dr. Juan Manuel González Camacho

Introducción

Una manera de reducir problemas de multicolinearidad, es remover aquellas variables que se encuentren correlacionadas. Si bien, no existe un consenso respecto al lumbral o límite desde el punto de vista estadístico.

En varios artículos de modelos de distribución de especies, hacen referencia a un umbral de correlación de r=0.8 (Menar, 2002), así como de r=0.7 (Guisan et al, 2017). Para lo cual puede recurrirse a un análisis de correlación entre pares.

Sin embargo, en ocasiones no es posible identificar de manera clara la presencia de correlación, por medio de un análisis de correlación de pares. Por lo cual, es recomendable llevar a cabo un análisis empleando el factor de inflación de la varianza (VIF).

El factor de inflación de la varianza, estima la severidad del efecto de multicolinealidad, midiendo el grado en que la varianza en una regresión aumenta debido a colinealidad, en comparación con el uso de variables no correlacionadas.

Se recomiendan las pruebas VIF, especialmente cuando se añaden numerosas variables a una regresión, ya que detectan la estructura de correlación lineal de las variables.

Objetivos

Dataset

Inicio

# Remoción de objetos del ambiente de trabajo (Limpieza) 
rm(list=ls())

Carga de paquetes a emplear

library(sp)         # Manipulación de datos espaciales
library(rgdal)      # Operaciones con datos Geoespaciales
library(raster)     # Creación de archivos raster
library(dismo)      # Modelos de distribución de especies
library(maptools)   # Combinar datos espaciales
library(ecospat)    # Métodos en ecología espacial
library(ade4)
library(ape)
library(gbm)

Área de trabajo

# Definir directorio de trabajo 
setwd("C:/Users/pedro_000/Desktop/Nueva carpeta")

Obtención de dataset

Variables bioclimaticas de Worldclim ajustadas para México por Cuervo et al, 2013. Las cuales se obtuvieron de la interpolación de datos meteorológicos del periodo de 1910 - 2009. Datos en formatos matriciales, tiff y rst para desplegar directamente en SIG. La resolución espacial es de 30 arcos de segundo (≈1 km),con sistema de referencia latitud/longitud (no proyectadas) y datum WGS84.

# Descarga remota de dataset variables bioclimáticas ajustadas para México
# download.file("http://idrisi.uaemex.mx/images/Clima/BioClim(Tiff).rar", "Nueva carpeta", method = "auto")
# Extracción de archivos de variables bioclimáticas
# unzip(BioClim(Tiff))

Variables bioclimáticas

Cuervo-Robayo A. P., O. Téllez-Valdés, M. Gómez, C. Venegas-Barrera, J. Manjarrez y E. Martínez-Meyer. (2013). An update of high-resolution monthly climate surfaces for Mexico. International Journal of Climatology. Doi: 10.1002/joc.3848. email: link: http://idrisi.uaemex.mx/distribucion/superficies-climaticas-para-mexico

#  BIO1 Temperatura media anual
#  BIO2 Rango de temperaturas diurnas
#  BIO3 Isotermalidad (BIO2/BIO7) (* 100)
#  BIO4 Estacionalidad en la temperatura (desviación estándar * 100)
#  BIO5 Temperatura máxima del mes más cálido
#  BIO6 Temperatura mínima del mes más frío
#  BIO7 Rango anual de temperatura (BIO5-BIO6)
#  BIO8 Temperatura media del trimestre más lluvioso
#  BIO9 Temperatura media del trimestre más seco
#  BIO10 Temperatura media del trimestre más cálido
#  BIO11 Temperatura media del trimestre más frío
#  BIO12 Precipitación anual
#  BIO13 Precipitación del mes más lluvioso
#  BIO14 Precipitación del mes más seco
#  BIO15 Estacionalidad en la precipitación (coeficiente de variación)
#  BIO16 Precipitación del trimestre más lluvioso
#  BIO17 Precipitación del trimestre más seco
#  BIO18 Precipitación del trimestre más cálido
#  BIO19 Precipitación del trimestre más frío

Archivos en formato ascii a raster

Convierte un archivo ASCII que representa datos ráster en un dataset ráster

bio1 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio1.asc")
bio2 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio2.asc")
bio3 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio3.asc")
bio4 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio4.asc")
bio5 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio5.asc")
bio6 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio6.asc")
bio7 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio7.asc")
bio8 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio8.asc")
bio9 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio9.asc")
bio10 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio10.asc")
bio11 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio11.asc")
bio12 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio12.asc")
bio13 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio13.asc")
bio14 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio14.asc")
bio15 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio15.asc")
bio16 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio16.asc")
bio17 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio17.asc")
bio18 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio18.asc")
bio19 <- raster("I:/Research_2019/Bioclim_2019/ASCII_BioclimaticVariables/bio19.asc")

Exploración inicial de dataset

# Explorar el tamaño del archivo raster, así como la resolución
bbox(bio1); ncol(bio1); nrow(bio1); res(bio1)
##     min max
## s1 -122 -79
## s2   13  34
## [1] 5160
## [1] 2520
## [1] 0.008333333 0.008333333
# resolucion 0.0083x0.0083 = 30 arc segundo resolución 30.9x30 m = 927 m aprox. 1 km x 1 km 

# Tipo de archivo
class(bio1)
## [1] "RasterLayer"
## attr(,"package")
## [1] "raster"
# Área del raster latitudes 13 a 34 a longitudes de -79 a -122  
extent(bio1)
## class      : Extent 
## xmin       : -122 
## xmax       : -79 
## ymin       : 13 
## ymax       : 34
# Proyección del raster
projection(bio1)
## [1] "+proj=longlat +datum=WGS84 +no_defs +ellps=WGS84 +towgs84=0,0,0"

Despliegue de raster

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.