Modelo de ocupación: Willow Tit

Objetivos:

Hacer una regresión logística Bayesiana para modelar la probabilidad de ocupación de una especie en función de covariables, utilizando JAGS, bajo dos escenarios:

Asumiendo que no hay errores de detección.
Asumiendo detección imperfecta, incorporando la probabilidad de detección en modelos de ocupación.

Vamos a trabajar con datos de presencia/ausencia de “Willow Tit” (o Carbonero Montano, Poecile montanus) en puntos de muestreo de Suiza (ver Royle y Dorazio 2008, capítulo 3). Los datos provienen de un muestreo anual que se realiza durante la temporada reproductiva de la especie de interés. Las unidades de muestreo son cuadrantes de \(1\) km², en total se relevaron \(237\) cuadrantes, que fueron visitados entre \(2\) y \(3\) veces dentro de la temporada. En cada uno de estos cuadrantes se registró si la especie era detectada por el observador, ya sea de manera visual o acústica (valor = \(1\)), o no era detectada (valor = \(0\)).

A continuación vamos a cargamos los datos y usar el comando str para ver de qué se trata

datos <- read.table("https://github.com/jmmorales/cursoMyD/raw/master/Data/willow.txt", header = TRUE)

str(datos)

## 'data.frame':    237 obs. of  5 variables:
##  $ y.1   : int  0 0 0 0 0 0 0 0 1 0 ...
##  $ y.2   : int  0 0 0 0 0 0 0 0 1 0 ...
##  $ y.3   : int  0 0 0 0 0 0 0 0 0 1 ...
##  $ elev  : int  420 450 1050 1110 510 630 590 530 1140 770 ...
##  $ forest: int  3 21 32 35 2 60 5 13 50 57 ...

En la variable y.1 están los datos de la primera visita, en y.2 la segunda visita y en y.3 la tercer visita. En cada uno de estos casos, si un sitio en particular no pudo ser visitado, se registra como NA, si se detectó a la especie 1, y si no se observó la especie en esa visita un 0. Por otro lado, elev es la altitud (en metros sobre el nivel del mar) de cada sitio y forest es el porcentaje de cobertura de bosque.

El objetivo es relacionar la presencia de esta especie de pájaro con la cobertura de bosque y la altitud. Centramos y estandarizamos las dos covariables continuas para que sean de magnitudes comparables y creamos una nueva covariable, (el cuadrado de la altitud) porque sospechamos que hay una altitud óptima para esta especie.

alti  <- as.vector(scale(datos$elev, center = TRUE))
bosq  <- as.vector(scale(datos$forest, center = TRUE))
alti2 <- alti * alti

# Juntamos los datos de las visitas en un objeto que vamos a llamar "ym"
ym <- as.matrix(cbind(datos$y.1, datos$y.2, datos$y.3))  

#Contamos cuantas veces visitamos cada uno de los sitios
J <- rowSums(!is.na(ym)) 

# Creamos un vector M con el número total de sitios visitados    
M <- nrow(ym)  

# Contamos el número de veces que encontramos a la especie en cada sitio, 
# para generar el vector de observaciones.
y <- rowSums(ym, na.rm = TRUE)

Modelo de Detección Perfecta:

Ahora vamos a hacer una regresión logística Bayesiana, asumiendo que no hay error de observación. Esto quiere decir que, cuando no encontramos a la especie en un sitio es porque no estaba presente (Esto se conoce como “Detección perfecta”). Cuando esto ocurre, nuestra observación (que llamamos y) es igual al verdadero proceso de ocupación de la especie (que vamos a llamar z). La probabilidad de ocurrencia, que vamos a llamar \(\psi\), es el valor esperado de la variable de ocupación.

cat(file = "WillowDP.bug",
"
model { 
  for(i in 1: M){      
    y[i] ~ dbin(psi[i], J[i]) 
    logit(psi[i]) <- b0 + b1 * alti[i] + b2 * alti2[i] + b3 * bosq[i] 
  }

  b0 ~ dnorm(0, 0.01) 
  b1 ~ dnorm(0, 0.01) 
  b2 ~ dnorm(0, 0.01) 
  b3 ~ dnorm(0, 0.01) 

  logit(psi0) <- b0
}
")

Como de costumbre, tenemos que armar una lista de los datos que le vamos a pasar al JAGS, escribir una función para los valores iniciales de las cadenas Markovianas, definir la lista de parámetros que queremos guardar y los números de iteraciones, “thinning”, burnin y cadenas.

data <- list ("y", "J", "M", "bosq", "alti", "alti2")

inits <- function(){
  list ( b0 = rnorm(1),
         b1 = rnorm(1),
         b2 = rnorm(1),
         b3 = rnorm(1))
}

parameters <- c("b0", "b1", "b2", "b3", "psi0") 

ni <- 5000  
nt <- 4     
nb <- 1000  
nc <- 3

Finalmente podemos llamar a JAGS

library(jagsUI)

wb.sim <- jags(data, inits, parameters, "willowDP.bug", 
               n.chains = nc, n.thin = nt, n.iter = ni, n.burnin = nb)

## 
## Processing function input....... 
## 
## Done. 
##  
## Compiling model graph
##    Resolving undeclared variables
##    Allocating nodes
## Graph information:
##    Observed stochastic nodes: 237
##    Unobserved stochastic nodes: 4
##    Total graph size: 1999
## 
## Initializing model
## 
## Adaptive phase..... 
## Adaptive phase complete 
##  
## 
##  Burn-in phase, 1000 iterations x 3 chains 
##  
## 
## Sampling from joint posterior, 4000 iterations x 3 chains 
##  
## 
## Calculating statistics....... 
## 
## Done.

Siempre que ajustamos un modelo usando MCMC tenemos que asegurarnos que las cadenas hayan convergido y que el tamaño efectivo de las muestras de las posteriores sean razonables:

print(wb.sim)

## JAGS output for model 'willowDP.bug', generated by jagsUI.
## Estimates based on 3 chains of 5000 iterations,
## adaptation = 100 iterations (sufficient),
## burn-in = 1000 iterations and thin rate = 4,
## yielding 3000 total samples from the joint posterior. 
## MCMC ran for 0.096 minutes at time 2021-12-08 14:44:03.
## 
##             mean    sd    2.5%     50%   97.5% overlap0 f  Rhat n.eff
## b0        -0.874 0.174  -1.216  -0.874  -0.527    FALSE 1 1.019   129
## b1         2.106 0.196   1.767   2.089   2.534    FALSE 1 1.107    30
## b2        -0.959 0.173  -1.331  -0.956  -0.630    FALSE 1 1.048    49
## b3         0.842 0.135   0.566   0.844   1.096    FALSE 1 1.013   261
## psi0       0.296 0.036   0.229   0.295   0.371    FALSE 1 1.021   122
## deviance 456.316 2.639 453.036 455.737 462.954    FALSE 1 1.012   193
## 
## **WARNING** Rhat values indicate convergence failure. 
## Rhat is the potential scale reduction factor (at convergence, Rhat=1). 
## For each parameter, n.eff is a crude measure of effective sample size. 
## 
## overlap0 checks if 0 falls in the parameter's 95% credible interval.
## f is the proportion of the posterior with the same sign as the mean;
## i.e., our confidence that the parameter is positive or negative.
## 
## DIC info: (pD = var(deviance)/2) 
## pD = 3.4 and DIC = 459.764 
## DIC is an estimate of expected predictive error (lower is better).

Vemos que tanto la elevación como la cobertura de bosques tienen coeficientes positivos y distintos de cero mientras que la elevación al cuadrado tiene un coeficiente negativo (Implica que hay un máximo de probabilidad de ocurrencia a elevaciones intermedias). Vemos también que la probabilidad de ocurrencia para condiciones ambientales promedio es de 0.296.

Podemos graficar cómo cambian las probabilidades de ocurrencia predichas a partir de las posteriores de los coeficientes

op <- par(mfrow = c(1, 2), mar = c(5, 5, 3, 2) + 0.1, mgp = c(3.5, 1, 0), cex.lab = 1.3 , font.lab = 2, cex.axis = 1.3, bty = "n", las = 1)

plot(datos$elev, plogis(wb.sim$mean$b0 + wb.sim$mean$b1 * alti + wb.sim$mean$b2 * alti2), pch = 21, bg = "gray", xlab = "Elevación", ylab = "Probabilidad de Ocurrencia")

plot(datos$forest, plogis(wb.sim$mean$b0 + wb.sim$mean$b3 * bosq), pch = 21, bg = "gray", xlab = "Cobertura de bosque", ylab = "Probabilidad de Ocurrencia")

par(op)

Modelo de Detección Imperfecta:

Si consideramos que es posible que no se detecte a la especie en un sitio aunque esté presente, podemos separar la presencia/ausencia “observada” de la “verdadera”, y distinguir entre la “detectabilidad” y la “ocurrencia”.

Cuando la detección es imperfecta, los valores \(0\) en nuestros datos pueden provenir de dos fuentes: (1) error de muestreo, o (2) ausencias reales. En la práctica no podemos saber cuál es la fuente que originó un valor \(0\) en los datos, por lo que tenemos que diferenciar entre la observación y el verdadero proceso de ocupación de la especie, y explicitar la forma en la que se conectan ambos procesos.

Nuestra observación (y), depende de la probabilidad de detección (que llamaremos p). El verdadero proceso de ocupación de la especie (z), pasa a ser una variable oculta, que se expresa como una variable de distribución Bernoulli (una Binomial con \(N = 1\)) cuya probabilidad de éxito (probabilidad de ocupación, \(\psi\)) depende de covariables como en el caso anterior.

La conexión entre esa variable oculta z con las observaciones ocurre a través de la probabilidad de detección p. Esto se hace definiendo a la observación (y) como un proceso Binomial, cuya probabilidad de éxito es igual al producto entre z y p (ver como se expresa en el modelo BUGS de abajo).

Esta multiplicación permite que cuando z vale \(0\) (es decir, la especie está ausente), la probabilidad de éxito del proceso de observación se hace \(0\) y tenemos un “cero verdadero” en los datos (cero generado por la ausencia real). Cuando z vale \(1\), entonces la probabilidad de éxito de la binomial de las observaciones está dada por la probabilidad de detección p y podemos tener falsos negativos (ceros generados por la “no detección” en el muestreo).

Esta posibilidad de separar el proceso ecológico (presencia de una especie en función de variables ambientales en este caso) del proceso de observación, es una forma de modelado jerárquico o multinivel que resulta relativamente fácil de realizar con herramientas de análisis Bayesiano. No es poca cosa…

cat(file = "willow_DI.bug",
    "
 #Likelihood:
    model { 
     for(i in 1: M){ 
       y[i] ~ dbin(pex[i], J[i]) 
       pex[i] <- z[i] * p   
       z[i] ~ dbin(psi[i], 1)      
       logit(psi[i]) <- b0 + b1 * alti[i] + b2 * alti2[i] + b3 * bosq[i] 
    } 
  #Previas: 
    p  ~ dunif(0,1)                
    b0 ~ dnorm(0, 0.01) 
    b1 ~ dnorm(0, 0.01) 
    b2 ~ dnorm(0, 0.01) 
    b3 ~ dnorm(0, 0.01) 
    logit(psi0) <- b0
    }
    ")

Los datos que usamos para este modelo son los mismos que en el caso anterior. En la función inits tenemos que incluir valores iniciales para z y para p.

data <- list ( "y", "J", "M", "bosq", "alti", "alti2")
inits <- function(){
  list (z = rbinom(M, 1, 1),
        b0 = 4,
        p = runif(1),
        b1 = rnorm(1),
        b2 = rnorm(1),
        b3 = rnorm(1))
}

parameters <- c("p", "b0", "b1", "b2", "b3", "psi0")  
ni <- 5000  
nt <- 4     
nb <- 1000  
nc <- 3     

w.sim <- jags(data, inits, parameters, "willow_DI.bug", n.chains = nc, n.thin = nt, n.iter = ni, n.burnin = nb)

## 
## Processing function input....... 
## 
## Done. 
##  
## Compiling model graph
##    Resolving undeclared variables
##    Allocating nodes
## Graph information:
##    Observed stochastic nodes: 237
##    Unobserved stochastic nodes: 242
##    Total graph size: 2713
## 
## Initializing model
## 
## Adaptive phase..... 
## Adaptive phase complete 
##  
## 
##  Burn-in phase, 1000 iterations x 3 chains 
##  
## 
## Sampling from joint posterior, 4000 iterations x 3 chains 
##  
## 
## Calculating statistics....... 
## 
## Done.

print(w.sim)

## JAGS output for model 'willow_DI.bug', generated by jagsUI.
## Estimates based on 3 chains of 5000 iterations,
## adaptation = 100 iterations (sufficient),
## burn-in = 1000 iterations and thin rate = 4,
## yielding 3000 total samples from the joint posterior. 
## MCMC ran for 0.164 minutes at time 2021-12-08 14:44:10.
## 
##             mean     sd    2.5%     50%   97.5% overlap0     f  Rhat n.eff
## p          0.787  0.029   0.723   0.788   0.841    FALSE 1.000 1.001  1981
## b0        -0.207  0.274  -0.740  -0.208   0.345     TRUE 0.774 1.000  3000
## b1         2.065  0.303   1.495   2.054   2.707    FALSE 1.000 1.002   752
## b2        -1.147  0.277  -1.740  -1.141  -0.635    FALSE 1.000 1.000  3000
## b3         0.874  0.237   0.414   0.867   1.351    FALSE 1.000 1.000  2964
## psi0       0.449  0.067   0.323   0.448   0.585    FALSE 1.000 1.000  3000
## deviance 172.761 10.354 160.638 170.612 197.326    FALSE 1.000 1.002  3000
## 
## Successful convergence based on Rhat values (all < 1.1). 
## Rhat is the potential scale reduction factor (at convergence, Rhat=1). 
## For each parameter, n.eff is a crude measure of effective sample size. 
## 
## overlap0 checks if 0 falls in the parameter's 95% credible interval.
## f is the proportion of the posterior with the same sign as the mean;
## i.e., our confidence that the parameter is positive or negative.
## 
## DIC info: (pD = var(deviance)/2) 
## pD = 53.6 and DIC = 226.373 
## DIC is an estimate of expected predictive error (lower is better).

Vemos que la probabilidad de detección es relativamente alta y que las variables ambientales tienen coeficientes similares a los de modelo anterior. La probabilidad de ocurrencia en condiciones promedio aumentó.

Para graficar la posterior de la probabilidad de ocurrencia en condiciones promedio hacemos:

op <- par(cex.lab = 1.3 , font.lab = 2, cex.axis = 1.3, bty = "n", las = 1)
plot(density(w.sim$sims.list$psi0), main = "", xlab = "Pr. ocupación", lwd = 2)

par(op)

Podemos comparar gráficamente cómo los dos modelos producen distintos valores esperados de probabilidad de ocupación (el modelo de detección imperfecta está en rojo).

op <- par(mfrow = c(1, 2), mar = c(5, 5, 3, 2) + 0.1, mgp = c(3.5, 1, 0), cex.lab = 1.3 , font.lab = 2, cex.axis = 1.3, bty = "n", las = 1)

plot(datos$elev, plogis(wb.sim$mean$b0 + wb.sim$mean$b1 * alti + wb.sim$mean$b2 * alti2), pch = 21, bg = "gray", xlab = "Elevación", ylab = "Probabilidad de Ocurrencia", ylim = c(0, 1)) 

points(datos$elev, plogis(w.sim$mean$b0+w.sim$mean$b1*alti + w.sim$mean$b2*alti2), col = 2) 

plot(datos$forest, plogis(wb.sim$mean$b0+wb.sim$mean$b3*bosq), pch = 21, bg = "gray", xlab="Cobertura de bosque", ylab="Probabilidad de Ocurrencia", ylim = c(0, 1))
points(datos$forest, plogis(w.sim$mean$b0+w.sim$mean$b3*bosq), col = 2)

par(op)

Juan Manuel Morales. 6 de Septiembre del 2015. Última actualización: 2021-12-08