JAGS
La captura-recaptura (CR) es uno de los métodos más frecuentemente empleados en los estudios de poblaciones animales (Sutherland, 2006).
Los métodos CR tienen gran tradición en el estudio de animales con relativa facilidad para su captura e identificación de individuos (Amstrup et al., 2005; McCrea y Morgan, 2014).
Actualmente con el auge de métodos no invasivos como el foto-trampeo (O’Connell et al., 2011) y los moleculares para identificar individuos a través del ADN (Mills et al., 2000), los modelos CR siguen en boga y se ha extendido su aplicación a una gran variedad de especies difíciles de capturar físicamente y/o que son raras (Thompson, 2004).
En particular, los métodos captura-recaptura hacen uso de datos del historial de encuentros individuales, llamados también historias de captura; es decir, un registro de cada individuo capturado y recapturado en las trampas durante un periodo en el cual se considera espacial y demográficamente cerrada la población (McCrea y Morgan, 2014).
El número de animales que esperamos contar (c ) está dado por:
\[E(c)\ =\ N\ \times \ p\]
donde N es la abundancia y p la probabilidad de detección o captura.
A partir de esto, la fórmula canónica para estimar la abundancia poblacional (N) a partir del conteo de solo una fracción de individuos de la misma población (c) es:
\[\widehat{N}=c\ /\ \widehat{p}\]
donde p es la probabilidad de encuentro o detección de los individuos y habitualmente esta probabilidad es menor a 1.0 (Royle y Dorazio, 2008). En los pocos casos en los que p = 1.0 nos referimos a un censo poblacional (Lancia et al., 1994).
En consecuencia, la mayoría de los métodos de estimación calculan de alguna manera esta probabilidad de detección en función de los datos mismos de conteo y de alguna otra variable asociada.
En el caso de los métodos de captura-recaptura (CR) clásicos, la idea central es que marcando a cierto número de individuos de una población (o reconociéndolos con alguna marca natural que los pueda identificar individualmente), es posible estimar varios parámetros fundamentales, entre los que destacan la abundancia (tamaño de la población) y la sobrevivencia (McCrea y Morgan, 2014).
Una de las aproximaciones más generales para estimar N y p con los CR en poblaciones cerradas se basa en el modelo de Lincoln-Petersen el cual emplea datos de dos periodos de muestreo y calcula la abundancia como:
\[N\ =\ (n_{1}\ \times n_{2})\ /\ m_{2}\]
donde n1 es el número de animales capturados, marcados y liberados en el primer muestreo, n2 es el número de animales nuevos capturados en el segundo muestreo, y m2 es el número de individuos recapturados (Lukacs, 2010).
En este caso, el estimador de la probabilidad de detección es:
\[\widehat{p}\ =\ m_{2}\ /\ n_{1}\]
A partir de este modelo básico se han desarrollado otros modelos CR. Los diferentes modelos se diferencian en cómo parametrizan diferentes variables, principalmente la probabilidad de encuentro.
En su versión más sencilla, los CR suponen que la población de interés está cerrada geográfica y demográficamente, es decir, sin movimiento dentro o fuera del área de estudio, y sin nacimientos o fallecimientos durante el periodo del estudio.
Si este supuesto no se cumple o bien se tienen datos de varias temporadas y/o años, entonces se pueden aplicar modelos CR para poblaciones abiertas (Lukacs, 2010).
Modelos:
M0 : supone que esta probabilidad es constante u homogénea entre los individuos de la población de estudio y no cambia a través del tiempo;
Mt : supone que la probabilidad de detección es heterogénea y varía entre individuos,
Mb : entre ocasiones,
Mtb : o ambas (Kéry y Schaub, 2012).
En particular, se recomienda revisar el manual del programa `MARK donde se detallan estos y otros modelos (Cooch y White, 2014).
Las aproximaciones convencionales han tratado de estimar un área efectiva del muestreo conocida como ESA (efective sampling area) utilizando métodos no vinculados formalmente por medio de un modelo estadístico a los datos de la historia de encuentros observados (Otis et al., 1978).
Por ejemplo con oso negro:
Luego se calcula el “área efectiva de muestreo (ESW)” tomando como crieterio, por ejemplo, la mitad de la distancia máxima que recorre un aninal al día (1/2MMDM) como:
Estimación de la densidad (D) en los modelos CR:
\[\widehat{D}\ = \ \widehat{N} / \ ESW\]
Basado en el capítulo: 4.2.4. “Black bear on Fort Drum” del libro Spatial Capture Recapture de Royle et al. (2014):
En este ejemplo particularmente se aplica el modelo M0 empleando una solución bayesiana en JAGS
.
# se carga librería:
library(scrbook)
# datos:
data("beardata")
# gráfico de las trampas:
trapmat <- beardata$trapmat
#plot(trapmat) # ubicación de trampas
# se preparan los datos:
nind <- dim(beardata$bearArray)[1] # número de osos
K <- dim(beardata$bearArray)[3] # número de ocasiones muestreos
ntraps <- dim(beardata$bearArray)[2] # número de trampas
M <- 175 # aumento de datos
nz <- M - nind
Yaug <- array(0, dim= c(M, ntraps, K))
Yaug[1:nind,,] <- beardata$bearArray
y <- apply(Yaug, c(1,3), sum)
y[y > 1] <- 1
# para crear un "buffer" se carga:
library(rgeos)
library(sp)
p1 <- Polygon(rbind(trapmat, trapmat[1,]))
p2 <- Polygons(list(p1= p1), ID= 1)
p3 <- SpatialPolygons(list(p2= p2))
p1ch <- gConvexHull(p3)
bp1 <- (gBuffer(p1ch, width = 1)) # Ojo: buffer= 2.19 km
# gráfico:
plot(bp1, col= "lightgray", main= "Fort Drum")
plot(p1ch, border= "red", lwd= 2, add= T)
points(trapmat)
(S <- gArea(bp1)) # resultado en km2
## [1] 208.2032
JAGS
library(jagsUI)
# cargar datos:
data0 <- list(y= y, M= M, K= K)
# Modelo BUGS / JAGS
sink("Modelo_0_jags.txt")
cat("
model{
# Priors
psi ~ dunif(0,1)
p ~ dunif(0,1)
# verosimilitud
for (i in 1:M) {
z[i] ~ dbern(psi) # Modelo proceso ecológico
for (k in 1:K) {
tmp[i,k] <- p*z[i]
y[i,k] ~ dbin(tmp[i,k],1) # Modelo proceso observacional
} # k
} # i
N <- sum(z[1:M])
} # modelo
",fill=TRUE)
sink()
# Valores iniciales
zst <- c(rep(1,nind),rbinom(M-nind, 1, .5))
inits <- function(){
list(z= zst, psi= runif(1), p= runif(1))
}
# Parametros monitoreados
params0 <- c("psi","p","N")
# MCMC
ni <- 2000; nt <- 1; nb <- 1000; nc <- 3
# JAGS y posteriors
modelo_M0 <- jags(data0, inits, params0, "Modelo_0_jags.txt", n.chains= nc, n.thin= nt, n.iter= ni, n.burnin= nb)
print(modelo_M0, dig= 2)
JAGS output for model 'Modelo_0_jags.txt', generated by jagsUI.
Estimates based on 3 chains of 2000 iterations,
burn-in = 1000 iterations and thin rate = 1,
yielding 3000 total samples from the joint posterior.
MCMC ran for 0.101 minutes at time 2017-09-09 21:13:23.
mean sd 2.5% 50% 97.5% overlap0 f Rhat n.eff
psi 0.29 0.04 0.22 0.29 0.36 FALSE 1 1.00 2378
p 0.30 0.02 0.25 0.30 0.35 FALSE 1 1.01 403
N 50.04 2.03 47.00 50.00 55.00 FALSE 1 1.00 1057
deviance 489.57 11.44 471.10 488.79 515.71 FALSE 1 1.00 1047
donde psi
(\(\psi\)) es la probabilidad de ocupación, p
la probabilidad de detección, y N
es la abundancia.
Successful convergence based on Rhat values (all < 1.1).
Rhat is the potential scale reduction factor (at convergence, Rhat=1).
For each parameter, n.eff is a crude measure of effective sample size.
overlap0 checks if 0 falls in the parameter's 95% credible interval.
f is the proportion of the posterior with the same sign as the mean;
i.e., our confidence that the parameter is positive or negative.
DIC info: (pD = var(deviance)/2)
pD = 65.3 and DIC = 554.91
DIC is an estimate of expected predictive error (lower is better).
summary(fM0$sims.list$N / S)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.2257 0.2353 0.2401 0.2403 0.2450 0.2834
quantile (fM0$sims.list$N / S, c(0.025,0.975))
2.5% 97.5%
0.225741 0.264165
La captura-recaptura es una familia de métodos muy útil en los casos en los que se pueda identificar a los individiuos de la especie de estudio,
ya sea capturándolos en trampas (redes, shermans, tomahocks, trampa de pelos, excretas para ADN, u otro),
o bien identificándolos por marcas individuales (patrón de manchas en los felinos y otras especies)
o alguna otra característica (por ejempl tamaño y forma de astas/cuernos), marcas naturales (aletas de cetáceos).
Los modelos clásicos CR M0, Mt, Mb y muchas más, son útiles pero tienen limitaciones que pueden resultan estimaciones sesgadas debido a que no considera el aspecto espacial de los datos.