Curso: Modelado ocupación, abundancia y densidad

enfoque frecuentista y bayesiano en R y otros programas

Salvador Mandujano Rodríguez

2018-07-29


Objetivos del monitoreo de fauna silvestre:

  • Detectar cambios o tendencias en el tamaño de las poblaciones (o en cualquier otro parámetro, por ejemplo la fecundidad) y/o de la diversidad de especies a través del tiempo en el mismo sitio, o entre poblaciones habitando lugares diferentes.

  • Evaluar si determinados factores por ejemplo fragmentación, cacería, patógenos, competencia con especies exóticas; o bien prácticas de manejo del hábitat (mejoramiento, bebederos, otros), cambios en las condiciones generales del ambiente, y políticas de protección (comités/programas de vigilancia), han tenido impacto en la población misma.


Implicaciones para el manejo

El monitoreo es un aspecto esencial en el manejo de la fauna silvestre requiere un enfoque multidisciplinario y, en ese sentido, la ecología es uno de ellos.


El manejo de la fauna tiene tres objetivos principales:


Básicamente nos interesa saber si la población está creciendo, estable o decreciendo pues esto nos permite abordar los diferentes objetivos del manejo:




Un caso frecuente:

Hace poco salieron publicados estos mensaje en Facebook:


Indiduablemente es importante el trabajo y esfuerzo que realizan las instituciones en materia de monitoreo, pero siendo un poco críticos es válido preguntarse:

¿Con base en qué concluyen eso?¿Qué tal si solo están fotografiando mucho a uno o pocos individuos?

Más importante:

“Obtener una sola estimación del tamaño poblacional de determinada especie en un sitio y en un momento específico… no sirve de mucho…!”


¿Qué se quiere monitorear?

Antes de iniciar el monitoreo se debe tener muy claros los objetivos y la finalidad del estudio. Este es un aspecto fundamental y lamentablemente obviado en muchos casos.

En el siguiente diagrama se esquematiza el proceso de monitoreo el cual inicia con preguntarnos qué queremos monitorear: comunidades (un grupo de poblaciones habitando en el mismo sitio), poblaciones (un grupo de individuos de la misma especie habitando) o individuos de determinada especie.


Niveles de análisis y paquetes R


Preguntas frecuentes en el monitoreo:

  • ¿Qué especies se investigarán?

  • ¿Dónde se realizará el trabajo?

  • ¿Con cuánto presupuesto se cuenta?

  • ¿Cuánto tiempo durará el estudio?

  • ¿Cuántas trampas, redes, cámaras, etc., se tienen?

  • ¿Cómo diseñar el muestreo?

  • ¿Cuántos sitios de muestreo se deben establecer?

  • ¿Cuántos días se deben muestrear?

  • ¿Cómo registrar y guardar la información registrada en campo?

  • ¿Cómo organizar la información para facilitar su posterior análisis?

  • ¿En cuáles programas/formatos conviene almacenar la información en la computadora?

  • ¿Qué ventajas y desventajas puden tener estos programas?

  • ¿Cómo reportar los resultados de los análisis?

  • ¿Qué herramientas existen para generar informes profesionales y ponerlos disponibles para su consulta?


Proceso general de muestreo e inferencia

Modificado de Kéry & Royle 2017.

Modificado de Kéry & Royle 2017.

Foto-trampeo

tomado de Wearn & Glover-Kapfer 2017.

tomado de Wearn & Glover-Kapfer 2017.



Tipo de datos obtenidos

  • las especies “capturadas” o detectadas en las unidades de muestreo;

  • la “presencia” (1) o “ausencia” (0) de determinada especie en el sitio de estudio durante el periodo de muestreo;
  • el número total de registros independientes por especie;

  • en algunos casos, las historias de detección o no detección de determinada especie (por ejemplo, 00101 que indica que la especie no fue detectada en las ocasiones 1, 2 y 4, y sí fue detectada en las ocasiones 3 y 5; por ocasión de muestreo regularmente se entiende días);

  • para algunas especies, la identificación de inviduos por marcas naturales (por ejemplo, el patrón de manchas en los felinos, el tamaño y forma de astas en cérvidos machos),

  • datos de las variables del sitio (por ejemplo, tipo de hábitat, cobertura, presencia/actividad humana, distancia a caminos, fuentes de agua, u otro).


Detección de cambios en la población

Para detecar cambios estadísticamente signifiactivos en la población se debe comprender primero, y luego controlar de alguna manera, los diferentes componentes de la variación sobre un estimador.

\[Var(N)=N^2[\frac{Var(n)}{n2}(1-{\alpha}) + (\frac{Var(\beta^2)}{\beta^2})]\]

lo cual significa que la varianza de la abundancia (N) está asociada o depende de la varianza del número de animales contados (n) en las unidades de muestreo, del área muestreada (α), y de la varianza en la estimación de la proporción de animales detectado (β).


Métodos de análisis estadístico

Existen varias aproximaciones o técnicas estadísticas para probar diferencias en el tamaño poblacional, ya sea de la misma población a través del tiempo; o entre poblaciones en el mismo sitio. Por ejemplo:

\[Z=\frac{ln(N_t)-(N_t+1)}{\sqrt{Var[ln(N_t)]+Var[ln(N_t+1)]}}\]


Conceptos fundamentales

Tres conceptos relacionados con la estimación poblacional son:

  • Exactitud: qué tan cerca está nuestra estimación poblacional del valor real,

  • Sesgo: la diferencia que hay entre nuestro estimador y el valor real, y

  • Precisión: qué tan similares son nuestras estimaciones de la abundancia si empleamos el mismo método varias veces seguidas.

Gráficamente

Podemos considerar varios casos entre la relación exactitud y precisión:

A partir de esto, las estrategias para mejorar la precisión son:

  • Aumentar el tamaño de muestra, i.e. el número de animales observados en el muestreo,

  • Aumentar la superficie de muestreo, i.e. poner el mayor número de transectos posible,

  • Aumentar la posibilidad de detectar al mayor número de animales durante el muestreo, i.e. seleccionar el método adecuado.


Ejemplo precisión, exactitud y sesgo

A continuación

Muestra (n= 1) al azar de medias de 10 individiuos

Muestra muy grande (n=10,000) de medias de 10 individuos

Resultados

# media de 1 muestra de 10 ind.
mean(x)
## [1] 37.86107
# SD de la muestra de 1 muestra de 10 ind.
sd(x) 
## [1] 5.92764
# media de medias de una muestra enorme de 10 ind.
mean(muestra_de_medias)
## [1] 35.00547
# SD (en este caso error estándar) de una muestra enorme de 10 ind.
sd(muestra_de_medias) 
## [1] 1.586072

Ejemplo de monitoreo y análisis de datos

En este ejemplo se analiza el cambio en el número de detecciones de la zorra gris (Urocyon cinereoargentus) en San Gabriel Casa Blanca, localidad de la Reserva de Biósfera Tehuacán-Cuicatlán.

Ejemplo de un monitoreo hipotético en que se contaron los avistamientos de la zorra gris en 10 transectos de 5 km cada uno recorridos en la época seca durante 4 años consecutivos del 2012 al 2015.

Se quiere saber si la población ha cambiado significativamente durante ese periodo. No se está estimando la abundancia ni la densidad de zorras. Dado que cada año se muestreó el mismo número de transectos y se hicieron los mismos recorridos incluyendo el largo total, para este caso se emplea el número de observaciones como un indicador de la población. Es decir, el índice sería No.zorras/50km en cada año.

Implícitamente se asume que la probilidad de detección es la misma en cada transecto y entre años. Para este caso simple no se emplean covariables asociadas a los avistamientos.

Leer datos

Tabla 1. Datos de los muestreos de la zorragris en los 10 transectos durante el periodo 2012 al 2015.

Year n
2012 23
2012 21
2012 18
2012 31
2012 26
2012 27
2012 24
2012 12
2012 38
2013 34
2013 31
2013 28
2013 20
2013 45
2013 26
2013 32
2013 18
2013 42
2014 45
2014 47
2014 39
2014 38
2014 21
2014 60
2014 47
2014 32
2014 37
2015 28
2015 23
2015 19
2015 35
2015 26
2015 21
2015 17
2015 35
2015 25

gráfico de dispersión de los datos

incluyendo las medias

gráfico boxplot

Debemos preguntarnos si hay diferencias estadísticamente significativas en el número de zorras de cada año. Para esto aplicamos un análisis de varianza simple, como:

## 
## Call:
## lm(formula = n ~ year - 1)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -19.6667  -4.5000  -0.4444   4.8333  19.3333 
## 
## Coefficients:
##          Estimate Std. Error t value Pr(>|t|)    
## year2012   24.444      2.876   8.499 1.03e-09 ***
## year2013   30.667      2.876  10.662 4.61e-12 ***
## year2014   40.667      2.876  14.139 2.59e-15 ***
## year2015   25.444      2.876   8.847 4.16e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.629 on 32 degrees of freedom
## Multiple R-squared:  0.9355, Adjusted R-squared:  0.9274 
## F-statistic:   116 on 4 and 32 DF,  p-value: < 2.2e-16

En este caso se hizo una ANOVA con parametrización de medias, es decir se estima el promedio de zorras de cada año.

Otra alternativa es preguntarnos la diferencia en el número de zorras de los años 2013, 2014 y 2015. Entonces la ANOVA la parametrizamos como:

## 
## Call:
## lm(formula = n ~ year)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -19.6667  -4.5000  -0.4444   4.8333  19.3333 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   24.444      2.876   8.499 1.03e-09 ***
## year2013       6.222      4.068   1.530 0.135909    
## year2014      16.222      4.068   3.988 0.000362 ***
## year2015       1.000      4.068   0.246 0.807369    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.629 on 32 degrees of freedom
## Multiple R-squared:  0.3846, Adjusted R-squared:  0.327 
## F-statistic: 6.667 on 3 and 32 DF,  p-value: 0.001265

Dado que el valor de F y de P indican que sí existen diferencias entre años, aplicamos ahora alguna prueba a posteriori para comparar las medias. En este caso la prueba de TukeyHSD, como:

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = lm(n ~ year))
## 
## $year
##                 diff        lwr       upr     p adj
## 2013-2012   6.222222  -4.798172 17.242616 0.4322088
## 2014-2012  16.222222   5.201828 27.242616 0.0019567
## 2015-2012   1.000000 -10.020394 12.020394 0.9946721
## 2014-2013  10.000000  -1.020394 21.020394 0.0862944
## 2015-2013  -5.222222 -16.242616  5.798172 0.5795782
## 2015-2014 -15.222222 -26.242616 -4.201828 0.0038122

En este gráfico se muestran las comparaciones entre pares de años. La interpretación es que si la línea horizontal a traviesa a la vertical punteada, entonces no hay diferencia significativa; y si no la atraviesa entonces sí hay diferencias.

De acuerdo a este ejemplo, hubo diferencias significativas (P < 0.05) entre los años 2012 y 2014 (creció la población), y entre los años 2014 y 2015 (decreció la población).

library(agricolae)

Podemos emplear el paquete agricolae para graficar estas diferencias, como:

out <- HSD.test(modelo,"year")
par(mfcol = c(1,1), mar = c(10,5,5,1))
bar.group(out$groups, horiz = F, las = 2, cex.main = 2, font = 1, cex.axis = 0.9, plot = T, col = "skyblue", ylim = c(0, 50), names.arg = out$trt, ylab = "IAR")

En este gráfico las letras indican diferencias significativas entre años. Es decir, letras similares no son diferentes, letras distintas indican diferencias.

Ejemplo 4: GLM Poisson

En el paso anterior se empleó un modelo lineal (LM) simple para ver el cambio del número de zorras a través de los años. Los datos de conteo no se distribuyen de acuerdo al modelo de distribución normal. Si bien al graficar el histograma de frecuencias de los datos del muestreo pareciera que siguen una normal:

formalmente, no es así.

Entonces, lo que procede es emplear un modelo con distribución Poisson, es decir un GLM Poisson. Lo cual simplemente se logra empleando las funciones R glm y family, como:

## 
## Call:  glm(formula = n ~ year - 1, family = poisson)
## 
## Coefficients:
## year2012  year2013  year2014  year2015  
##    3.196     3.423     3.705     3.236  
## 
## Degrees of Freedom: 36 Total (i.e. Null);  32 Residual
## Null Deviance:       5458 
## Residual Deviance: 77.28     AIC: 272.4

La diferencia o cociente entre los grados de libertad y los grados de los residuales son mayores a 1. Esto se puede probar como:

(cociente <- modelo1$df.null / modelo1$df.residual)
## [1] 1.125
(p_value <- 1 - pchisq(modelo1$deviance,modelo1$df.residual))
## [1] 1.292163e-05

En ambos casos se sugiere que existe una pequeña sobredispersión de los datos, es decir, la relación Var/Media = 1 que supone el modelo Poisson es ligeramente mayor a 1. En casos más extremos se puede emplear la función quasipoisson, o bien emplear un modelo tipo binomial negativa, o la función ZIP (del inglés Zero Inflation Poisson).

Aquí solo se pasa con la quasipoisson, como:

(modelo1 <- glm(n ~ year-1, quasipoisson))
## 
## Call:  glm(formula = n ~ year - 1, family = quasipoisson)
## 
## Coefficients:
## year2012  year2013  year2014  year2015  
##    3.196     3.423     3.705     3.236  
## 
## Degrees of Freedom: 36 Total (i.e. Null);  32 Residual
## Null Deviance:       5458 
## Residual Deviance: 77.28     AIC: NA

Finalmente, como los coeficientes están en escala Log pues se aplicó la distribución Poisson, se linealizan como:

round(exp(coef(summary(modelo1))[, 1]),2)
## year2012 year2013 year2014 year2015 
##    24.44    30.67    40.67    25.44

Conclusiones

Estimar solo una vez el tamaño poblacional es muy limitado. Se requieren por lo menos dos estimaciones en tiempos (años en este ejemplo) distintos. Preferentemente, se debe emplear el mismo método de muestreo y modelo de análisis. Es fundamental no solo estimar el promedio del tamaño poblacional, sino además la variación sobre el mismo. Además, se deben aplicar métodos o pruebas estadísticas para conocer si hubo algún tipo de tendencia en la población y si fue significativa.


El presente documento fue generado con la herramienta R Markdown