Objetivo
Introducir a conceptos generales de inferencia estadística, específicamente al enfoque bayesiano.
Primer ejemplo
Los siguientes ejemplos están basado y modificados del libro “Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan” por Kruschke (2015).
Se quiere conocer cuál es el hábitat más usado por una especie. Existen solo cuatro estudios previos y cada uno reporta diferente uso de los hábitats.
Luego vamos a campo y obtenemos datos nuevos de esta especie:
Hemos obtenido una distribución posteriori distinta. A partir de esto nuestra creencia inicial se ha modificado.
Ahora tenemos nueva evidencia para modificar la probabilidad en los 4 hábitats.
Nuevamente, vamos a campo o bien estudios en otros sitios muestran nueva evidencia que modifica nuestra hipótesis.
- El proceso bayesiano (hipótesis previa, nuevos datos, modificación de nuestra creencia inicial) es continuo.
Conclusión:
- El hábitat más probable o bien más usado es:
Segundo ejemplo
- Queremos conocer cuál es la altura del árbol donde con mayor probabilidad nidifica la especie de ave X.
En conclusión:
La esencia de la inferencia Bayesiana es la reasignación de la credibilidad en las diferentes posibilidades.
La distribución inicial de la credibilidad refleja el conocimiento previo o a priori acerca de esas posibilidades. Este conocimiento puede basarse en experiencia/estudios previos, o ser muy vago.
Luego una vez que se obtienen u onbservan nuevos datos, esta credibilidad inicial se modifica. Las posibilidades que son consistentes con los datos ganan en credibilidad mientras que las otras pierden.
Entonces, el enfoque Bayesiano consiste en el análisis matemático para reasignar la credibilidad de una manera lógica, coherente y más precisa.
Para esto, emplea el Teorema de Bayes…!
Gráficamente
- para variables continuas (PDF, Probability Density Function):
- para variables discretas (PMF, Probability Mass Function):
Diferentes maneras de especificar el Teorema de Bayes
Considerando, por ejemplo, dos posibilidades o caracteres:
\(p(A|B) = \frac{p(A) p(B|A)} {p(B)}\)
Considerando una hipótesis (H) y datos (D):
\(p(H|D) = \frac{p(H) p(D|H)} {p(D)}\)
Considerando parámetro (\(\theta\)) y datos (y)
\(p(\theta|y) = \frac{p(\theta) p(y|\theta)} {p(y)}\)
Por supuesto, en todos los casos podrían ser más de dos posibilidades (A,B,C,D), varias hipótesis (\(H_0\), \(H_1\), \(H_2\)), y varios parámetros (\(\theta\), \(\alpha\), \(\beta\)).
En el presente curso, se empleará el enfoque bayesiano para estimar parámetros, principalmente: ocupación (\(\psi\)), abundancia (N), densidad (D), probabilidad de detección (p) y distancia centro actividad al punto de conteo/captura (\(\sigma\)).
Herramientas de análisis
Vale la pena repetirlo:
La esencia de la inferencia Bayesiana es la reasignación de la credibilidad en las diferentes posibilidades.
La distribución inicial de la credibilidad refleja el conocimiento previo o a priori acerca de esas posibilidades. Este conocimiento puede basarse en experiencia/estudios previos, o ser muy vago.
Luego una vez que se obtienen u onbservan nuevos datos, esta credibilidad inicial se modifica. Las posibilidades que son consistentes con los datos ganan en credibilidad mientras que las otras pierden.
Entonces, el enfoque Bayesiano consiste en el análisis matemático para reasignar la credibilidad de una manera lógica, coherente y más precisa.
Para esto, emplea el Teorema de Bayes…!
Pasos para un análisis bayesiano
De acuerdo a Kruschke (2015), el análisis bayesiano sigue al menos estos pasos:
Identificar o plantear las preguntas de investigación relevantes.
Definir un modelo descriptivo para los datos. Lo que llamamos el likelihood o verosimilitud.
Especificar la distribución a priori de los parámetros en función del mayor o menor conocimiento previo.
Emplear el modelo de Bayes o ingerencia bayesiana para reasignar la credibilidad en los valores de cada parámetro, basado en nuevos datos.
Probar o comprobar las predicciones de la distribución posterior.
De ser necesario, definir un nuevo modelo descriptivo de los datos y reiniciar el proceso.