Introducción al enfoque bayesiano

Salvador Mandujano Rodríguez

22 de junio de 2018

Objetivo

Introducir a conceptos generales de inferencia estadística, específicamente al enfoque bayesiano.






Primer ejemplo

  • Los siguientes ejemplos están basado y modificados del libro “Doing Bayesian Data Analysis: A Tutorial with R, JAGS, and Stan” por Kruschke (2015).

  • Se quiere conocer cuál es el hábitat más usado por una especie. Existen solo cuatro estudios previos y cada uno reporta diferente uso de los hábitats.

  • Luego vamos a campo y obtenemos datos nuevos de esta especie:



  • Hemos obtenido una distribución posteriori distinta. A partir de esto nuestra creencia inicial se ha modificado.

  • Ahora tenemos nueva evidencia para modificar la probabilidad en los 4 hábitats.

  • Nuevamente, vamos a campo o bien estudios en otros sitios muestran nueva evidencia que modifica nuestra hipótesis.



  • El proceso bayesiano (hipótesis previa, nuevos datos, modificación de nuestra creencia inicial) es continuo.


Conclusión:

  • El hábitat más probable o bien más usado es:

Segundo ejemplo

  • Queremos conocer cuál es la altura del árbol donde con mayor probabilidad nidifica la especie de ave X.



En conclusión:

  • La esencia de la inferencia Bayesiana es la reasignación de la credibilidad en las diferentes posibilidades.

  • La distribución inicial de la credibilidad refleja el conocimiento previo o a priori acerca de esas posibilidades. Este conocimiento puede basarse en experiencia/estudios previos, o ser muy vago.

  • Luego una vez que se obtienen u onbservan nuevos datos, esta credibilidad inicial se modifica. Las posibilidades que son consistentes con los datos ganan en credibilidad mientras que las otras pierden.

  • Entonces, el enfoque Bayesiano consiste en el análisis matemático para reasignar la credibilidad de una manera lógica, coherente y más precisa.

  • Para esto, emplea el Teorema de Bayes…!




Gráficamente

  • para variables continuas (PDF, Probability Density Function):
  • para variables discretas (PMF, Probability Mass Function):




Diferentes maneras de especificar el Teorema de Bayes

Considerando, por ejemplo, dos posibilidades o caracteres:

\(p(A|B) = \frac{p(A) p(B|A)} {p(B)}\)

Considerando una hipótesis (H) y datos (D):

\(p(H|D) = \frac{p(H) p(D|H)} {p(D)}\)

Considerando parámetro (\(\theta\)) y datos (y)

\(p(\theta|y) = \frac{p(\theta) p(y|\theta)} {p(y)}\)

Por supuesto, en todos los casos podrían ser más de dos posibilidades (A,B,C,D), varias hipótesis (\(H_0\), \(H_1\), \(H_2\)), y varios parámetros (\(\theta\), \(\alpha\), \(\beta\)).

En el presente curso, se empleará el enfoque bayesiano para estimar parámetros, principalmente: ocupación (\(\psi\)), abundancia (N), densidad (D), probabilidad de detección (p) y distancia centro actividad al punto de conteo/captura (\(\sigma\)).


Herramientas de análisis





Vale la pena repetirlo:

  • La esencia de la inferencia Bayesiana es la reasignación de la credibilidad en las diferentes posibilidades.

  • La distribución inicial de la credibilidad refleja el conocimiento previo o a priori acerca de esas posibilidades. Este conocimiento puede basarse en experiencia/estudios previos, o ser muy vago.

  • Luego una vez que se obtienen u onbservan nuevos datos, esta credibilidad inicial se modifica. Las posibilidades que son consistentes con los datos ganan en credibilidad mientras que las otras pierden.

  • Entonces, el enfoque Bayesiano consiste en el análisis matemático para reasignar la credibilidad de una manera lógica, coherente y más precisa.

  • Para esto, emplea el Teorema de Bayes…!


Pasos para un análisis bayesiano

De acuerdo a Kruschke (2015), el análisis bayesiano sigue al menos estos pasos:

  1. Identificar o plantear las preguntas de investigación relevantes.

  2. Definir un modelo descriptivo para los datos. Lo que llamamos el likelihood o verosimilitud.

  3. Especificar la distribución a priori de los parámetros en función del mayor o menor conocimiento previo.

  4. Emplear el modelo de Bayes o ingerencia bayesiana para reasignar la credibilidad en los valores de cada parámetro, basado en nuevos datos.

  5. Probar o comprobar las predicciones de la distribución posterior.

  6. De ser necesario, definir un nuevo modelo descriptivo de los datos y reiniciar el proceso.


Sugerencias de libros para este curso: