#Teorema de bayes
setwd("~/Tareas uni/Probabilidad y estadistica")
El teorema de Bayes, en la teoría de la probabilidad, es una proposición planteada por el matemático inglés Thomas Bayes (1702-1761) y publicada póstumamente en 1763, que expresa:
** la probabilidad condicional de un evento aleatorio A dado B en términos de la distribución de probabilidad condicional del evento B dado A y la distribución de probabilidad marginal de solo A. **
Bayes
*En términos más generales y menos matemáticos, el teorema de Bayes es de enorme relevancia puesto que vincula la probabilidad de A dado B con la probabilidad de B dado A.
Es decir, por ejemplo, que sabiendo la probabilidad de tener un dolor de cabeza dado que se tiene gripe, se podría saber (si se tiene algún dato más), la probabilidad de tener gripe si se tiene un dolor de cabeza. Muestra este sencillo ejemplo la alta relevancia del teorema en cuestión para la ciencia en todas sus ramas, puesto que tiene vinculación íntima con la comprensión de la probabilidad de aspectos causales dados los efectos observados.
Teorema
##Formula de bayes
Con base en la definición de probabilidad condicionada se obtiene la Fórmula de Bayes, también conocida como Regla de Bayes:
Formula
Esta fórmula nos permite calcular la probabilidad condicional P(Ai|B) de cualquiera de los eventos Ai dado B. La fórmula ha originado muchas especulaciones filosóficas y controversias.
Los análisis Bayesianos son similares a los que vimos en en el sentido que dependen explícitamente de modelos probabilísticos para los datos.
Es decir, tenemos que definir un modelo de datos. La gran diferencia es que con Bayes, podemos obtener distribuciones de probabilidades para todas las cantidades no observadas, incluyendo parámetros, valores perdidos o nuevas observaciones que todavía no hemos hecho. De esta manera, los análisis Bayesianos nos permiten cuantificar incertidumbre y armar modelos realistas que tienen en cuenta por ejemplo observaciones imperfectas.
Como vimos en la teórica, la regla de Bayes planteada en términos de datos y parámetros es:
\[ p(\boldsymbol{\theta} \lvert \boldsymbol{y}) = \frac{p(\boldsymbol{y} \lvert \boldsymbol{\theta}) p(\boldsymbol{\theta)}}{\int p(\boldsymbol{y} \lvert \boldsymbol{\theta)} p(\boldsymbol{\theta)} d \boldsymbol{\theta} } \]
Likehood : verosimilitud
Es decir que la probabilidad posterior de los parámetros θ dado que observamos los datos y es igual al likelihood multiplicado por las previas y dividido por la probabilidad total de los datos.
La función de likelihood nos da la probabilidad de observar los datos condicional al valor de los parámetros p(y|θ). La previa de los parámetros p(θ)
refleja los posibles valores de los parámetros de acuerdo con nuestras “creencias” previas, o los resultados de estudios anteriores, o lo que nos parece que tiene sentido para el sistema de estudio (en definitiva, en base a información previa). Finalmente, la probabilidad total de los datos se obtiene integrando la función de lilkelihood sobre los posibles valores de los parámetros que define la previa. Como veremos más adelante, los análisis Bayesianos combinados con métodos numéricos permiten analizar modelos con muchos parámetros, niveles de variabilidad y variables “ocultas”, pero primero vamos a empezar por casos simples donde podemos calcular las posteriores directamente.
Para entender bien cómo es todo el proceso, vamos a simular los datos.
Imaginen que queremos estudiar la remoción de frutos en 30 plantas. En cada una de las plantas marcamos 20 frutos y contamos cuántos son removidos por dispersores luego de un tiempo fijo. Si suponemos que un buen modelo para este tipo de datos es una distribución Binomial con una probabilidad de éxito fija hacemos:
Haciendo un analisis de distribucion binomial
set.seed(1234)
nobs <- 30 #Numero de observaciones (plantas)
frutos <- rep(20,nobs) #20 frutos en 30 arboles
p_rem <- 0.2 #Probabilidad apreory
removidos <- rbinom(nobs,size = frutos, prob = p_rem)
removidos
## [1] 2 4 4 4 6 5 0 3 5 4 5 4 3 7 3 6 3 3 2 3 3 3 2 1 3 6 4 7 6 1
El modelo de datos (cuántos frutos son removidos) es una Binomial con número de pruebas (la cantidad de frutos disponibles) conocido. Para hacer un análisis Bayesiano de estos datos, tenemos que definir una previa para la probabilidad de éxito (p_rem).
Esa previa tiene que tomar valores continuos entre 0 y 1. Una opción sería una distribución uniforme con esos límites, pero si usamos una distribución Beta, es posible obtener un resultado analítico para la posterior.
En este caso, la posterior es otra distribución Beta pero con sus parámetros actualizados en base a las observaciones. Se dice entonces que la distribución Beta es la conjugada de la Binomial. Si la previa de la tasa de remoción por fruto es una distribución Beta con parámetros α y β, actualizamos los valores de α y β en base a la cantidad de éxitos y fracasos obervados.
La posterior de la tasa de remoción por fruto es entonces una Beta con α=∑y, β=∑(n−y) donde y representa a los frutos removidos de los n disponibles. Veamos como hacer esto en R.
alpha <- 1
beta <- 1
alpha_p <- alpha + sum(removidos) # α=∑y
beta_p <- alpha + sum(frutos -removidos) # β=∑(n−y)
Para obtener el valor esperado de una distribución Beta hacemos
formula de Teorema de bayes
alpha_p / (alpha_p+beta_p)
## [1] 0.1877076
Eso nos da un estimador puntual de la probabilidad de remoción por fruto p_rem. Para tener una medida de incertidumbre alrededor de este valor, podemos ver los cuantiles de la posterior:
qbeta(c(0.025,0.975),alpha_p,beta_p)
## [1] 0.1575462 0.2198340
También podemos graficar la distribución posterior y compararla con la previa para ver cuánto aprendimos haciendo el análisis.
op <- par(cex.lab = 1.5, font.lab = 2, cex.axis = 1.3, las = 1, bty = "n")
curve(dbeta(x, alpha + sum(removidos), beta + sum(frutos - removidos)), lwd = 2,
ylab = "Densidad de probabilidad", xlab = "Probabilidad de remoción")
curve(dbeta(x, 1, 1), lwd = 2, col = "gray", add = TRUE)
text(0.6, 2.5, "previa")
text(0.35, 12, "posterior")
Asigación U2A4:
Encuentre 2 ejercicios de aplicaciones del teorema de bayes y ejecútelos, estos ejercicios pueden o no ser relacionados con su carrera.
EJERCICIO #1
Caso. Dos bolsitas con bolitas rojas y negras Se tienen dos buzones. El Buzón 1 con 3 bolitas negras y 2 rojas. El Buzón 2, con 4 negras y 3 rojas. El experimento aleatorio, consiste en sacar una bolita del primer buzón e introducirla en el segundo, para después extraer una bolita de este último buzón y ahí preguntar probabilidades de ocurrencia. El hecho de sacar una bolita se le llama evento, cuya probabilidad es siempre diferente de cero. (El experimento tiene como condición, siempre sacar una bolita) Primer evento: Sacar una bolita del Buzón 1, esta acción puede seguir dos opciones: Comenzar sacando una bolita de color Negro o sacar una de color Rojo. Inmediatamente introducirla en el Buzón 2. En ambas situaciones, se aumenta en una bolita el espacio muestral o número total de bolitas del segundo buzón. Segundo evento: Sacar una bolita del Buzón 2, después de haber introducido la bolita que proviene del Buzón 1, la cual también sigue las dos mismas opciones o ramas (N o R)
¿Cuál es la probabilidad que sea roja en la bolsita 2? Diagrama en árbol, donde se definen dos opciones o ramas, y se asocia la probabilidad cada a cada rama. Nótese que cada opción o rama a su vez cuenta con dos ramas La probabilida de que sea roja es de 2/5 o 0.40 en el primer evento. La probabilida de que sea nuevamente roja en el segundo evento es 1/2 o sea 0.5. La bolsa 2 tenía 3 rojas y se le incopora 1 roja, entonces ahora tiene 4.
Demostración Se incorporan los valores iniciales Evento 1 Suceso N: Sacar una bolita negra, probabilidad 3/5) Suceso R: Sacar una bolita roja, probabilidad 2/5) 1.- PR Probabilida de que sea Roja (3/5) 2.- PN Probabilida de que sea Negra (2/5) 3.- Con () se hace el cálculo de manera interna
PN <- (3/5)
PR <- (2/5)
cat("La probabilida en el primer evento de que sea negra es: ",PN)
## La probabilida en el primer evento de que sea negra es: 0.6
cat("La probabilida en el primer evento de que sea roja es: ",PR)
## La probabilida en el primer evento de que sea roja es: 0.4
Evento 2 Opción 1 del evento 2 1.- Sacar una bolita negra cuando la primera fue negra, N/N 2.- Sacar una bolita roja cuando la primera fue negra, N/R 3.- PN.PN: Pobabilida de que sea negra y negra 4.- PN.PR: Pobabilida de que sea negra y roja 5.- ¿Cuántas bolitas hay en total en la segunda bolsa?, 8, toda vez se agregó una negra 6.- ¿Cuántas negras? 5 de 8 7.- ¿Cuántas rojas? 3 de 8
PN.PN <- (5/8)
PN.PR <- (3/8)
Opción 2 del evento 2 1.- Sacar una bolita negra cuando la primera fue roja, R/N 2.- Sacar una bolita roja cuando la primera fue roja, R/R 3.- PR.PN: Pobabilida de que sea negra y negra 4.- PR.PR: Pobabilida de que sea negra y roja 5.- ¿Cuántas bolitas hay en total en la segunda bolsa?, 8, toda vez se agregó una roja 6.- ¿Cuántas negras? 4 de 8 7.- ¿Cuántas rojas? 4 de 8
PR.PN <- (4/8)
PR.PR <- (4/8)
Calculando las probabilidades ¿Cuál es la probabilidad que sea roja? A partir del diagrama, se calcula la probabilidad de sacar una bolita roja del Buzón 2, dado el experimento en cuestión. Respondiendo la pregunta formulada: ¿Cuál es la probabilidad que sea roja? Una variable PRdenominador que se usará en Fórmula de Bayes mas * adelante
PRdenominador <- (PN * PN.PR) + (PR * PR.PR)
PRdenominador <- (PN * PN.PR) + (PR * PR.PR)
cat("Calculando la probabilida de que sea roja según el diagrama de árbol: ",PRdenominador)
## Calculando la probabilida de que sea roja según el diagrama de árbol: 0.425
Aplicando el teorema de Bayes ¿Cual es la probabilidad de de sacar una bolita roja del segundo evento o buzón, dado que en el primero fue bolita negra? Se utiliza la variable PTB.N.R a esta probabilidad formulada por Bayes, para tener una notación coherente. Probabilidad y de acuerdo al Teorema de Bayes de que primero sea negra y luego roja Mostrando el diagrama de árbol co las probabilidades calculadas Los valores sustituidos en la fórmula * (PN * PN.PR) como denominador * Ya se tiene el denominador PRdenominador: (PN * PN.PR) + (PR * PR.PR)
PTB.N.R <- (PN * PN.PR )/ (PRdenominador)
cat ("Cual es la probabilidad de de sacar una bolita roja del segundo evento o buzón, dado que en el primero fue bolita negra", PTB.N.R)
## Cual es la probabilidad de de sacar una bolita roja del segundo evento o buzón, dado que en el primero fue bolita negra 0.5294118
PTB.R.R <- (PR * PR.PR )/ (PRdenominador)
Se toman la probabilidad de sacar una bolita roja, cuando se inicia por la opción de las negras y se divide por la probabilidad total de sacar una roja calculada en y ahí se tiene una aplicación concreta del Teorema de Bayes.
EJERICIO #2
Caso: Fábrica que compra piezas de dos proveedores Sea A1 el evento la pieza proviene del proveedor 1 y A2 el evento la pieza proviene del proveedor 2.
De las piezas que compra la fábrica, 65% proviene del proveedor A1 y 35% restante proviene del proveedor A2.
Por tanto, si toma una pieza aleatoriamente, le asignará las probabilidades previas P(A1) = 0.65 y P(A2) = 0.35.
La calidad de las piezas compradas varía de acuerdo con el proveedor.
Se sabe que la calidad del proveedor 1 es 2 de cada 100 piezas son defectuosas o sea una probabilidad de 0.98.
Se conoce también que la calidad dol proveedor 2 es 5 de cada 100 son defectuosas o se que tiena una probabilidad de 0.95.
La literal G (good) denota el evento la pieza está buena y B (bad) denota el evento la pieza está mala.
Preguntas de probabilidades Dada la información de que la pieza está mala
Al elegir una pieza aleatoriamente, ¿Cuál es la probabilidad de que se encuentre una pieza que sea del proveedor A1? Al elegir una pieza aleatoriamente, ¿Cuál es la probabilidad de que se encuentre una pieza que sea del proveedor A2? Se aplica teorema de Bayes
Probabilidades de fabricación por proveedor PA1 Probabilidad del proveedor1 PA2 Probabilidad del proveedor2 Notar que ambas probabilidades sumadas son igual a 1 o el 100%
Probabilidades condicionales Proveedor 1 PG.PA1 Probabilidad de que sea una pieza buena (Good) dado el proveedor 1 PB.PA1 Probabilidad de que sea una pieza mala (Bad) dado el proveedor 1 Notar que las probabilidades suman 1 o el 100%
Probabilidades condicionales Proveedor 2 PG.PA2 Probabilidad de que sea una pieza buena (Good) dado el proveedor 2 PB.PA2 Probabilidad de que sea una pieza mala (Bad) dado el proveedor 2 Notar que las probabilidades suman 1 o el 100%
Árbol de Probabilidades Cálculo de probabilides condicionales conforme al árbol de decisión para proveedor 1 Cada una de las variables siguientes se determina en el árbol multiplicando las probabildiades de cada hoja. Para hallar la probabilidad de cada uno de los resultados experimentales, simplemente se multiplican las probabilidades de las ramas que llevan a ese resultado Se hace notar que la suma de cada probabilidad en cada paso es 1 o el 100% Probabilidad de que una pieza sea buena dado el proveedor 1. PA1.I.G = PA1 * PG.PA1 Probabilidad de que una pieza sea mala dado el proveedor 1. PA1.I.B = PA1 * PB.PA1
PA1 = 0.65
PG.PA1 = 0.98
PB.PA1=0.02
PA1.I.G <- PA1 * PG.PA1
PA1.I.B <- PA1 * PB.PA1
cat("La probabilidad de que sea del proveedor 1 y que la pieza sea buena es: ",PA1.I.G)
## La probabilidad de que sea del proveedor 1 y que la pieza sea buena es: 0.637
cat("La probabilidad de que sea del proveedor 1 y que la pieza sea mala es: ",PA1.I.B)
## La probabilidad de que sea del proveedor 1 y que la pieza sea mala es: 0.013
Cálculo de probabilides condicionales conforme al árbol de decisión para proveedor 2 Cada una de las variables siguientes se determian en el árbol multiplicando las probabildiades de cada hoja. Se hace notar que la suma de cada probabilidad en cada paso es 1 o el 100% Probabilidad de que una pieza sea buena dado el proveedor 2. PA2.I.G = PA2 * PG.PA2 Probabilidad de que una pieza sea mala dado el proveedor 2. PA2.I.B = PA2 * PB.PA2
PA2 = 0.35
PG.PA2 = 0.95
PB.PA2 =0.05
PA2.I.G <- PA2 * PG.PA2
PA2.I.B <- PA2 * PB.PA2
cat("La probabilidad de que sea del proveedor 1 y que la pieza sea buena es: ",PA2.I.G)
## La probabilidad de que sea del proveedor 1 y que la pieza sea buena es: 0.3325
cat("La probabilidad de que sea del proveedor 1 y que la pieza sea mala es: ",PA2.I.B)
## La probabilidad de que sea del proveedor 1 y que la pieza sea mala es: 0.0175
Solución a las preguntas de probabilidad Proveedor 1 Dada la información de que la pieza está mala 1.¿Cuál es la probabilidad de que se encuentre una pieza mala (Bad) que sea del proveedor A1? Sustituyendo conforme a la fórmula Se aplica teorema de Bayes. TB.PA1.G: Conforme al teorema de Bayes (TB), la probabilidad de que sea una pieza mala (Bad) condicionada a que sea primero del proveedor1. El denominador es el mismo en ambas preguntas.
TB.PA1.B <- (PA1 * PB.PA1) / (PA1 * PB.PA1 + PA2 * PB.PA2)
cat("Conforme al teorema de Bayes (TB), la probabilidad de que sea una pieza mala (Bad) condicionada a que sea primero del proveedor1 es: ", TB.PA1.B)
## Conforme al teorema de Bayes (TB), la probabilidad de que sea una pieza mala (Bad) condicionada a que sea primero del proveedor1 es: 0.4262295