Teorema de Bayes

Marco conceptual

Esta práctica, intenta enseñar el Teorema de Bayes basado centralmente en diagramas de árbol, sin asustarse por la expresión de las fórmulas, conceptos y notación, que son impresionantemente complejas cuando se observa por primera vez. Aún más, sin tener aun mucha comprensión de cuál es la utilidad y de verse en dificultades de aprender detalladas conceptos y nomenclaturas complejas. Cita: https://www.docirs.cl/entender_teorema_de_bayes_simple.asp#4

Descripción de la práctica

Ejemplo de dos buzones con bolitas de colores y su correspondiente diagrama de árbol, para explicar haciendo un experimento de probabilidades condicionales e ir introduciendo paulatinamente ciertos conceptos formales asociándolo principalmente al Teorema de Bayes.
Se presenta el diagrama de árbol y las probabilidades, haciendo hincapié en que en el enunciado del problema se identifican los los datos de base explícitos o implícitos o sea las probabilidades.

Caso. Dos bolsitas con bolitas rojas y negras

Se tienen dos buzones. El Buzón 1 con 3 bolitas negras y 2 rojas. El Buzón 2, con 4 negras y 3 rojas. El experimento aleatorio, consiste en sacar una bolita del primer buzón e introducirla en el segundo, para después extraer una bolita de este último buzón y ahí preguntar probabilidades de ocurrencia.

#####El hecho de sacar una bolita se le llama evento, cuya probabilidad es siempre diferente de cero. (El experimento tiene como condición, siempre sacar una bolita)

Primer evento:

Sacar una bolita del Buzón 1, esta acción puede seguir dos opciones: Comenzar sacando una bolita de color Negro o sacar una de color Rojo. Inmediatamente introducirla en el Buzón 2. En ambas situaciones, se aumenta en una bolita el espacio muestral o número total de bolitas del segundo buzón.
Segundo evento:

Sacar una bolita del Buzón 2, después de haber introducido la bolita que proviene del Buzón 1, la cual también sigue las dos mismas opciones o ramas (N o R)

¿Cuál es la probabilidad que sea roja en la bolsita 2?

Diagrama en árbol, donde se definen dos opciones o ramas, y se asocia la probabilidad cada a cada rama. Nótese que cada opción o rama a su vez cuenta con dos ramas
La probabilida de que sea roja es de 2/5 o 0.40 en el primer evento.
La probabilida de que sea nuevamente roja en el segundo evento es 1/2 o sea 0.5. La bolsa 2 tenía 3 rojas y se le incopora 1 roja, entonces ahora tiene 4.

Demostración

1.- PR Probabilida de que sea Roja (3/5)
2.- PN Probabilida de que sea Negra (2/5)
3.- Con () se hace el cálculo de manera interna
PN <- (3/5) 
PR <- (2/5)
cat("La probabilida en el primer evento de que sea negra es: ",PN)
## La probabilida en el primer evento de que sea negra es:  0.6
cat("La probabilida en el primer evento de que sea roja es: ",PR)
## La probabilida en el primer evento de que sea roja es:  0.4

Evento 2

Opción 1 del evento 2

1.- Sacar una bolita negra cuando la primera fue negra, N/N
2.- Sacar una bolita roja cuando la primera fue negra, N/R
3.- PN.PN: Pobabilida de que sea negra y negra
4.- PN.PR: Pobabilida de que sea negra y roja
5.- ¿Cuántas bolitas hay en total en la segunda bolsa?, 8, toda vez se agregó una negra
6.- ¿Cuántas negras? 5 de 8
7.- ¿Cuántas rojas? 3 de 8
PN.PN <- (5/8)
PN.PR <- (3/8)

Opción 2 del evento 2

1.- Sacar una bolita negra cuando la primera fue roja, R/N
2.- Sacar una bolita roja cuando la primera fue roja, R/R
3.- PR.PN: Pobabilida de que sea negra y negra
4.- PR.PR: Pobabilida de que sea negra y roja
5.- ¿Cuántas bolitas hay en total en la segunda bolsa?, 8, toda vez se agregó una roja
6.- ¿Cuántas negras? 4 de 8
7.- ¿Cuántas rojas? 4 de 8
PR.PN <- (4/8)
PR.PR <- (4/8)

Calculando las probabilidades

¿Cuál es la probabilidad que sea roja?
A partir del diagrama, se calcula la probabilidad de sacar una bolita roja del Buzón 2, dado el experimento en cuestión. Respondiendo la pregunta formulada: ¿Cuál es la probabilidad que sea roja?
Una variable PRdenominador que se usará en Fórmula de Bayes mas * adelante
PRdenominador <- (PN * PN.PR) + (PR * PR.PR)
PRdenominador <- (PN * PN.PR) + (PR  * PR.PR)
cat("Calculando la probabilida de que sea roja según el diagrama de árbol: ",PRdenominador)
## Calculando la probabilida de que sea roja según el diagrama de árbol:  0.425

Aplicando el teorema de Bayes

¿Cual es la probabilidad de de sacar una bolita roja del segundo evento o buzón, dado que en el primero fue bolita negra?
Se utiliza la variable PTB.N.R a esta probabilidad formulada por Bayes, para tener una notación coherente. Probabilidad y de acuerdo al Teorema de Bayes de que primero sea negra y luego roja
Mostrando el diagrama de árbol co las probabilidades calculadas
Los valores sustituidos en la fórmula * (PN * PN.PR) como denominador * Ya se tiene el denominador PRdenominador: (PN * PN.PR) + (PR * PR.PR)
PTB.N.R <- (PN * PN.PR )/ (PRdenominador)
cat ("Cual es la probabilidad de de sacar una bolita roja del segundo evento o buzón, dado que en el primero fue bolita negra", PTB.N.R)
## Cual es la probabilidad de de sacar una bolita roja del segundo evento o buzón, dado que en el primero fue bolita negra 0.5294118
# Sacando roja y roja auaneu lo lo pide la pregunta perso si lo samos en los resulados tabulares
PTB.R.R <- (PR * PR.PR )/ (PRdenominador)
Se toman la probabilidad de sacar una bolita roja, cuando se inicia por la opción de las negras y se divide por la probabilidad total de sacar una roja calculada en y ahí se tiene una aplicación concreta del Teorema de Bayes.

Solución de manera tabular

Solo se muestran los valores para las piezas malas (Bad) de cada proveedor.

tabular <- data.frame('Eventos'=c('N', 'R'),
            'Prob.Previas'=c(PN, PR),
            'Prob.Condicionales'=c(PN.PR, PR.PR),
            'Prob.Conjuntas'=c(PN * PN.PR, PR  * PR.PR),
            'Prob.Posteriores'=c(PTB.N.R, PTB.R.R ))
tabular
##   Eventos Prob.Previas Prob.Condicionales Prob.Conjuntas Prob.Posteriores
## 1       N          0.6              0.375          0.225        0.5294118
## 2       R          0.4              0.500          0.200        0.4705882
totales <- apply(tabular[-1], 2, sum)
totales <- as.array(c(NA,as.vector(totales))) 

tabular <- rbind(tabular, totales)
tabular
##   Eventos Prob.Previas Prob.Condicionales Prob.Conjuntas Prob.Posteriores
## 1       N          0.6              0.375          0.225        0.5294118
## 2       R          0.4              0.500          0.200        0.4705882
## 3    <NA>          1.0              0.875          0.425        1.0000000
  • En el renglón 3 se identifican los totales, haciendo énfasis en el renglón 3, columna 4.
  • En la columna 2 se tienen las probabilidades de que sea negra y roja, sus sumatorias igual a 1.
  • En la columna 3 las probabilidades condicionales, (3/8) y (1/2) cuando la primera sea negra. No importan los totales
  • En la columna 4 las probabilidades de cada conjunto haciendo notar la suma de éstas que es el denominador en la fórmula de Bayes.
  • En la columna 5 son las probabilidades encontradas utilizando y sustituyendo valores en la Fórmula de Bayes.

Se pide Nuevo experimento:

Realizar el mismo caso con partiendo de inicio de la siguiente imagen:

Utilizando el Teorema de Bayes

1.¿Cuál es la probabilidad de que en el segundo evento se obtenga una bolita roja siendo que en la primera salió una roja? 0.4

2.¿Cuál es la probabilidad de que en el segundo evento se obtenga una bolita negra siendo que en la primera salió una negra? 0.6