Calcular e interpretar probabilidades mediante el teorema de Bayes.
Cargar librerías necesarias, establecer el fundamento teórico, definir fórmula del teorema de Bayes y construir e interpretar ejercicios mediante Teprema de Bayes.
La Ley de la Multiplicación es útil para calcular la probabilidad de la intersección de dos eventos.
La ley de la multiplicación se basa en la definición de probabilidad condicional.
Se multiplican las probabilidades, y en este caso teniendo las probabilidades identificadas en el árbol se determinan mediante su multiplicación.
El teorema de Bayes es un método que se usa en probabilidad el cual es útil para encontrar una probabilidad condicionada, esto quiere decir que se calcula la probabilidad de un suceso cuando ya ha ocurrido otro suceso que afecta la probabilidad del primer suceso [@fhybear].
Por otra parte, el teorema de Bayes se usa cuando hay múltiples sucesos que están relacionados, una herramienta que se usa para poder entender mejor las relaciones que hay entre sucesos son los diagramas de árbol identificados en este documento.
Se asume que los eventos E y NE son mutuamente excluyentes y colectivamente exhaustivos (se complementan o se asocian), y E y NE se refieren a cualquiera de ambos eventos. De ahí que en este caso E y EN sean complementos. [@lind2015].
Suponga que el 5% de un pais tiene o padece una enfermedad. Sea E el evento “padece la enfermedad” y EN el evento “no padece la enfermedad”. Por lo tanto, si selecciona al azar a una persona de ese País ficticio, la probabilidad de que el individuo elegido padezca la enfermedad es de 0.05 \(P(E) = 0.05\) o 5%.
Esta probabilidad, \(P(E) = P(\text{padece la enfermedad}) = 0.05\), recibe el nombre de probabilidad a priori, es deir, la que está basada en el nivel de información actual.[@lind2015].
Entonces, la probabilidad a priori de que una persona no padezca la enfermedad es de \(0.95\), o \(P(EN) =0.95\), que se calcula mediante la resta \(1 - 0.05\)
Este este mismo ejemplo, existen pruebas para verificar si las
personas tienen esa enfermedad, la prueba de diagnóstico para detectar
la enfermedad, no es muy precisa. Sea PP
el evento “la prueba revela la presencia de la enfermedad”.
Suponga que la evidencia histórica muestra que si una persona padece
realmente la enfermedad, la probabilidad de que la prueba indique su
presencia es de \(0.90\) por lo que la
prueba resulta en \(0.10\) de que
negativa a personas que si la padecen.
Luego existe evidencia en las pruebas de que hay un \(P(Pos) = 15\)% de pruebas positivas a
personas que no padecen la enfermedad y por consecuencia un \(P(Neg)=85\)% de pruebas negativas a
personas que no la padecen.
Para este ejemplo, las probabilidades indican que la enfermedad existe, sin embargo, la pregunta es: ¿Cuál es la probabilidad de que una persona realmente padezca la enfermedad?
De forma simbólica se necesita \(P(E | Pos)\) o lo que es lo mismo de acuerdo a la propiedad multiplicativa de eventos independientes \(P(E \cap Pos) = P(E)\cdot P(Pos)\).
A esto se le conoce como probabilidad A posteriori y es la base para el Teorema de Bayes.
Así que la probabilidad de que una persona padezca la enfermedad, dado que la prueba fue positiva es de 0.24.
Esto se interpreta de la siguiente manera: si se le somete a la prueba y resulta positiva, la probabilidad de que la persona padezca realmente la enfermedad se incrementa cinco veces, de 0.05 a 0.24.
\[ P(E|Pos) = \frac{P(E)\cdot P(E\cdot Pos)}{(P(E)\cdot P(E\cdot Pos) + P(NE)\cdot P(NE\cdot Pos))}\therefore \]
\[ P(E|Pos) = \frac{0.05\cdot 0.90}{0.05\cdot 0.90 + 0.95\cdot 0.15} = \frac{0.0450}{0.1875} = 0.24 \]
\[ p(A_i|B) = \frac{p(A_i) \cdot p(B|A_i)}{\sum_{i=1}^np(A_i) \cdotp(B|A_i)} \]
Con el teorema de Bayes se calcula la probabilidad haciendo preguntas a la inversa, si la pregunta se hace al revés, es decir:
Ejemplo:
Existen tres sectores en donde trabajan las personas
Hay una probabilidad de que en el sector servicios trabaje 40%(0.40) de las personas
Hay una probabilidad de que en el sector salud trabaje 35%(0.35) de las personas
Hay una probabilidad de que en el sector otros trabaje 25%(0.25) de las personas
La suma debe dar 100% o 1
P.Servi <- 0.40
P.Salud <- 0.35
P.Otros <- 0.25
Se dan las probabilidades de que sea de algún género en función del servicio.
En el sector Servicios la probabilidad de que sea Mujer es del 0.30
En el sector Servicios la probabilidad de que sea Hombre es del 0.70
P.Servi.Mujer <- 0.30
P.Servi.Hombre <- 0.70
P.Servi.Mujer; P.Servi.Hombre
## [1] 0.3
## [1] 0.7
En el sector Salud la probabilidad de que sea Mujer es del 0.60
En el sector Salud la probabilidad de que sea Hombre es del 0.40
P.Salud.Mujer <- 0.60
P.Salud.Hombre <- 0.40
P.Salud.Mujer; P.Salud.Hombre
## [1] 0.6
## [1] 0.4
En el sector Otros la probabilidad de que sea Mujer es del 0.45
En el sector Otros la probabilidad de que sea Hombre es del 0.55
P.Otros.Mujer <- 0.45
P.Otros.Hombre <- 0.55
P.Otros.Mujer; P.Otros.Hombre
## [1] 0.45
## [1] 0.55
De de acuerdo a ley mutiplicativa para eventos independientes para encontrar \(P(A\cap B) = P(A)\cdot P(B) \therefore\)
¿Cuál es la probabilidad que si se selecciona a alguien que se a del sector salud, este es hombre?
P.Salud_y_Hombre <- P.Salud * P.Salud.Hombre
P.Salud_y_Hombre
## [1] 0.14
El numerador es el producto de la probabilidad de A y B, el denominador es la probabilidad total.
\[ P(Hombre|Salud)\frac{P(Salud)\cdot P(Salud\cap Hombre)}{(P(Serv)\cdot P(Serv \cap Hombre) + P(Salud)\cdot P(Salud \cap Hombre) + P(Otros)\cdot P(Otros \cap Hombre))} \]
\[ P(Hombre|Salud) = \frac{0.14}{0.28 + 0.14 + 0.1375} = \frac{0.14}{0.5575} = 0.25 = 25\% \]
P.Salud_y_Hombre <- P.Salud * P.Salud.Hombre
P.Salud_y_Hombre
## [1] 0.14
Es la probabilidad total con respecto a que se hombre
P.Servicio_y_Hombre <- P.Servi * P.Servi.Hombre
P.Salud_y_Hombre <- P.Salud * P.Salud.Hombre
P.Otro_y_Hombre <- P.Otros * P.Otros.Hombre
P.Total <- P.Servicio_y_Hombre + P.Salud_y_Hombre + P.Otro_y_Hombre
P.Total
## [1] 0.5575
La probabilidad es:
Prob <- P.Salud_y_Hombre / P.Total
Prob <- Prob * 100
Significa que la probabilidad de elegir aleatoriamente una persona que sea Hombre y que sea del sector Salud o que está en función del sector salud es del 25.1121%.
\[ P(Mujer|Salud)\frac{P(Salud)\cdot P(Salud\cap Mujer)}{(P(Serv)\cdot P(Serv \cap Mujer) + P(Salud)\cdot P(Salud \cap Mujer) + P(Otros)\cdot P(Otros \cap Mujer)} \]
P.Salud_y_Mujer <- P.Salud * P.Salud.Mujer
P.Salud_y_Mujer
## [1] 0.21
Es la probabilidad total con respecto a que se hombre
P.Servicio_y_Mujer <- P.Servi * P.Servi.Mujer
P.Salud_y_Mujer <- P.Salud * P.Salud.Mujer
P.Otro_y_Mujer <- P.Otros * P.Otros.Mujer
P.Total <- P.Servicio_y_Mujer + P.Salud_y_Mujer + P.Otro_y_Mujer
P.Total
## [1] 0.4425
La probabilidad es:
Prob <- P.Salud_y_Mujer / P.Total
Prob <- Prob * 100
Significa que la probabilidad de elegir aleatoriamente una persona que sea Mujer y que sea del sector Salud o que está en función del sector salud es del 47.4576%.
Hacer los ejercicios siguientes:
# Pendiente
# No hay librerías a cargar
Se hizo una encuesta a un grupo grande de personas donde se les preguntaba el genero y si ellos practicaban algún deporte o hacían ejercicio en general, los resultados de la encuesta fueron los siguientes: el 40% por ciento de los encuestados eran hombres y el 60% eran mujeres, de los cuales el 80% de los hombres y el 50% de las mujeres hacían ejercicios.
P.H <- 0.40
P.M <- 0.60
P.SD_H <- 0.80
P.ND_H <- 0.20
P.SD_M <- 0.50
P.ND_M <- 0.50
\[ P(Hombre|Deporte)= \frac{P(Hombre\cap SI.Deporte)}{P(Hombre \cap SI.Deporte) + P(Mujer \cap SI.Deporte) } \]
Numerador
P.H_y_SI <- P.H * P.SD_H
P.H_y_SI
## [1] 0.32
Denominador
P.H_y_SI <- P.H * P.SD_H
P.M_y_SI <- P.M * P.SD_M
P.Total <- P.H_y_SI + P.M_y_SI
P.Total
## [1] 0.62
La probabilidad es:
Prob <- P.H_y_SI / P.Total
Prob <- Prob * 100
Prob
## [1] 51.6129
Significa que la probabilidad de elegir aleatoriamente una persona que SI practique Deporte y que sea Hombre es del 51.6129%
Un fabricante de teléfonos celulares compra un microchip en particular denominado “LS-24” a 3 proveedores Hall Electronics, Schuller Sales,y Crawford Components.
Del total de piezas 30% la adquiere Hall Electronics; 20% de Schuller Sales y el restante 50% de crawford.
El fabricante cuenta con amplias historiales con los 3 proveedores y reconoce los porcentajes de defecto de los dispositivos de cada proveedores: 3% Hall Electronics 5% Schuller sales 4% Crawford Componens
Cuando el fabricante recibe el material y lo lleva directamente a un depósito y no lo inspecciona ni lo identifica con el nombre de proveedor.
Un trabajador selecciona un microchip para instalarlo y lo encontró defectuoso. ¿Cual es la probabibilidad que lo hayan fabricado Schuler Sales?
P_Hall <- 0.3
P_Schuller <- 0.2
P_Crawford <- 0.5
P_def_Hall <- 0.03
P_def_Schuller <- 0.05
P_def_Crawford <- 0.04
P_def_total <- P_def_Hall * P_Hall + P_def_Schuller * P_Schuller + P_def_Crawford * P_Crawford
P_B_dado_A <- (P_def_Schuller * P_Schuller) / P_def_total
P_B_dado_A <- P_B_dado_A * 100
paste("La probabilidad de que Schuller Sales fabricara el microchip defectuoso es de", round(P_B_dado_A, 2), "%")
## [1] "La probabilidad de que Schuller Sales fabricara el microchip defectuoso es de 25.64 %"
Fuente: [@lind2015]