El teorema de Bayes es una regla fundamental en la teoría de la probabilidad que permite actualizar la probabilidad de un suceso A condicionada por otro suceso B. La fórmula general simplificada del teorema de Bayes es:
\[P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\]
Donde:
Supongamos que una prueba clínica para detectar una enfermedad tiene una sensibilidad del 99% y una especificidad del 95%. Si la enfermedad tiene una prevalencia del 1% en la población, ¿cuál es la probabilidad de que una persona tenga la enfermedad si la prueba da positivo?
Primero, construimos un árbol de probabilidades para visualizar el problema.
library(DiagrammeR)
library(DiagrammeRsvg)
library(rsvg)
## Linking to librsvg 2.61.0
# Create the graph
graph <- grViz("
digraph probability_tree {
node [shape = circle]
Prueba -> I [label = 'P(I) = 0.01']
Prueba -> S [label = 'P(S) = 0.99']
I -> Ip [label = 'P(Ip) = 0.99']
I -> In [label = 'P(In) = 0.01']
S -> Sp [label = 'P(Sp) = 0.05']
S -> Sn [label = 'P(Sn) = 0.95']
}
")
# Convert the graph to an SVG object
svg <- export_svg(graph)
# Save the SVG as a PNG file
rsvg_png(charToRaw(svg), "graph.png")
# The file "graph.png" will be saved in your working directory
graph
Figura 2: Árbol de probabilidades para una prueba clínica.
Dónde: - \(P(I)\) es la probabilidad
de tener la enfermedad (prevalencia).
- \(P(S)\) es la probabilidad de no
tener la enfermedad (1 - P(I)).
- \(P(Ip)\) es la probabilidad de
obtener un resultado positivo en la prueba si se tiene la enfermedad
(sensibilidad de la prueba).
- \(P(In)\) es la probabilidad de
obtener un resultado negativo en la prueba si se tiene la enfermedad
(falso negativo).
- \(P(Sp)\) es la probabilidad de
obtener un resultado positivo en la prueba si no se tiene la enfermedad
(falso positivo).
- \(P(Sn)\) es la probabilidad de
obtener un resultado negativo en la prueba si no se tiene la enfermedad
(especificidad de la prueba).
Primero, calculamos la probabilidad de obtener un resultado positivo P(Pos) en la prueba:
\[P(Pos) = P(S) \cdot P(Sp) + P(I) \cdot P(Ip)\]
P_I <- 0.01
P_S <- 0.99
P_Ip <- 0.99
P_Sp <- 0.05
P_Pos <- P_S * P_Sp + P_I * P_Ip
P_Pos
## [1] 0.0594
Luego, se aplica el teorema de Bayes para calcular la probabilidad inversa de que una persona esté enferma dado que ha obtenido un resultado positivo en la prueba. Este cálculo es crucial en medicina para interpretar correctamente los resultados de las pruebas diagnósticas, especialmente cuando se trata de enfermedades con baja prevalencia.
# Definir la función para la probabilidad inversa con el teorema de Bayes
bayes_prob <- function(P_I, P_Ip, P_Pos) {
P_I_dado_Pos <- ((P_Ip * P_I) / P_Pos)
return(P_I_dado_Pos)
}
# cálculo con los datos anteriores
PIp <- bayes_prob(P_I, P_Ip, P_Pos)
PIp
## [1] 0.1666667
EJERCICIO: Cuando una paciente se somete a un examen de detección de cáncer de mama, existen dos afirmaciones excluyentes: la paciente tiene cáncer o la paciente no lo tiene. Si una mamografía arroja un resultado positivo, ¿cuál es la probabilidad (posterior) de que la paciente tenga cáncer en realidad?
Datos:
- La prevalencia del cáncer de mama es del 1.7 % (probabilidad
previa).
- La sensibilidad de la mamografía es del 80 % (verosimilitud).
- La especificidad de la mamografía es del 90 %.