1. Introducción

El análisis de pruebas diagnósticas es fundamental en la toma de decisiones médicas, ya que permite identificar la presencia de enfermedades en una población. Sin embargo, la interpretación de los resultados puede ser compleja si no se consideran factores como la prevalencia de la enfermedad y la precisión de la prueba.

El Teorema de Bayes proporciona un enfoque estadístico que permite actualizar probabilidades a partir de nueva evidencia, ofreciendo una interpretación más precisa de los resultados obtenidos en pruebas médicas.


2. Planteamiento del Problema

Se analiza un caso de diagnóstico médico en el que se dispone de una prueba para detectar cáncer. Se conoce la prevalencia de la enfermedad en la población, así como la sensibilidad de la prueba y la tasa de falsos positivos.

El objetivo es determinar la probabilidad de que una persona tenga cáncer dado que el resultado de su prueba ha sido positivo.


3. Objetivos

3.1 Objetivo General

Aplicar el Teorema de Bayes para determinar la probabilidad de que un individuo tenga cáncer dado un resultado positivo en una prueba diagnóstica.

3.2 Objetivos Específicos

  • Identificar las probabilidades previas asociadas al problema.
  • Aplicar el modelo bayesiano para el cálculo de probabilidades.
  • Analizar la influencia de la prevalencia en los resultados obtenidos.
  • Interpretar los resultados desde un enfoque estadístico.

4. Marco Teórico

El Teorema de Bayes es una herramienta fundamental en la teoría de la probabilidad que permite actualizar la probabilidad de un evento en función de nueva información. Se expresa de la siguiente manera:

\[ P(A|B) = \frac{P(B|A)\cdot P(A)}{P(B)} \]

Donde:

En el contexto del diagnóstico médico:

Conceptos Clave

Prevalencia: Proporción de individuos que presentan la enfermedad en una población.

Sensibilidad: Probabilidad de que la prueba sea positiva cuando la enfermedad está presente.

Falsos Positivos: Probabilidad de que la prueba sea positiva en individuos sanos.

Probabilidad Posterior: Probabilidad de que un individuo tenga la enfermedad después de conocer el resultado de la prueba.


5. Metodología

Para el desarrollo del análisis se utiliza un enfoque bayesiano, el cual combina la información previa con la evidencia proporcionada por la prueba diagnóstica.

El procedimiento consiste en:


6. Desarrollo

En esta sección se realiza la aplicación del Teorema de Bayes al problema planteado, utilizando herramientas estadísticas para calcular las probabilidades correspondientes y analizar los resultados obtenidos.


# ====================================================
# BAYES — Caso 1: Diagnóstico Médico
# ====================================================

# Datos del problema
prevalencia  <- 0.01   # Define la probabilidad previa P(Cáncer) = 1% (proporción de la población que tiene la enfermedad)
sensibilidad <- 0.80   # Define P(Positivo | Cáncer): capacidad de la prueba para detectar correctamente a los enfermos
falso_pos    <- 0.096  # Define P(Positivo | No Cáncer): probabilidad de obtener un positivo en personas sanas (falso positivo)

# Tabla Bayesiana
estados <- c("Cáncer", "No Cáncer")  # Vector que contiene los posibles estados: tener o no la enfermedad

prior   <- c(prevalencia, 1 - prevalencia)  # Vector de probabilidades previas: P(Cáncer) y P(No Cáncer)

likel   <- c(sensibilidad, falso_pos)   # Vector de verosimilitudes: P(Positivo | estado), clave en el Teorema de Bayes

# Paso 1-3: conjuntas
conjunta <- prior * likel   # Calcula probabilidades conjuntas: P(estado ∩ positivo) = P(estado)*P(Positivo|estado)

# Paso 4: probabilidad marginal de la evidencia
P_positivo <- sum(conjunta)   # Suma de probabilidades conjuntas → P(Positivo), llamada evidencia en Bayes

cat("P(Positivo) =", round(P_positivo, 4), "\n")   # Imprime la probabilidad total de obtener un resultado positivo
## P(Positivo) = 0.103
# Paso 5: posteriors
posterior <- conjunta / P_positivo   # Aplica Bayes: P(estado | positivo) = conjunta / evidencia

# Tabla completa
tabla <- data.frame(
  Estado      = estados,              # Estados posibles del problema
  Prior       = prior,                # Probabilidades previas
  Verosimil   = likel,                # Probabilidades condicionales (verosimilitud)
  Conjunta    = conjunta,             # Probabilidades conjuntas
  Posterior   = round(posterior, 4)   # Probabilidades posteriores (resultado final de Bayes)
)
print(tabla)   # Muestra la tabla completa con todos los cálculos
##      Estado Prior Verosimil Conjunta Posterior
## 1    Cáncer  0.01     0.800  0.00800    0.0776
## 2 No Cáncer  0.99     0.096  0.09504    0.9224
cat("\n→ P(Cáncer | Positivo) =", round(posterior[1] * 100, 1), "%\n")   # Imprime la probabilidad de tener cáncer dado positivo
## 
## → P(Cáncer | Positivo) = 7.8 %
cat("→ Aunque la prueba es positiva, solo el",
    round(posterior[1] * 100, 1), "% tiene cáncer.\n")   # Interpretación: efecto de baja prevalencia en el resultado
## → Aunque la prueba es positiva, solo el 7.8 % tiene cáncer.
# Visualización: cómo cambia la posterior con distintas prevalencias
library(ggplot2)   # Carga la librería ggplot2 para crear gráficos

prevalencias <- seq(0.001, 0.20, 0.001)   # Genera valores de prevalencia desde 0.1% hasta 20% para analizar el comportamiento

post_cancer <- sapply(prevalencias, function(p) {   # Aplica una función a cada valor de prevalencia
  conj <- c(sensibilidad * p, falso_pos * (1 - p))   # Calcula probabilidades conjuntas para cada prevalencia
  conj[1] / sum(conj)   # Calcula P(Cáncer | Positivo) usando Bayes para cada caso
})

df_prev <- data.frame(prevalencia = prevalencias, posterior = post_cancer)   # Crea un data frame con los resultados para graficar

ggplot(df_prev, aes(x = prevalencia * 100, y = posterior * 100)) +   # Define el gráfico: eje X = prevalencia, eje Y = probabilidad posterior
  geom_line(color = "#3a7fbd", linewidth = 1.2) +   # Dibuja la curva que muestra la relación entre prevalencia y probabilidad posterior
  geom_point(data = data.frame(x = 1, y = posterior[1] * 100),
             aes(x = x, y = y), color = "#b0305a", size = 4) +   # Marca el punto específico para prevalencia del 1%
  annotate("text", x = 2, y = posterior[1] * 100,
           label = paste0("Prevalencia 1%\nP(Cáncer|+) = ",
                           round(posterior[1] * 100, 1), "%"),
           hjust = 0, color = "#b0305a", size = 3.5) +   # Añade una etiqueta explicativa en el gráfico
  labs(title = "Efecto de la Prevalencia sobre el Valor Predictivo Positivo",
       subtitle = "Mamografía: Sensibilidad=80%, Tasa FP=9.6%",
       x = "Prevalencia (%)", y = "P(Cáncer | Positivo) (%)") +   # Agrega títulos y nombres de ejes
  theme_minimal() +   # Aplica un estilo visual limpio al gráfico
  scale_x_continuous(labels = function(x) paste0(x, "%")) +   # Formatea el eje X como porcentaje
  scale_y_continuous(labels = function(x) paste0(x, "%"))   # Formatea el eje Y como porcentaje

7. Resultados

A partir de la aplicación del Teorema de Bayes, se obtuvo la probabilidad de que una persona tenga cáncer dado que el resultado de la prueba es positivo.

Los resultados muestran que, a pesar de que la prueba tiene una alta sensibilidad, la probabilidad posterior de tener cáncer es relativamente baja. Esto se debe principalmente a la baja prevalencia de la enfermedad en la población analizada.

En términos generales, la probabilidad de obtener un resultado positivo incluye tanto verdaderos positivos como falsos positivos, lo que reduce la certeza del diagnóstico cuando la enfermedad es poco frecuente.


8. Discusión

Los resultados obtenidos evidencian la importancia de considerar la prevalencia en la interpretación de pruebas diagnósticas. En contextos donde la enfermedad es poco común, incluso pruebas con buena precisión pueden generar una proporción considerable de falsos positivos.

Esto implica que un resultado positivo no debe interpretarse de manera aislada, sino en conjunto con otros factores clínicos y pruebas adicionales. El uso del Teorema de Bayes permite precisamente integrar esta información y evitar conclusiones erróneas.

Además, se observa que a medida que la prevalencia aumenta, la probabilidad posterior también se incrementa, lo que mejora la confiabilidad del resultado positivo. Esto resalta la necesidad de aplicar estos análisis en contextos adecuados.


9. Conclusiones


10. Referencias