En el desarrollo de drogas y otros compuestos químicos, las pruebas de toxicidad aguda o los experimentos de bioensayos se realizan comúnmente en animales. Esos experimentos se realizan administrando varias dosis del compuesto a lotes de animales. Las respuestas de los animales se caracterizan típicamente por un resultado dicotómico: por ejemplo, vivo o muerto, con o sin tumor. Un experimento de este tipo da lugar a datos de la forma:

\[(x_i,n_i,y_i ) \;\ i=1,…,k\]

donde xi representa la i-ésima parte de los niveles de dosis (a menudo medidos en una escala logarítmica) dados a los animales ni, de los cuales yi responden posteriormente con un resultado positivo. En la Tabla siguiente se muestra un ejemplo de datos reales de un experimento de este tipo: se probaron veinte animales, cinco en cada uno de los cuatro niveles de dosis.

Dosis, xi , (log g/ml) Numero de animales ni Numero de muertes, yi
- 0.86 5 0
- 0.30 5 1
- 0.05 5 3
0.73 5 5

Modelizacion de la relacion dosis-respuesta

Dado lo que hemos visto hasta ahora, debemos modelar los resultados de los cinco animales dentro de cada grupo i como intercambiables, y parece razonable modelarlos como independientes con iguales probabilidades, lo que implica que los puntos de datos yi están distribuidos binomialmente:

\[y_i| \theta\ {-} \ Bin(n_i,i)\]

donde \(\theta_i\) es la probabilidad de muerte para los animales a los que se les da la dosis \(x_i\). (Un ejemplo de una situación en la que la independencia y el modelo binomial no serían apropiados es si las muertes fueran causadas por una enfermedad contagiosa). Para este experimento, también es razonable tratar los resultados de los cuatro grupos como independientes entre sí, dados los parámetros \(\theta_1, ... ,\theta_4\).

El análisis más sencillo trataría los cuatro parámetros \(\theta_i\) como intercambiables en su distribución previa, quizás utilizando una densidad no informativa como \(p(\theta_1, ... , \theta_4)\) \(∝\) 1, en cuyo caso los parámetros \(θ_i\) tendrían distribuciónes posteriores beta independientes. Sin embargo, el modelo intercambiable para los parámetros \(θ_i\) tiene un grave defecto; conocemos el nivel de dosis \(x_i\) para cada grupo i, y cabría esperar que la probabilidad de muerte varíe sistemáticamente en función de la dosis. El modelo más simple de la relación dosis-respuesta, es decir, la relación de \(θ_i\) a \(x_i\) es lineal: \(\theta_i = α + βx_i\). Lamentablemente, este modelo tiene el defecto de que, a dosis bajas o altas, \(x_i\) se aproxima a \(±∞\) (recordemos que la dosis se mide en la escala logarítmica), mientras que \(θ_i\), al ser una probabilidad, debe limitarse a situarse entre 0 y 1. La solución estándar es utilizar una transformación de los \(\theta\) , como la logística, en la relación dosis-respuesta:

\[logit(θ_i )=α+βx_i\] Donde \(logit(θ_i )=log(\frac{θ_i}{1-θ_i })\). Esto se llama un modelo de regresión logística.

La verosimilitud

podemos escribir la distribución muestral, o la verosimilitud, para cada grupo i en términos de los parámetros α y β como

\[p(y_i |α,β,n_i,x_i )∝[(logit)^{-1} (α+βx_i )]^{y_i} [(1-logit)^{-1} (α+βx_i )]^{n_i-y_i}\] El modelo se caracteriza por los parámetros \(\alpha\) y \(\beta\), cuya distribución posterior conjunta es

\[p(α,β|y,n,x) \ ∝ \ p(α,β|n,x) \ p(y|α,β,n,x)\] \[∝p(α,β) \ ∏^{k}_{i=1} \ p(y_i |α,β,n_i,x_i ) \] Consideramos que los tamaños de muestra ni y los niveles de dosis \(x_i\) son fijos para este análisis y suprimimos el condicionamiento en (n, x) en la notación siguiente.

La distribución previa

Presentamos un análisis basado en una distribución previa para \((\alpha, \beta)\) que es independiente y localmente uniforme en los dos parámetros; es decir, \(p(\alpha, \beta)\) \(∝\) 1. En la práctica, podríamos utilizar una distribución previa uniforme si realmente no tenemos ningún conocimiento previo de los parámetros, o si queremos presentar un análisis simple de este experimento solamente. Si el análisis que utiliza el método no informativo de la previa no es suficientemente preciso, podemos considerar la posibilidad de utilizar otras fuentes de información (por ejemplo, de otros experimentos de bioensayo) para construir una distribución previa.
  • Grafico: Numero de animales fallecidos vs Dosis

  • Grafica de Contorno para la densidad posterior de los parametos

  • Gráfica de dispersion de 200 extracciones de la distribución posterior

Un parámetro de interés común en los estudios de bioensayos es el LD50, el nivel de dosis al que la probabilidad de muerte es del \(50\%\).
  • Histograma de las 200 extracciones de la distribución posterior de la DL50

Dificultades con la parametrización LD50 si el medicamento es beneficioso. En el contexto de este ejemplo, LD50 es un concepto sin sentido si \(β\) \(≤\) 0, en cuyo caso el aumento de la dosis no aumenta la probabilidad de muerte. Si estuviéramos seguros de que el fármaco no puede hacer que disminuya la frecuencia tumoral, deberíamos restringir el espacio de parámetros para excluir valores de \(β\) menores que 0. Sin embargo, parece más razonable aquí permitir la posibilidad de \(\beta\) \(≤\) 0 y solo notar que LD50 es difícil de interpretar en este caso.

Resumimos la inferencia en la escala LD50 informando dos resultados: (1) la probabilidad posterior de que \(β\) \(>\) 0, es decir, que el fármaco sea dañino, y (2) la distribución posterior para la DL50 condicional en \(β\) \(>\) 0. Todos los 200 sorteos de simulación tuvieron valores positivos de \(β\), por lo que la probabilidad posterior de que \(β\) > 0 sea aproximadamente superior a 0.999. Calculamos el LD50 para los sorteos de simulación con valores positivos de \(β\) (que resultan ser los 200 sorteos para este ejemplo); Se muestra un histograma. Este experimento ilustra que la media posterior marginal no siempre es un buen resumen de inferencia sobre un parámetro. En general, no estamos interesados en la media posterior de la DL50, porque la media posterior incluye los casos en que la relación dosis-respuesta es negativa.
  • Grafica: Proporcion de fallecidos vs dosis