Descripción general del problema y metodología propuesta

Introducción

Los intervalos de referencia son fundamentales para interpretar correctamente los resultados de pruebas de laboratorio en medicina. Tradicionalmente, estos intervalos se determinan a partir de datos de individuos sanos utilizando métodos directos. Sin embargo, estos métodos presentan varios desafíos, incluyendo la dificultad y el costo de la recolección de muestras y la ambigüedad en la definición de “salud”. Por lo tanto, hemos optado por utilizar métodos indirectos para derivar estos intervalos a partir de datos del mundo real (RWD), específicamente empleando el algoritmo refineR descrito por Ammer y colaboradores en 2021.

El algoritmo refineR separa la distribución no patológica de la distribución patológica de los resultados observados utilizando un enfoque inverso e identifica el modelo que mejor explica la distribución no patológica. Para evaluar su rendimiento, en el estidio original publicado por Ammer y colaboradores se simularon resultados de pruebas de seis analitos comunes de laboratorio con ubicaciones y fracciones variables de resultados patológicos. Los intervalos de referencia estimados se compararon con la verdad fundamental, un método indirecto alternativo (kosmic) y el método directo (N = 120 y N = 400 muestras). En general, refineR logró el error porcentual medio más bajo de todos los métodos (2.77%). Además, los intervalos de referencia estimados a partir de datos pediátricos fueron comparables a los estudios de método directo publicados.

En este informe se adopta el algoritmo refineR publicado por Ammer y colaboradores y se detalla el proceso para determinar el punto de corte óptimo para los niveles de tiroxina libre en la población de pacientes de la Fundación Valle de Lili. Los datos analizados provienen del conjunto de reportes de tiroxina libre de enero de 2015. Este análisis tiene como objetivo establecer intervalos de referencia precisos y específicos para nuestra institución, lo que permitirá diagnósticos más acertados y tratamientos personalizados para condiciones relacionadas con la tiroides.

Descripción de la metodologia empleada

El algoritmo refineR se basa en la suposición de que la mayoría de los datos de laboratorio rutinarios son no patológicos y que esta distribución puede modelarse mediante una distribución normal transformada por Box-Cox. La transformada de Box-Cox permite acomodar distribuciones normales y sesgadas. Además, se supone que existe un intervalo de resultados en el cual la proporción de resultados patológicos es insignificante.

A continuación, se describen los pasos detallados del algoritmo refineR y la matemática subyacente a cada uno:

Paso 1: Preprocesamiento de datos

Determinación de regiones de búsqueda de parámetros y pico principal:

  • Se calcula la densidad de los datos observados y se determinan las regiones de búsqueda para los parámetros λ (sesgo), μ (media) y σ (desviación estándar).
  • El parámetro λ se busca en el rango [0, 1.5], ya que cubre la mayoría de los tipos de distribución observados en medicina de laboratorio.
  • Para cada λ, se aplica la transformada de Box-Cox a los datos y se estima la densidad utilizando el algoritmo ash. Se selecciona el pico con el mayor área bajo la curva (AUC).

Definición de la región de interés:

  • Para cada λ cercano a su valor óptimo, se espera una distribución simétrica en el espacio transformado.
  • Se selecciona el λ donde la suma de los rangos de μ y σ es mínima.
  • Se calcula la región de interés en el espacio original mediante la transformación inversa de Box-Cox.

Paso 2: Optimización del modelo

Estimación de un modelo paramétrico:

  • Se calcula la densidad de una distribución normal transformada por Box-Cox M para cada combinación de parámetros λ, μ y σ.
  • El modelo se escala con un factor P (proporción de muestras no patológicas).

Cálculo de la banda de confianza:

  • Se define una banda de confianza alrededor del modelo esperado basado en la estadística de Poisson, cubriendo el 99% de los casos.
  • Se utiliza una banda de confianza asimétrica para contrarrestar el sesgo positivo introducido por las muestras patológicas.

Cálculo del costo:

  • Se seleccionan los bins del histograma que caen dentro de la banda de confianza.
  • Se calcula el costo utilizando la función de verosimilitud negativa regularizada:

\[ \text{Costo} = -\sum_{i} \left( h_i \log(m_i) - m_i \right) + r_i \]

donde \(h_i\) es el conteo observado en el bin \(i\), \(m_i\) es el conteo esperado, y \(r_i\) es el término de regularización que premia bins con mayores conteos.

Paso 3: Identificación de la distribución no patológica

Modelo optimizado:

  • Se identifican los parámetros óptimos λ, μ, σ* y P* que minimizan los costos.
  • Se deriva la distribución no patológica y los intervalos de referencia a partir de este modelo optimizado.

Paso 4: Cálculo de intervalos de confianza usando bootstrap

Bootstrap:

  • Se generan n conjuntos de datos de bootstrap a partir del conjunto de datos original mediante muestreo con reemplazo.
  • Se estima el modelo para cada conjunto de bootstrap y se calculan los límites inferiores y superiores de referencia.
  • Los intervalos de confianza del 95% se obtienen a partir del 95% central de los límites estimados.

Resumen del procedimiento en R

Carga de Datos

Para comenzar, cargamos el conjunto de datos necesario, de-identificamos la información eliminando nombres y apellidos de los pacientes y procedemos a extraer la variable relevante nuestro análisis (reporte de laboratorio). En este paso podría extraerse el sexo y la edad para hacer estimaciones de los valores de corte en subgrupos clínicos de interés pero dado que no contamos con esa información en este dataset se omite esa información para este primer analisis.

## Número de pacientes procesados en enero de 2015: 1086
Previsualización de las primeras filas del conjunto de datos
Orden Historia Servicio Episodio Orden Clinica Código Examen Nombre Examen Resultado
2.01501e+11 29692972 UE T1 P2 UCI adulto lado B 2560515 5154514 3009 TIROXINA LIBRE 1.09
2.01501e+11 16602638 UE Urgencias adulto 2560664 5155287 3009 TIROXINA LIBRE 1.17
2.01501e+11 29284747 UE T1 P6 hospitalizacion orien 2532575 5154894 3009 TIROXINA LIBRE 1.71
2.01501e+11 31247231 UT Laboratorio Clinico 2560910 5155970 3009 TIROXINA LIBRE 1.34
2.01501e+11 16595733 UT Laboratorio Clinico 2560931 5156031 3009 TIROXINA LIBRE 0.95
2.01501e+11 94541258 UT Laboratorio Clinico 2560928 5156019 3009 TIROXINA LIBRE 1.28

Estimación de intervalos de referencia usando refineR

Como se describió anteriormente, el algoritmo refineR se basa en una aproximación inversa para separar la distribución de muestras no patológicas de las patológicas, utilizando una distribución normal transformada por Box-Cox. En esta sección, utilizaremos refineR para modelar la distribución de niveles de tiroxina libre en nuestra población y establecer intervalos de referencia precisos. Estos intervalos nos permitirán identificar con mayor precisión los límites de normalidad en los resultados de laboratorio, mejorando así la interpretación y diagnóstico clínico.

## 
## Reference Intervals
## ------------------------------------------------
## lower limit [ 2.5% perc]: 0.813
## upper limit [97.5% perc]: 1.54
## 
## Model Parameters
## ------------------------------------------------
##      method: refineR (v1.6.1)
##       model: BoxCox
##      N data: 1061
##     rounded: yes (base: 0.01)
##   point est: fullDataEst
##      lambda: 0.827
##          mu: 0.165
##       sigma: 0.181
##       shift: 0
##        cost: -14.3
## NP fraction: 0.912
##   Percentile  PointEst CILow CIHigh
## 1      0.025 0.8125392    NA     NA
## 2      0.975 1.5417511    NA     NA

En el analisis mas básico, los puntos de corte estimados para tiroxina libre en muestras de poblacion general que se procesen en el laboratorio de la Fundación Valle de Lili serían:

Límite inferior: 0.81ng/dL Límite superior: 1.54ng/dL

En esta etapa del análisis, aún no hemos aplicado el método de bootstrap para calcular los intervalos de confianza alrededor de estos puntos de corte. El método bootstrap implica generar múltiples subconjuntos de los datos originales mediante muestreo con reemplazo y estimar los intervalos de referencia para cada uno de estos subconjuntos. Al repetir este proceso varias veces podemos obtener una distribución de los límites de referencia y calcular los intervalos de confianza del 95%.

Estimación Avanzada del Modelo con Bootstrap

Basado en lo anterior, para mejorar la precisión de nuestra estimación, emplearemos el método de bootstrap con 200 iteraciones. El bootstrap nos permite calcular intervalos de confianza más robustos al simular múltiples muestras del conjunto de datos original, lo que aumenta la fiabilidad de nuestros resultados.

El proceso de bootstrap se realiza de la siguiente manera:

  1. Generación de Muestras Bootstrap:
    • Se generan 200 subconjuntos (o muestras) del conjunto de datos original mediante muestreo con reemplazo. Esto significa que cada muestra bootstrap puede contener múltiples copias de algunos datos del conjunto original y puede excluir otros.
  2. Estimación de Intervalos de Referencia en Cada Iteración:
    • Para cada una de las 200 muestras bootstrap, se calcula el intervalo de referencia utilizando el algoritmo refineR. Esto implica estimar los parámetros de la distribución normal transformada por Box-Cox (λ, μ, σ) para cada muestra y determinar los límites de referencia (percentiles 2.5% y 97.5%).
  3. Construcción de la Distribución de los Límites de Referencia:
    • Los resultados de las 200 iteraciones se combinan para formar una distribución de los límites de referencia estimados. Esta distribución nos permite evaluar la variabilidad de las estimaciones de los límites de referencia.
  4. Cálculo de Intervalos de Confianza:
    • A partir de la distribución de los límites de referencia obtenida en el paso anterior, se calcula el intervalo de confianza del 95%. Esto se hace tomando los percentiles 2.5% y 97.5% de la distribución de los límites de referencia de las 200 muestras bootstrap. Estos intervalos de confianza nos proporcionan una medida de la incertidumbre asociada a las estimaciones de los límites de referencia.
## 
## Reference Intervals
## ------------------------------------------------
## lower limit [ 2.5% perc]: 0.813 (0.75; 0.887)
## upper limit [97.5% perc]: 1.54 (1.47; 1.63)
## 
## Model Parameters
## ------------------------------------------------
##      method: refineR (v1.6.1)
##       model: BoxCox
##      N data: 1061
## N bootstrap: 200
##     rounded: yes (base: 0.01)
##   point est: fullDataEst
##      lambda: 0.827
##          mu: 0.165
##       sigma: 0.181
##       shift: 0
##        cost: -14.3
## NP fraction: 0.912
##   Percentile PointEst     CILow    CIHigh
## 1      0.025 0.827957 0.7502801 0.8865771
## 2      0.975 1.537573 1.4684747 1.6312779

Tras realizar un análisis mas robusto, los puntos de corte estimados para tiroxina libre en muestras de poblacion general que se procesen en el laboratorio de la Fundación Valle de Lili serían:

Límite inferior: 0.83ng/dL con un intervalo de confianza de [ 0.75ng/dL - 0.89 ]ng/dL Límite superior: 1.54ng/dL con un intervalo de confianza de [ 1.47ng/dL - 1.63 ]ng/dL

Visualización de Resultados

Con el objetivo de verificar la idoneidad de los resultados generados, se genera un plot que facilita visualizar la distribucion de los valores reportados en el laboratorio y los intervalos de referencia establecidos dentro de esta distribucion. A continuación, graficamos el modelo estimado, incluyendo intervalos de confianza, para visualizar mejor estos resultados y asegurarnos de que son fácilmente interpretables.

Conclusión

Basándonos en el análisis realizado con refineR, hemos establecido un intervalo de referencia preliminar para los niveles de tiroxina libre en nuestra población de pacientes. Según esto se estableció un limite inferior de 0.83ng/dL con un intervalo de confianza de [ 0.75ng/dL - 0.89 ]ng/dL y un limite superior de 1.54ng/dL con un intervalo de confianza de [ 1.47ng/dL - 1.63 ]ng/dL. Este intervalo proporciona una base inicial para la interpretación de resultados en el laboratorio de la Fundación Valle de Lili. Sin embargo, es importante destacar que este reporte es preliminar debido al tamaño reducido del marco muestral, lo cual puede limitar su representatividad para toda la población de la Fundación.

Para obtener intervalos de referencia más robustos y confiables, es necesario replicar este análisis utilizando datos de laboratorio recopilados durante varios años consecutivos. Además, una exportación más completa de los datos que incluya variables como el sexo y la edad de los pacientes permitiría establecer intervalos de referencia más específicos y personalizados según grupos etarios y de género, mejorando significativamente la precisión diagnóstica y la personalización del tratamiento.

Referencias

  1. Ammer, T., Schuetzenmeister, A., Prokosch, HU., Rauh, M., Rank, C.M., Zierk, J. refineR: A Novel Algorithm for Reference Interval Estimation from Real-World Data. Scientific Reports, 11, 16023 (2021). https://doi.org/10.1038/s41598-021-95301-2.
  2. Ammer, T., Schuetzenmeister, A., Rank, C.M., Doyle, K. Estimation of Reference Intervals from Routine Data Using the refineR Algorithm — A Practical Guide. The Journal of Applied Laboratory Medicine, 8(1):84-91 (2023). https://doi.org/10.1093/jalm/jfac101.
  3. Yang, D., Su, Z., Zhao, M. Big data and reference intervals. Clinica Chimica Acta, 527 (2022) 23–32. https://doi.org/10.1016/j.cca.2022.01.001.