Los intervalos de referencia son fundamentales para interpretar correctamente los resultados de pruebas de laboratorio en medicina. Tradicionalmente, estos intervalos se determinan a partir de datos de individuos sanos utilizando métodos directos. Sin embargo, estos métodos presentan varios desafíos, incluyendo la dificultad y el costo de la recolección de muestras y la ambigüedad en la definición de “salud”. Por lo tanto, hemos optado por utilizar métodos indirectos para derivar estos intervalos a partir de datos del mundo real (RWD), específicamente empleando el algoritmo refineR descrito por Ammer y colaboradores en 2021.
El algoritmo refineR separa la distribución no patológica de la distribución patológica de los resultados observados utilizando un enfoque inverso e identifica el modelo que mejor explica la distribución no patológica. Para evaluar su rendimiento, en el estidio original publicado por Ammer y colaboradores se simularon resultados de pruebas de seis analitos comunes de laboratorio con ubicaciones y fracciones variables de resultados patológicos. Los intervalos de referencia estimados se compararon con la verdad fundamental, un método indirecto alternativo (kosmic) y el método directo (N = 120 y N = 400 muestras). En general, refineR logró el error porcentual medio más bajo de todos los métodos (2.77%). Además, los intervalos de referencia estimados a partir de datos pediátricos fueron comparables a los estudios de método directo publicados.
En este informe se adopta el algoritmo refineR publicado por Ammer y colaboradores y se detalla el proceso para determinar el punto de corte óptimo para los niveles de tiroxina libre en la población de pacientes de la Fundación Valle de Lili. Los datos analizados provienen del conjunto de reportes de tiroxina libre de enero de 2015. Este análisis tiene como objetivo establecer intervalos de referencia precisos y específicos para nuestra institución, lo que permitirá diagnósticos más acertados y tratamientos personalizados para condiciones relacionadas con la tiroides.
El algoritmo refineR se basa en la suposición de que la mayoría de los datos de laboratorio rutinarios son no patológicos y que esta distribución puede modelarse mediante una distribución normal transformada por Box-Cox. La transformada de Box-Cox permite acomodar distribuciones normales y sesgadas. Además, se supone que existe un intervalo de resultados en el cual la proporción de resultados patológicos es insignificante.
A continuación, se describen los pasos detallados del algoritmo refineR y la matemática subyacente a cada uno:
\[ \text{Costo} = -\sum_{i} \left( h_i \log(m_i) - m_i \right) + r_i \]
donde \(h_i\) es el conteo observado en el bin \(i\), \(m_i\) es el conteo esperado, y \(r_i\) es el término de regularización que premia bins con mayores conteos.
Para comenzar, cargamos el conjunto de datos necesario, de-identificamos la información eliminando nombres y apellidos de los pacientes y procedemos a extraer la variable relevante nuestro análisis (reporte de laboratorio). En este paso podría extraerse el sexo y la edad para hacer estimaciones de los valores de corte en subgrupos clínicos de interés pero dado que no contamos con esa información en este dataset se omite esa información para este primer analisis.
## Número de pacientes procesados en enero de 2015: 1086
| Orden | Historia | Servicio | Episodio | Orden Clinica | Código Examen | Nombre Examen | Resultado |
|---|---|---|---|---|---|---|---|
| 2.01501e+11 | 29692972 | UE T1 P2 UCI adulto lado B | 2560515 | 5154514 | 3009 | TIROXINA LIBRE | 1.09 |
| 2.01501e+11 | 16602638 | UE Urgencias adulto | 2560664 | 5155287 | 3009 | TIROXINA LIBRE | 1.17 |
| 2.01501e+11 | 29284747 | UE T1 P6 hospitalizacion orien | 2532575 | 5154894 | 3009 | TIROXINA LIBRE | 1.71 |
| 2.01501e+11 | 31247231 | UT Laboratorio Clinico | 2560910 | 5155970 | 3009 | TIROXINA LIBRE | 1.34 |
| 2.01501e+11 | 16595733 | UT Laboratorio Clinico | 2560931 | 5156031 | 3009 | TIROXINA LIBRE | 0.95 |
| 2.01501e+11 | 94541258 | UT Laboratorio Clinico | 2560928 | 5156019 | 3009 | TIROXINA LIBRE | 1.28 |
Como se describió anteriormente, el algoritmo refineR se basa en una aproximación inversa para separar la distribución de muestras no patológicas de las patológicas, utilizando una distribución normal transformada por Box-Cox. En esta sección, utilizaremos refineR para modelar la distribución de niveles de tiroxina libre en nuestra población y establecer intervalos de referencia precisos. Estos intervalos nos permitirán identificar con mayor precisión los límites de normalidad en los resultados de laboratorio, mejorando así la interpretación y diagnóstico clínico.
##
## Reference Intervals
## ------------------------------------------------
## lower limit [ 2.5% perc]: 0.813
## upper limit [97.5% perc]: 1.54
##
## Model Parameters
## ------------------------------------------------
## method: refineR (v1.6.1)
## model: BoxCox
## N data: 1061
## rounded: yes (base: 0.01)
## point est: fullDataEst
## lambda: 0.827
## mu: 0.165
## sigma: 0.181
## shift: 0
## cost: -14.3
## NP fraction: 0.912
## Percentile PointEst CILow CIHigh
## 1 0.025 0.8125392 NA NA
## 2 0.975 1.5417511 NA NA
En el analisis mas básico, los puntos de corte estimados para tiroxina libre en muestras de poblacion general que se procesen en el laboratorio de la Fundación Valle de Lili serían:
Límite inferior: 0.81ng/dL Límite superior: 1.54ng/dL
En esta etapa del análisis, aún no hemos aplicado el método de bootstrap para calcular los intervalos de confianza alrededor de estos puntos de corte. El método bootstrap implica generar múltiples subconjuntos de los datos originales mediante muestreo con reemplazo y estimar los intervalos de referencia para cada uno de estos subconjuntos. Al repetir este proceso varias veces podemos obtener una distribución de los límites de referencia y calcular los intervalos de confianza del 95%.
Basado en lo anterior, para mejorar la precisión de nuestra estimación, emplearemos el método de bootstrap con 200 iteraciones. El bootstrap nos permite calcular intervalos de confianza más robustos al simular múltiples muestras del conjunto de datos original, lo que aumenta la fiabilidad de nuestros resultados.
El proceso de bootstrap se realiza de la siguiente manera:
##
## Reference Intervals
## ------------------------------------------------
## lower limit [ 2.5% perc]: 0.813 (0.75; 0.887)
## upper limit [97.5% perc]: 1.54 (1.47; 1.63)
##
## Model Parameters
## ------------------------------------------------
## method: refineR (v1.6.1)
## model: BoxCox
## N data: 1061
## N bootstrap: 200
## rounded: yes (base: 0.01)
## point est: fullDataEst
## lambda: 0.827
## mu: 0.165
## sigma: 0.181
## shift: 0
## cost: -14.3
## NP fraction: 0.912
## Percentile PointEst CILow CIHigh
## 1 0.025 0.827957 0.7502801 0.8865771
## 2 0.975 1.537573 1.4684747 1.6312779
Tras realizar un análisis mas robusto, los puntos de corte estimados para tiroxina libre en muestras de poblacion general que se procesen en el laboratorio de la Fundación Valle de Lili serían:
Límite inferior: 0.83ng/dL con un intervalo de confianza de [ 0.75ng/dL - 0.89 ]ng/dL Límite superior: 1.54ng/dL con un intervalo de confianza de [ 1.47ng/dL - 1.63 ]ng/dL
Con el objetivo de verificar la idoneidad de los resultados generados, se genera un plot que facilita visualizar la distribucion de los valores reportados en el laboratorio y los intervalos de referencia establecidos dentro de esta distribucion. A continuación, graficamos el modelo estimado, incluyendo intervalos de confianza, para visualizar mejor estos resultados y asegurarnos de que son fácilmente interpretables.
Basándonos en el análisis realizado con refineR, hemos establecido un intervalo de referencia preliminar para los niveles de tiroxina libre en nuestra población de pacientes. Según esto se estableció un limite inferior de 0.83ng/dL con un intervalo de confianza de [ 0.75ng/dL - 0.89 ]ng/dL y un limite superior de 1.54ng/dL con un intervalo de confianza de [ 1.47ng/dL - 1.63 ]ng/dL. Este intervalo proporciona una base inicial para la interpretación de resultados en el laboratorio de la Fundación Valle de Lili. Sin embargo, es importante destacar que este reporte es preliminar debido al tamaño reducido del marco muestral, lo cual puede limitar su representatividad para toda la población de la Fundación.
Para obtener intervalos de referencia más robustos y confiables, es necesario replicar este análisis utilizando datos de laboratorio recopilados durante varios años consecutivos. Además, una exportación más completa de los datos que incluya variables como el sexo y la edad de los pacientes permitiría establecer intervalos de referencia más específicos y personalizados según grupos etarios y de género, mejorando significativamente la precisión diagnóstica y la personalización del tratamiento.