De la base de datos abiertos de la secretaría del distrito de Santiago de Cali, se obtienen los casos reportados por el SIVIGILA de dengue para el período del 1 de enero al 7 de diciembre de 2023. En esta se encuentran el conjunto de variables demográficas y clínicas de los pacientes junto con su complejidad del virus, el cual es definido según los criterios del Instituto Nacional de Salud (INS).
Previo al análisis a realizar definirán los conjuntos de variables de interés para nuestro caso aplicado de estudio.
Variable Definición
Caracteríticas demográficas
Edad Edad del paciente al momento del diagnóstico en años
Sexo Sexo del paciente puede ser masculino o femenino
Signos y síntomas
Cefalea Dolor de cabeza
Dolor retrocular Dolor en los ojos
Mialgias Dolor muscular.
Artralgias Dolor de las articulaciones.
Erupción Visualmente, se parece a una “quemadura solar con piel de gallina” y se siente como papel de lija
Clasificación
Dengue con signos de alarma Dengue sin signos de alarma
Con la finalidad de la replicación del artículo previamente descrito se definen el conjunto de métodos y modelos estadísticos empleados para la realización del mismo.

Análisis exploratorio

Se realizará el reporte de la media e intervalo de confianza al 95 % para las variables cuantitativas. Para el reporte de las variables cualitativas se reporta el total y porcentaje representado referente a la presencia o ausencia del signo o síntomas.

Modelo estadístico:

Se empleará el ajusto de un modelo de regresión con enlace logístico el cuál cuenta con la siguiente estructura:
La densidad de \(y_i\) está definida como: \[ f(y_i;\pi_i) = \pi_i^{y_i} (1-\pi_i)^{(1-y_i)}, \] donde \(y_i = 1\) si el \(i\)-ésimo paciente presenta dengue con signos de alarma y \(y_i = 0\) si el \(i\)-ésimo presenta dengue sin signos de alarma. La función de enlace es: \[ \log \left( \frac{\pi_i}{1-\pi_i} \right) = \beta_0 + \beta_1 \text{Edad}_i + \beta_2 \text{Sexo}_i + \beta_3 \text{Cefalea}_i + \beta_4 \text{Dolor retrocular}_i\\ +\beta_5 \text{Mialgias}_i+\beta_6 \text{Artralgias}_i+\beta_7 \text{Erupción}_i. \]
Aquí:
  • \(\pi_i\) es la probabilidad de que el \(i\)-ésimo paciente presente dengue con signos de alarma.
  • \(\pi \in (0,1)\)
  • \(\beta_{i} \in (-\infty ,\infty)\)
    Es pertinente aclarar que se realizará la regresión por cada covariable de interés una a una y en conjunto.Para el reporte de las interpretaciones se realizará una implementación gráfica de los odds ratio. < div>

Selección de variables:

Cómo método para la selección de variables se empleó el método de penalización de lasso el cuál tiene como función objetivo de estimación: \[\min_{\beta} \left\{ -\sum_{i=1}^{N} \left[ y_i \log(\hat{\pi}_i) + (1 - y_i) \log(1 - \hat{\pi}_i) \right] + \lambda \sum_{j=1}^{p} |\beta_j| \right\}\] Aquí:
  • \(\lambda > 0\)
  • Este parámetro $$ se puede calibrar a través del uso de validación cruzada y de esta manera obtener un valor óptimo, para este caso utilizamos la alternativa k-folds con k=10.

Rendimiento del modelo:

Se realizará la matriz de confusión de los casos y se cálculara las respectivas métricas de desempeño definidas así:
Matriz de Confusión
Predicción Positiva Predicción Negativa
Real Positivo TP FP
Real Negativo FN TN

La sensibilidad se calcula como: \[ \text{Sensibilidad} = \frac{TP}{TP + FN} \]

La especificidad se calcula como: \[ \text{Especificidad} = \frac{TN}{TN + FP} \]

Aquí: \
  • \(TP\) es el número de verdaderos positivos.
  • \(FN\) es el número de falsos negativos.
  • \(FP\) es el número de falsos positivos.
  • \(TN\) es el número de verdaderos negativos.

Resultados

Caracterización por complejidad de dengue
Dengue con signos de alarma (n=3764) Dengue sin signos de alarma (n=5736)
Característica demográficas
Edad años (IC 95 %) 24.8 (5.2-44.4) 23.4 (4.7-42.2)
Sexo (Masculino) n (%) 51.2 (1928) 50 (2870)
Signos y síntomas
Cefalea n (%) 81.1 (3052) 84.4 (4840)
Dolor retro ocular n (%) 37.6 (1417) 43.2 (2477)
Mialgias (%) n 85.1 (3204) 82.9 (4755)
Artralgias n (%) 68.3 (2572) 64.6 (3703)
Erupción n (%) 31.4 (1181) 33.3 (1911)
En la Tabla anterior se observa la distribución de las características demográficas respecto a la complejidad del dengue, se cuenta con una mayor cantidad de casos en el distrito de Santiago de Cali de dengue sin signos de alarma.
Exploratoriamente no se observan diferencias entre los grupos de edades, y la distribución por género es proporcionada, este caso es análogo con los signos y síntomas, presentando una distribución similar en ambas complejidades, siendo mialgias y cefalea los mas presentes en los individuos con el virus.
Análisis univariado Análisis multivariado
Modelo con todas las variables Modelo con selección de variables
OR 95% IC p OR 95% IC p OR 95% IC p
Características demográficas
Edad (años) 1 1-1.01 0.001 1 1-1.01 0.004
Sexo (Masculino) 1.05 0.97-1.14 0.258 1.06 0.98-1.15 0.154
Signos y síntomas
Cefalea 0.79 0.71-0.88 < 0.001 0.86 0.76-0.96 0.006 0.96 0.94-0.99 0.008
Dolor retro ocular 0.79 0.73-0.86 < 0.001 0.8 0.73-0.87 < 0.001 0.95 0.93-0.97 < 0.001
Mialgias 1.18 1.05-1.32 0.004 1.06 0.94-1.2 0.329
Artralgias 1.18 1.09-1.29 < 0.001 1.15 1.05-1.26 0.004 1.04 1.02-1.06 < 0.001
Erupción 0.92 0.84-1 0.048 0.95 0.87-1.04 0.292
Se observa el valor óptimo del logaritmo de el cuál es aproximadamente -6.5. Respecto al ajuste del modelo a nivel univariado todas las variables son significativas a expcepción del género. La edad, Mialgias y Artralgia son factores de riesgo, es decir aumentan la probabilidad de obtener dengue con signos de alarma.
Al incluir todas las variables las Mialgias y el sexo en conjunto no presentan un aporte significativo en el modelo, a diferencia de los otros signos y síntomas junto con la Edad.Las variables seleccionadas a través del proceso de la regresión de Lasso fueron la Cefalea, Dolor retro ocular y Artralgias.
En la Figura anterior se observan los factores de protección y de riesgo del modelo con todas las variables la Edad y Artralgias presentan un aporte significativo en el modelo siendo adiccionalmente variables que contribuyen a un aumento en la probabilidad de presentar dengue con signos de alarma. La Erupción, Cefalea y Dolor retrocular son factores de protección disminuyendo la probabilidad de obtener el evento de interés.

Métrica Valor
Sensitivity 0.649
Specificity 0.423
Pos Pred Value 0.632
Neg Pred Value 0.442
Precision 0.632
Recall 0.649
F1 0.64
Prevalence 0.604
Detection Rate 0.392
Detection Prevalence 0.621
Balanced Accuracy 0.536
Respecto al desempeño del modelo en general se observa un desempeño no tan óptimo del modelo, teniendo como mejor desempeño una sensibilidad de 64.7 % que se podría interpretar que 65 de cada 100 pacientes que presenten dengues con signos de alarma serán clasificados correctamente por el modelo de regresión logística. Lo cual en general no es el escenario más óptimo y requiere mejores técnicas de ajuste.

A pesar de no obtener un rendimiento esperado por parte del modelo ganamos una enorme cantidad de interpretabilidad en esta problemática obteniendo el conjunto de signos y síntomas que en el curso clínico del paciente presentan una mayor o menor probabilidad de adquirir dengue con signos de alarma.