Introducción  

El campo científico en el que el uso del análisis de curvas ROC donde está más extendido es en la medicina, en muchas de sus áreas de especialización. Unos protocolos diagnósticos precisos son parte crítica de cualquier sistema de salud. En Medicina, continuamente surgen nuevas pruebas diagnósticas o de detección temprana, y se deben evaluar empíricamente en función de su capacidad para discriminar los estados enfermos y no enfermo. Las pruebas diagnósticas en salud se reportan de manera cuantitativa mediante escalas continuas. Por ello el análisis de curvas ROC (receiver operating characteristic curve) constituye un método estadístico para determinar la exactitud diagnóstica de las pruebas, con el fin de: determinar el punto de corte de una escala continua que representa la mayor sensibilidad y especificidad más alta, su capacidad de diferenciar sujetos sanos versus enfermos, y comparar la capacidad discriminativa de dos o más pruebas diagnósticas.  

Situación  

Con el objeto de seleccionar el mejor punto de predicción diagnóstico de diabetes mellitus (DM) con respecto a las variables IMC \((PESO/TALLA^2)\), Perímetro de cintura, Perímetro de cadera, y niveles de HDL Colesterol (HDL),se realizó el análisis de comparaciones de curvas ROC con la base de datos (endocrinov2.xls) evaluando aspectos demográficos, antropométricos, antecedentes familiares y personales, niveles de exámenes bioquímicos y su condición con respecto a clasificación de su estado de tolerancia a la glicemia.  

Base de datos  

A partir de los datos suminsitrados por el proyecto de investigación, que contienen información acerca de aspectos demográficos, antropométricos, antecedentes familiares y personales, niveles de exámenes bioquímicos y su condición con respecto a clasificación de su estado de tolerancia a la glicemia, entre otras; se encuentran 581 mujeres que han sido valoradas, con 34 variables. A continuación se presenta la base de datos del Proyecto de investigación, en donde se muestran todas las variables recopiladas en cada una de las 34 columnas y las primeras 10 mujeres sometidas al estudio del mejor punto de predicción diagnóstico de diabetes mellitus (DM).

Tabla 1: Base de datos, Proyecto de investigación.
EDAD SEXO PESO TALLA IMC SEDENTARIO TAS TAD HTA_conocida A_DIAB ECV_B TABACO ALCOHOL STATIN CINTURA CADERA OBCENT_ATP COLESTEROL HDL LDL LDL_C TG CnoHDL ApoA ApoB LPA A1C hba1 CREATININA GLUCB Tol_Glucosa DM SM
37 0 70.0 154.0 29.51594 1 125.000 65 0 1 0 0 0 0 88.0 99 1 179 67 91 80 - 100 108 112 NA NA 10.80 5.0895 6.7 0.7 96 NGT 0 0
37 0 55.0 161.2 21.16570 0 115.000 75 0 0 0 0 0 0 75.5 87 0 186 52 119 100 - 120 75 134 143.9 82 34.90 4.6955 5.7 0.7 88 NGT 0 0
42 0 100.6 157.2 40.70923 0 110.000 70 0 1 0 1 0 0 110.5 124 1 196 40 125 120 - 140 155 156 130.0 87 39.00 5.7790 7.5 0.7 112 IFG 0 1
39 0 73.6 157.5 29.66994 1 125.000 90 0 0 0 1 0 0 92.0 107 1 194 36 129 120 - 140 143 158 97.4 75 75.20 5.4835 6.6 0.8 95 NGT 0 1
42 0 73.5 154.5 30.79147 1 110.000 97 0 1 0 0 0 0 86.0 108 0 170 48 91 80 - 100 157 122 135.2 70 25.90 5.1880 6.6 0.6 101 IFG 0 1
41 0 60.8 159.4 23.92913 0 110.000 80 0 0 0 1 0 0 82.0 90 0 234 51 159 140 - 160 122 183 112.7 90 27.70 5.4835 6.8 0.7 88 NGT 0 0
42 0 75.5 167.2 27.00688 0 115.000 75 0 0 0 0 0 1 92.0 102 1 318 130 160 140 - 160 142 188 197.0 139 16.80 5.4835 6.9 1.0 107 IFG 0 0
37 0 63.2 157.5 25.47745 1 130.065 80 0 0 0 0 0 0 90.0 96 1 216 59 131 120 - 140 130 157 132.8 65 11.80 5.4835 6.9 0.7 74 NGT 0 0
56 0 72.1 168.6 25.36414 0 120.000 70 0 0 1 0 0 1 107.0 103 1 164 49 98 80 - 100 82 115 120.4 58 68.20 5.1880 6.3 0.8 94 NGT 0 0
36 0 62.5 156.2 25.61639 1 130.000 80 0 1 0 0 0 0 75.0 90 0 191 57 121 120 - 140 66 134 NA NA 9.55 4.7940 6.1 0.6 74 NGT 0 0

 

Exploración de variables  

Para evaluar la relación que existe entre las mujeres que presentan diabetes mellitus (DM) y aquellas que no, inicialmente se valora el cumplimiento de los supuestos de normalidad, homcedasticidad e independencia, teniendo en cuenta que en este caso se compara una variable categórica nominal (dicotómica) que se traduce en tener o no DM y las variables predictoras que son de naturaleza cuantitativa continua,se utilizó la prueba de Lilliefors, la cual evalúa la normalidad basada en la prueba de Kolmogorov-Smirnov, donde se pretende probar la hipótesis nula de que los datos provienen de una población con distribución normal, es decir, no especifica el valor esperado y la varianza de las distribuciones.

La hipótesis nula general y la hipótesis alternativa general para cada prueba consistió en:

\[\begin{aligned} H_0&: \mbox{Las variables predictoras en la población de mujeres que presentan DM tiene distribución normal } \hspace{0.1cm} vs\\ H_1&: \mbox{Las variables predictoras en la población de mujeres que presentan DM no tiene distribución normal } \end{aligned}\]

\[\begin{aligned} H_0&: \mbox{Las variables predictoras en la población de mujeres que no presentan DM tiene distribución normal } \hspace{0.1cm} vs\\ H_1&: \mbox{Las variables predictoras en la población de mujeres que no presentan DM no tiene distribución normal } \end{aligned}\]

Tabla 2 . Verificación de los supuestos de Normalidad teniendo en cuenta la presencia o ausencia de DM.
.
Prueba de Lilliefors en las mujeres que no presentan DM (Normalidad)
Prueba de Lilliefors en las mujeres que presentan DM (Normalidad)
Variables Est P.valor Est. P_valor
IMC 0.071 <0.05 0.121 0.044
CINTURA 0.053 0.001 0.134 0.017
CADERA 0.063 <0.05 0.102 0.169
HDL 0.079 0.119 0.056
EDAD 0.114 0.100 0.190

La prueba de normalidad Lilliefors con cada una de las variables predictoras teniendo en cuenta la ausencia de DM, evidenció p-valores menores a un nivel de significancia del 5% por tanto se rechaza la hipótesis nula de que las variables predictoras para este caso se distribuyen normalmente. Mientras que en el grupo de mujeres que presentan DM, las variables predictoras excepto IMC, la prueba arrojó p-valores mayores que un nivel de significancia del 5% por lo que existe evidencia estadítica para confirmar que estos datos siguen una distribución normal.

Prueba de homocedasticidad  

Ahora bien, se evaluó la igualdad de varianza entre cada una de las variables predictoras y la ausencia/presencia de DM.

La hipótesis nula y la hipótesis alternativa de manera general para cada prueba consistió en:

\[\begin{aligned} H_0&: \mbox{La varianza de la variable predictora para la población de mujeres con DM = La varianza en las variables predictoras para la población de mujeres sin DM }\hspace{0.1cm} vs\\ H_1&: \mbox{La varianza de las variable predictora para la polación de mujeres con DM } \neq \mbox{ La varianza en las variables predictoras para la población de mujeres sin DM } \end{aligned}\]

Tabla 3. Prueba Levene para la variable DM y las variables predictoras
Variables Fvalue Pr..F.
IMC 0.9860 0.3211
CINTURA 0.1400 0.7084
CADERA 0.2123 0.6451
HDL 0.1363 0.7122
EDAD 1.8762 0.1713
Note:
Fuente: Proyecto de investigación.

A partir de los resultados obtenidos y tomando un nivel de significancia del 5%, se puede afirmar que con una confianza del \(95\%\), no hay evidencia estadística para rechazarla hipótesis nula con estas variables predictoras, es decir que se confirma que la varianza entre grupo para cada variable predictora son iguales.  

Prueba de independencia  

Finalmente se evalúa la independencia entre cada una de las variables predictoras y la variable DM, por lo que se utilizó una prueba no paramétrica, el Test de Wilcoxon como alternativa a la prueba de t-student, debido a que no se cumple con el supuesto de normalidad.

La hipótesis nula general y la hipótesis alternativa general para cada prueba consistió en: \[\begin{aligned} H_0&: \mbox{La variable predictora es independiente de la variable DM} \hspace{0.1cm} vs\\ H_1&: \mbox{La variable predictora es dependiente de la variable DM } \end{aligned}\]

Donde las variables predictoras a considerar fueron: IMC \((PESO/TALLA^2)\), Perímetro de Cintura, Perímetro de Cadera, Niveles de HDL Colesterol (HDL) y Edad.

De acuerdo a los resultados del test Wilcox, se puede afirmar que con un nivel de confianza del 95%, existe evidencia suficiente para rechazar las hipótesis nulas, por lo tanto todas las variables predictoras son dependientes de la variable DM.

Se estableció la comparabilidad de las categorías de desenlace (presencia/ausencia) de acuerdo con las variables edad, perímetro de la cintura y HDL.

Al comparar las edades para ambos grupos, se evidencia que para el grupo de mujeres con DM siempre las edades están por encima de las edades de mujeres que no presentan DM; las medianas para estos grupos son: 59 y 44 años respectivamente. Con respecto a los rangos intercuartílicos se evidencia mayor dispersión en las edades de mujeres que no presentan DM (Figura 1).

De igual forma en la Figura 2 se observa que la mediana con respecto al perímetro de cintura en las mujeres del grupo que no presentan DM es menor que la mediana en las mujeres que presentan DM, y otro hallazgo importante en la relación que muestra el gráfico, es que la variación de mujeres que no presentan DM con respecto a la perímetro de la cintura es mucho mayor que la variación de las mujeres que con DM, donde el rango intercuartílico es: 18 y 14 centímetro respectivamente.

Finalmente, se comparó en otro grafico de cajas y bigotes la mediana para los niveles de colesterol, teniendo en cuenta que los datos se agrupan en tener o no DM; a simple vista, la diferencia entre los dos grupos de mujeres con respecto a los niveles de colesterol no parece ser muy grande, si se toma el cuatil que corresponde al 75%; se puede observar en las mujeres con DM es de 61 mientras que en las mujeres que no presentan DM es 66 y el rango intercuartílico en ambos grupos no presenta mayor variabilidad ya que para mujeres con DM es 16 y para las muejres que no presentan DM es 17.

Construcción del modelo

Como se mencionó al inicio del trabajo, se buscó construir un modelo que relacionara la probabilidad de diagnósticar diabetes mellitus (DM) en la población de mujeres frente a ciertas covariables como lo son: IMC (PESO/TALLA^2), Perímetro de cintura, Perímetro de cadera, y niveles de HDL Colesterol (HDL) y además la edad. Al ser la variable desenlace dicotomica se optó por realizar un un modelo de regresión logística multiple.

En este sentido, el modelo planteado sería el siguiente:

\(logit[P(Diabetes Ml)]=ln\left ( \frac{P(Diabetes Ml)}{1-P(Diabetes Ml)} \right )=-9.259+0.001IMC+0.083CINTURA-0.027CADERA-0.029HDL\) \(+ 0.063EDAD\)

Los resultados se resumen en la siguiente tabla

Tabla 4. Modelo con todas las variables como predictores.
Variable Estimado SE z.value p.value VIF
(Intercept) -9.259 1.978 -4.679 <0.001** .
IMC 0.001 0.071 0.002 0.998 0.160
CINTURA 0.083 0.026 3.149 <0.001** 0.212
CADERA -0.027 0.035 -0.782 0.434 0.143
HDL -0.028 0.015 -1.933 0.053 0.945
EDAD 0.063 0.015 4.277 <0.001** 0.891
Note:
Fuente: Proyecto de investigación, R^2=0.24

Del modelo completo, se concluye, que a un nivel de significancia del 5%, las variables Perímetro de cintura, Edad y la constante son significativas; y a un nivel del 1% la variable Niveles de Colesterol HDL en sangre es significativa. Además se observó que la devianza del modelo (Residual deviance: 272.79 ) es mucho menor que la devianza solo con la constante (Null deviance: 359.40), lo cual significa que estas variables ayudan a predecir mejor el diagnostico de diabetes mellitus (DM) en la mujeres. Como medida de ajuste del modelo se obtuvo un AIC de 284.79 (Tabla 4.).

A través de la información que proporcionó el estadístico de Wald (z-statistic), vimos que las variables predictoras que hicieron una contribución significativa al modelo para predecir la respuesta fueron: el perímetro de cintura, la Edad, la constante y niveles de colesterol HDL en sangre (Tabla 4.).

Para saber la eficacia del modelo prediciendo la probabilidad de ser diagnósticado con diabetes mellitus, se utilizó el estadístico chi-cuadrado \(LR=-2(l(\Theta_0)-l(\hat \Theta))\) dado que \(LR\sim \mathcal{X}_p^2\), donde \(l(\Theta_0)\) es la función log-verosimilitud del modelo final y \(l(\hat \Theta))\) es la función log-verosimilitud del modelo resultante sin variables independientes, sólo con la constante. Con \(p\) grados de libertad equivalente a la diferencia entre el número de parámetros del modelo final y el modelo nulo.

Se obtuvo un estadistico chi-cuadrado de 86.61 y la probabilidad asociada al estadístico fue de \(p-valor=P(\mathcal{X}_5^2>LR)=0.001\) el cual es menor de 0.05, se concluye que el efecto general del modelo es estadísticamente significativo al 5%.

Dentro de los supuestos se verificó la multicolinealidad mediante el análisis VIF: toleracia en las matrices de correlación, como ninguna de las covariables obtuvo valores mayores a 10, se dice que ninguna es dependiente de la otra (Tabla 4.).

 

Selección del mejor modelo  

Sin embargo se utilizó un modelo alternativo con el método stepwise mixto (both) que selecciona los mejores predictores del modelo con el criterio Akaike (AIC). El método stepwise seleccionó tres variables como predictoras con un AIC = 281.83 y el modelo seleccionado es capaz de explicar el 24% de la variabilidad observada (R2=0.24).

Del modelo reducido, se concluye, que a un nivel de significancia del 5%, las variables perímetro de cintura,edad,niveles de colesterol HDL en sangre y el termino independiente son significativas (Tabla 5.).

Empleando el estadístico de Wald (z-statistic), vimos que todas las variables predictoras empleadas en el modelo final hicieron una contribución significativa para predecir la variable respuesta, es decir que incluirlas produjo una mejoría en el ajuste del modelo (Tabla 5.).

Sin embargo, haciendo un análisis de los odds ratio, vemos que el aumento de una unidad del perímetro de la cintura y si el resto de las variables predictoras se mantuvieran constantes aumenta los odds (la probabilidad de un paciente de ser diagnósticado con DM sobre la probabilidad de no ser diagnósticado) en 1.062 veces más a que si no se aumentara esa unidad en el perímetro de la cintura, esta afirmación se sustenta en el intervalo de confianza que al tener limite inferior mayor que 1, lo convierte en un factor de riesgo con asociación significativa (Tabla 5.).

Analogamente, vemos que el aumento de una unidad de la edad y si el resto de las variables predictoras se mantuvieran constantes aumenta los odds (la probabilidad de un paciente de ser diagnósticado con DM sobre la probabilidad de no ser diagnósticado) en 1.066 veces más a que si no se aumentara esa unidad en la edad, esta afirmación se sustenta en el intervalo de confianza que al tener limite inferior mayor que 1, lo convierte en un factor de riesgo con asociación significativa (Tabla 5.).

En cuanto a los demás OR son menores de 1, por lo que fue conveniente calcular su inversa para no equivocarnos y poder comparar más fácilmente todos los Exp(b).

Un aumento en una unidad de los niveles de colesterol HDL en sangre y si el resto de las variables predictoras se mantuvieran constantes disminuye los odds (la probabilidad de un paciente de ser diagnósticado con DM sobre la probabilidad de no ser diagnósticado) en 1.031 veces más a que si no se aumentara esa unidad en HDL, es decir las personas que tienen bajos niveles de colesterol en sangre tienen menos posibilidad de ser diagnósticados con diabetes, esta afirmación se sustenta en el intervalo de confianza que al no contener al 1, y tener limites inferiores y superiores, menores que uno, lo convierten en un factor de protección.

Para saber la eficacia del modelo prediciendo la probabilidad de ser diagnósticado con diabetes mellitus, se utilizó nuevamente el estadístico chi-cuadrado LR con un valor de 85.57 menor que el obtenido con el modelo completo y una probabilidad asociada de \(p-valor=P(\mathcal{X}_3^2>LR)=0.001\) es menor de 0.05, se concluye que el efecto general del modelo es estadísticamente significativo al 5%.

El supuesto de multicolinealidad se verificó nuevamente mediante el estadístico de VIF,en este caso ninguna de la variables predictoras preseanta un VIF mayor de 10 por lo que no hay colinialidad (Tabla 5.).

Nos quedamos por tanto con el modelo

\(logit[P(DiabetesMl)]=ln\left ( \frac{P(DiabetesMl)}{1-P(DiabetesMl)} \right )=-10.002+0.061CINTURA -0.031HDL+0.064EDAD\)

que nos dice que la probabilidad de ser diagnósticado con diabetes mellitus se ve influenciado positivamente por el perímetro de la cintura y la edad del sujeto; y negativamente por los niveles de colesterol en sangre.

Tabla 5. Coeficientes del modelo de regresión logística reducido, sus estimaciones, desviación estandar del error, Odds Ratio(OR) y sus respectivos intervalos de confianza al 95 %.
Variable Beta SE OR IC.OR z.value p.value VIF
(Intercept) -10.002 1.579 <0.001 (0.0001-0.001) -6.335 <0.0001** .
CINTURA 0.061 0.012 1.063 (1.038-1.089) 4.919 <0.001** 0.943
EDAD 0.064 0.014 1.066 (1.037-1.098) 4.442 <0.001** 0.928
HDL -0.030 0.015 0.969 (0.969-0.997) -2.120 <0.034** 0.969
Note:
Fuente: Proyecto de investigación, R^2=0.24

 

Comparación del modelo  

Para la predicción de la diabetes mellitus (DM), la curva de ROC, permite mostrar la fraccción de falsos positivos que se define como \(\frac{FP}{FP+VN}\) frente a la fracción de verdaderos positivos o sensibilidad definida como la probabilidad de que el modelo clasifique correctamente a una mujer con DM, es decir, la probabilidad de que para una mujer con DM el modelo como instrumento diagnostico arroge un resultado positivo \(\frac{VP}{VP+FN}\), además de que clasifique aquellas mujeres que no presentan DM como no diabeticas correctamente (especificidad), con un punto de corte del \(0.5\) es decir, que el modelo clasifique con una probabilidad mayor del \(50\%\), y que a su vez el modelo escogido máximice la fracción de verdaderos positivos y mínimice la fracción de falsos positivos.

A continuación se presentan las curvas ROC para los modelos hallados anteriormente (modelo completo y modelo reducido), para determinar cual curva maximiza, la fracción de verdaderos positivos.

Se observó la curva ROC para el modelo completo (Figura 4:) y la curva ROC para el modelo reducido (Figura 5:), ambas curvas no muestran una diferencia tan marcada en el área encerrada por lo que es necesario calcular la probabilidad del área bajo la curva, denominado criterio AUC para poder escoger el mejor modelo, es decir, el mejor modelo seria aquel que represente mayor probabilidad de clasificación.

En este caso,el Modelo reducido presenta un AUC:0.857, y el modelo completo un AUC: 0.856 , por lo que puede decirse que ambos modelos tienen una eficacia similar para el diagnóstico de la diabetes mellitus.

Se realizó una tabla de clasificación con cada modelo con el proposito de determinar su capacidad para discriminar a la población de mujeres con (presencia/ausencia) de DM.

De las 581 mujeres observadas, de estas hay 54 mujeres con diabetes, de las cuales el modelo completo solo clasifica 7 correctamente con diabetes y a 47 las clasifica como no diabeticas; de las 527 mujeres que no tienen diabetes, el modelo completo clasifica correctamente 521 y 6 sanas las clasifica con diabetes , con un total de 528 mujeres bien clasificadas , decimos que el modelo completo clasifica al 90.8% de la población de mujeres correctamente.

Mientras que el modelo reducido de las 54 mujeres con diabetes clasifica solo a 7 correctamente a tener diabetes y a 47 las clasifica como no diabeticas, de las 527 mujeres que no tienen diabetes, el modelo reducido clasifica correctamente a 520 a no tener diabetes y 7 sanas las clasifica con diabetes, con un total de 527 mujeres clasificadas el modelo reducido clasifica al 90.7% correctamente.

En este caso se tomó un punto de corte de 0.5, por lo que el modelo completo clasifica correctamente al 90.87% de las mujeres, frente al modelo reducido que clasifica correctamente al 90.70% de las mujeres (Tabla 6.).

El modelo completo identifica el 12.96% de las mujeres con DM (Positivos verdaderos o Sensibilidad) y habrá un 87.04% que no son identificadas por el modelo completo dado que si tienen DM (Falsos Negativos), mientras que el modelo reducido identifica el 12.96% de las mujeres con DM y solo un 87.04% no son identificadas correctamente (Tabla 6.).Además el modelo completo identifica el 98.86% de las mujeres sanas que no tienen DM (Negativos verdaderos o especificidad) y no identifica el 1.14% de las sanas(Falsos Positivos), mientras que el modelo reducido identifica el 98.67% de las sanas y no identifica el 1.33% (Tabla 6.).

La probabilidad de que una mujer tenga DM en el modelo completo es del 53.85%, dado que el modelo como prueba diagnostica arroja resultado positivo (VPP).La probabilidad de que una mujer tenga DM en el modelo reducido es del 50% dado que el modelo como prueba diagnostica arroja resultado positivo (Tabla 6.).Mientras que la probabilidad de que una mujer no tenga DM en el modelo completo es del 91.73% dado que el modelo como prueba diagnostica arroja resultado negativo de tener DM (VPN),la probabilidad de que una mujer no tenga DM en el modelo final es del 91.71% dado que el modelo como prueba diagnostica arroja resultado negativo de tener DM (Tabla 6.).

La razón de verosimilitud (LRV) es un indicador del desempeño de un test diagnóstico, matemáticamente se define como: \[LRN=\frac{1-Sensibilidad}{Especificidad} \] y \[LRP=\frac{Sensibilidad}{1-Especificidad} \] De acuerdo con los resultados obtenidos (Tabla 7.), la probabilidad de que el modelo completo de un resultado positivo es aproximadamente, once veces mayor en las mujeres con DM que en las que no la presentan DM, pero la probabilidad de que el modelo completo de un resultado negativo es aproximadamente 1 veces mayor en las no diabeticas que en las diabeticas (1/0,88=1.13).

La probabilidad de que el modelo reducido de un resultado positivo es aproximadamente, 10 veces mayor en las mujeres diabeticas que en las no diabeticas, pero la probabilidad de que el modelo reducido de un resultado negativo es 1 veces mayor en las no diabeticas que en las diabeticas (1/0,88=1.13) (Tabla 7.).

Finalmente se comparó el ìndice de Youden, para determinar que modelo predice mejor que una mujer presente DM, el ìndice de Youden para el modelo completo es de 0.12 y para el modelo reducido es de 0.12,es decir que presenta una baja sensibilidad y especificidad conjunta (Tabla 7.).

Tabla 6. ìndices de variabilidad interna y externa para el modelo completo y el modelo reducido.
Macro_variable Punto_corte Sensibilidad_IC Especificidad_IC ìndice_validez ValorpredictivoP_IC ValorpredictivoN_IC
Modelo Completo 0.5 12,96(3,08- 22,85) 98,86( 97,86- 99,86) 90.86(88.45-93.31) 53,85(22,90-84,79) 91,73(89,37-94,08)
Modelo reducido 12,96(3,08-22,85) 98,67(97,60-99,74) 90,71(88,26- 93,15 50,00(20,24-79,76 91,71( 89,35- 94,07)
Note:
Fuente: Proyecto de investigación
Tabla 7. ìndices de variabilidad interna y externa para el modelo completo y el modelo reducido.
Macro_variable LRP_IC LRN_IC OR I.Youden AUC TCC
Modelo Completo 11,39(3,97-32,66) 0,88(0,79-0,98) 12.93 (4.18-40.06) 0.12 0.86 90.87
Modelo reducido 9,76(3,56-26,78) 0,88(0,80-0,98) 11.06 (3.72-32.89) 0.12 0.86 90.70
Note:
Fuente: Proyecto de investigación

Sin embargo, se estimaron los puntos de corte optimos para cada modelo, de modo que en el modelo completo el mejor punto de corte fue 0.747 clasificando correctamente al 91.05% de la población de mujeres, frente al modelo reducido cuyo punto de corte fue 0.617 clasificando correctamente al 91.22% de la población (Tabla 8.).

También se realizó una tabla de clasificación con cada modelo con el proposito de determinar su capacidad para discriminar a la población de mujeres con (presencia/ausencia) de DM.

De las 581 mujeres observadas, de estas hay 54 mujeres con diabetes, de las cuales el modelo completo solo clasifica 2 correctamente con diabetes y a 52 las clasifica como no diabeticas; de las 527 mujeres que no tienen diabetes, el modelo completo clasifica correctamente 527 y 0 sanas las clasifica con diabetes , con un total de 529 mujeres bien clasificadas , decimos que el modelo completo clasifica al 91.05% de la población de mujeres correctamente.

Mientras que el modelo reducido de las 54 mujeres con diabetes clasifica solo a 5 correctamente a tener diabetes y a 49 las clasifica como no diabeticas, de las 527 mujeres que no tienen diabetes, el modelo reducido clasifica correctamente a 525 a no tener diabetes y 2 sanas las clasifica con diabetes, con un total de 530 mujeres clasificadas el modelo reducido clasifica al 90.7% correctamente.

El modelo completo identifica el 3.7% de las mujeres con DM (Positivos verdaderos o Sensibilidad) y habrá un 96.3% que no son identificadas por el modelo completo dado que si tienen DM (Falsos Negativos), mientras que el modelo reducido identifica el 9.26% de las mujeres con DM y solo un 50% no son identificadas correctamente (Tabla 8.).Además el modelo completo identifica el 100% de las mujeres sanas que no tienen DM (Negativos verdaderos o especificidad), mientras que el modelo reducido identifica el 99.62% de las sanas y no identifica el 0.32% (Tabla 8.).

La probabilidad de que una mujer tenga DM en el modelo completo es del 100%, dado que el modelo como prueba diagnostica arroja resultado positivo (VPP).La probabilidad de que una mujer tenga DM en el modelo reducido es del 71.43% dado que el modelo como prueba diagnostica arroja resultado positivo (Tabla 8.).Mientras que la probabilidad de que una mujer no tenga DM en el modelo completo es del 91.02% dado que el modelo como prueba diagnostica arroja resultado negativo de tener DM (VPN),la probabilidad de que una mujer no tenga DM en el modelo reducido es del 91.46% dado que el modelo como prueba diagnostica arroja resultado negativo de tener DM (Tabla 8.).

La razón de verosimilitud (LRV) es un indicador del desempeño de un test diagnóstico, matemáticamente se define como: \[LRN=\frac{1-Sensibilidad}{Especificidad} \] y \[LRP=\frac{Sensibilidad}{1-Especificidad} \]

De acuerdo con los resultados obtenidos (Tabla 9.), la probabilidad de que el modelo completo de un resultado positivo es aproximadamente, es muy baja en las mujeres con DM que en las que no la presentan DM, pero la probabilidad de que el modelo completo de un resultado negativo es 1 veces mayor en las no diabeticas que en las diabeticas (1/0,96=1.04).

La probabilidad de que el modelo reducido de un resultado positivo es aproximadamente, 24 veces mayor en las mujeres diabeticas que en las no diabeticas, pero la probabilidad de que el modelo reducido de un resultado negativo es aproximadamente 1 veces mayor en las no diabeticas que en las diabeticas (1/0,0.91=1.09) (Tabla 9.).

Finalmente se comparó el ìndice de Youden, para determinar que modelo predice mejor que una mujer presente DM, el indce de Youden para el modelo completo es de 0.04 y para el modelo reducido es de 0.09, es decir que presenta una baja sensibilidad y especificidad conjunta (Tabla 9.).

Tabla 8. ìndices de variabilidad interna y externa para el modelo completo y el modelo reducido.
Macro_variable Punto_corte Sensibilidad_IC Especificidad_IC ìndice_validez ValorpredictivoP_IC ValorpredictivoN_IC
Modelo Completo 0.747 3.7(-0.001-9.67) 100 (88.64-100) 91.05(88.64-93.46) 100(75-100) 91.02(88.60-93.43)
Modelo reducido 0.616 9.26(0.60-17.92) 99.62 (99-100) 9.29(6.85-11.74) 71.43(30.82-100) 91.46(89.09-93.84)
Note:
Fuente: Proyecto de investigación
Tabla 9. ìndices de variabilidad interna y externa para el modelo completo y el modelo reducido.
Macro_variable LRP_IC LRN_IC OR I.Youden AUC TCC
Modelo Completo 0.96(0.91-1.01) 0.04 0.86 91.04
Modelo reducido 24.40(4.85-122.76) 0.91(0.84-0.99) 26.79 (5.06, 141.69) 0.09 0.86 91.22
Note:
Fuente: Proyecto de investigación

Conclusiones

El modelo seleccionado, fue el modelo completo tomando un punto de corte del 0.5, debido a que en este punto se tuvo un ìndice de Youden un poco mas alto entre todos los modelos, manteniendo una alta especificidad y sensibilidad conjunta, sin embargo desde un punto de vista estadístico el modelo, predice mejor aquellas mujeres que no presentan diabetes, y dado que su sensibilidad es muy baja, hay una alta probabilidad de que si se implementa este modelo, muchas mujeres con diabetes no sean diagnosticadas correctamente.

Los resultados evidencian obstaculos para predecir aquellas mujeres que presentan DM, esto puede ser debido a que la muestra de estudio no es lo suficientemente heterogenea o incluso se necesita una muestra mas grandre, o por la posibilidad de confusión debido a variables que aún no han sido medidas o consideradas dentro del modelo y su presencia contribuyen a un diagnóstico apropiado.

La DM puede originar una serie de complicaciones como la enfermedad coronaria, el ictus, la ceguera, los problemas renales, la amputación del pie o la pierna, y complicaciones en los embarazos, tanto para la madre como para el feto o recién nacido. Teniendo en cuenta que nuestro estudio se basó en el análisis de mujeres con presencia o ausencia de DM, siendo una de las principales causas la obesidad abdominal, debido a mayor ingesta de comidas elaboradas ricas en carbohidratos, colabora con el incremento del depósito de grasa visceral, siendo este un órgano endocrino que favorece la liberación de factores de inflamación, además la literatura nos confirma como la grasa visceral, aumenta el flujo de ácidos grasos libres hacia el hígado, éste genera como respuesta mayor cantidad de triglicéridos, consumo de colesterol HDL y mayor proporción de colesterol LDL, en las mujeres se produce acumulación de grasa en las caderas, glúteos y piernas, además la edad es un factor importante que contribuyen a la variación en la acumulación de tejido adiposo visceral beneficiando la aparición de procesos de ateroesclerosis y por lo tanto riesgo cardiovascular. Teniendo en cuenta lo anterior se confirma la relación entre perímetro de cintura, de la cadera, HDL, la edad y el riesgo de diabetes.