Seguimiento de programas especiales (Hipertensión y Diabetes)
Los programas de educación y prevención en salud son la estrategia para mejorar el bienestar del paciente. De esta manera, la gestión del riesgo para esta patología en Colombia se ha abordado desde dos perspectivas: por un lado desde las patologías que se han identificado como posibles “precursoras” o potenciales causas de la ERC (Enfermedades Precursoras Renales), como son la hipertensión arterial y la diabetes mellitus, para evitar que se desarrolle la ERC y que son prevenibles, intervenibles y tratables; y por otro, para evitar la progresión desde la enfermedad renal crónica en estadios iniciales (estadios 1-4) hasta el estadio 5, donde el daño renal es irreversible.
IDENTIFICAR POSIBLES PACIENTES QUE PUEDAN INGRESAR A LOS PROGRAMAS ESPECIALES DE ENFERMEDAD RENAL CRÓNICA CON UN ESTADIO INICIAL DE SU ENFERMEDAD (CAPTACIÓN TEMPRANA POR EL PROGRAMA)
Identificamos los pacientes ingresados en la cohorte 2022-2023 al programa de prevencion por diabetes e impertension y obtenemos la historia de algunos paraclinicos para cada un de estos pacientes para todas las fechas anteriores de su ingreso al programa. De esta forma buscamos identificar caracteristicas subyacentes en estos examenes que logren alertar tempranamente si un paciente tendra alguna de estas condiciones, con el fin de reaccionar de manera preventiva y mejoras sus habitos de vida.
Note que en el anterior grafico de barras se puede visualizar una diferencia marcada discriminando por sexo entre la cantidad de personas que entran en cada condicion 0(Hipertension), 1(Diabetes), 2(Diabetes&Hipertension). Exploremos un poco mas a continuacion este primer hallazgpo. Discriminando por Sexo veamos el resultado de cada paraclinico:
Observamos que para Colesterol, Hdl(Colesterol total) y creatinina hay
una diferencia marcada entre las medias sin embargo para el resto de
paraclinicos no sugiere lo mismo. Exploremos ahora la edad de ingreso de
los pacientes en cada una de las condiciones.
Podemos notar que tanto para hombres y mujeres la distribucion de las
edades tiene un comportamiento normal con medias similares por tanto
medianas tambien cercanas, exepto para la distribucion de los pacientes
de padecen ambas condiciones, con esto, los boxplot ilustran que no hay
diferencia significativa entre las medias de edades para los pacientes
de cada condicion segun el sexo exeptuando los pacientes que padecen
ambas condiciones.
Con esto tenemos que nuestras clases(Hipoertension, Diabetes) estan bien balanceadas pues si bien hay algunas diferencias esto no sugiere en general un desbalance de las mismas.
En las relaciones subyacentes entre Glucosa y las demas variables
observamos en la mayoria de graficos clusters bien diferenciados. Sin
embargo, explorando la relacion de otras variables con el resto no
obtenemos los mismo resultados. Por ejemplo, Colesterol es el caso
contrario a lo anteriormente ilustrado.
Esto nos sugiere que Glucosa es la unica variable difenciadora en el
momento de general clusters para nuestras condiciones. Exploremos ahora
con la matriz de correlacion las relaciones directas o indirectas que
hay entre estos paraclinicos
Aplicando un test de significancion nos quedamos con las siguientes
relaciones.
Estas relaciones son las que alimentaran nuestras componentes principales. Lo cual se hace con el fin de reducir dimencionalidad y recoger la variabilidad del fenomeno sin el ruido asociado al mismo
El anterior grafico nos sugiere tomar las primeras 4 componentes las cuales recogen el 70% de variabilidad, de esta manera las ultimas pueden relacionarse al ruido asociado a este fenomeno
Notemos la definicion clara entre cluster cuando relaciono PC1 con las
demas variables
Analogamnete vemos esto para las demas relaciones. Por tanto este
analisis nos sugiere que puede haber un mejor rendimiento en la
clasificacion si trabajamos con las primeras 4 componentes principales
de las variables originales. Para finalizar, entendamos lo que estan
representando estas componentes principales.
Para PC1 por ejemplo. Si en este caso se encuentra un valor positivo
estariamos obteniendo valores altos para los paraclinicos que mostramos
en color verde y valores pequeños para los valores en color rojo, esta
interpretacion la podemos extender a cada una de las otras componentes e
interpretar desde una perspectiva de un experto medico.
En la primer exploracion notamos que glucosa fue un paraclinico importante para distingir entre hipertensos y diabeticos, sin embargo las otras variables no lograban hacer lo mismo.
Con el fin de reducir el ruido de estas relaciones y obtener mejores resultados para distingir estas clases. Aplicamos componentes principales, en donde decidimos quedarnos con 4 componentes las cuales son capacez de mostrar de manera mas eficiente la separabilidad de nuestras condiciones (Hipertension y diabetes)
Estos resultados sugieren que seria mejor trabajar con las componentes principales en el caso que queramos entrenar un modelo de clasificacion.