JuveYell

Preliminares

Para este ejercicio, se utilizaron los resultados obtenidos en la Actividad 2, que se enfocaron a corregir los problemas con el dataset Heart Disease UCI, para el cual se realizó lo siguiente:

Estructura del dataframe

A continuación se presenta el detalle de estructura del dataframe Heart Disease UCI, para verificar la asignación correcta del tipo de dato.

str(heart)
## 'data.frame':    920 obs. of  15 variables:
##  $ age     : int  63 67 67 37 41 56 62 57 63 53 ...
##  $ sex     : chr  "Male" "Male" "Male" "Male" ...
##  $ dataset : chr  "Cleveland" "Cleveland" "Cleveland" "Cleveland" ...
##  $ cp      : chr  "typical angina" "asymptomatic" "asymptomatic" "non-anginal" ...
##  $ trestbps: num  145 160 120 130 130 ...
##  $ chol    : num  233 286 229 250 204 236 268 354 254 203 ...
##  $ fbs     : logi  TRUE FALSE FALSE FALSE FALSE FALSE ...
##  $ restecg : chr  "lv hypertrophy" "lv hypertrophy" "lv hypertrophy" "normal" ...
##  $ thalch  : num  150 108 129 187 172 178 160 163 147 155 ...
##  $ exang   : logi  FALSE TRUE TRUE FALSE FALSE FALSE ...
##  $ oldpeak : num  1.98 1.5 1.98 1.98 1.4 ...
##  $ slope   : chr  "downsloping" "flat" "flat" "downsloping" ...
##  $ ca      : int  0 3 2 0 0 0 2 0 1 0 ...
##  $ thal    : chr  "fixed defect" "normal" "reversable defect" "normal" ...
##  $ num     : int  0 2 1 0 0 0 3 0 2 1 ...

Se obtiene un resumen de las variables que conforman el dataframe:

Variable Descripcion
age Edad del paciente en años
sex Sexo del paciente (0 = mujer, 1 = hombre)
dataset Fuente del registro (Cleveland, Hungary, etc.)
cp Tipo de dolor torácico (0–3)
trestbps Presión arterial en reposo (mm Hg)
chol Colesterol sérico (mg/dl)
fbs Azúcar en sangre en ayunas > 120 mg/dl (1 = sí, 0 = no)
restecg Resultado del electrocardiograma en reposo (0–2)
thalch Frecuencia cardíaca máxima alcanzada
exang Angina inducida por ejercicio (1 = sí, 0 = no)
oldpeak Depresión del segmento ST inducida por ejercicio
slope Pendiente del segmento ST durante el esfuerzo (0–2)
ca Número de vasos principales coloreados por fluoroscopia (0–3)
thal Tipo de talasemia (3, 6, 7)
num Diagnóstico de enfermedad cardíaca (0 = sano, 1–4 = enfermo)

Pregunta de Investigación

¿Existe una relación entre el tipo de dolor torácico (cp), el nivel de colesterol (chol) y la presencia de enfermedad cardíaca (num) en pacientes del dataset heart_limpio?

Esta pregunta busca explorar cómo una variable categórica (tipo de dolor) y una continua (colesterol) se relacionan con el diagnóstico final, considerando además otras variables relevantes como el ritmo cardíaco máximo (thalch) y el tipo de talasemia (thal).

Variables seleccionadas

Gráfica 1: Relación entre variables continuas

La gráfica muestra la relación entre colesterol (chol) y frecuencia cardíaca máxima (thalch), diferenciando por diagnóstico (num) mediante color. Cada punto representa un paciente, y los colores indican cinco categorías diagnósticas: 0, 1, 2, 3 y 4.

Interpretación:

  • No se observa una correlación lineal clara entre colesterol y frecuencia cardíaca máxima, lo que sugiere que estas variables pueden variar de forma independiente en el dataset analizado.

  • Los grupos de diagnóstico muestran dispersión interna considerable, indicando que ni el colesterol ni la frecuencia cardíaca máxima por sí solos permiten distinguir claramente entre estados clínicos.

  • Algunos pacientes presentan valores extremos de colesterol (>300 mg/dl) o frecuencia cardíaca (<100 bpm), lo que podría reflejar casos clínicos particulares o errores de medición.

  • La distribución de puntos sugiere que ciertos diagnósticos (por ejemplo, num = 0 vs num = 4) tienden a agruparse en zonas distintas del gráfico, lo que podría indicar patrones clínicos latentes que requieren análisis multivariado.

Vamos a agregar facetado por tipo de dolor torácico (cp) para ver si los síntomas modifican la relación entre colesterol y frecuencia cardíaca:

En la gráfica, cada panel representa un subtipo de dolor: asintomático, angina típica, angina atípica y dolor no anginoso. Los puntos están coloreados según el diagnóstico (num).

Interpretación:

  • La dispersión de los datos varía entre tipos de dolor, lo que sugiere que los síntomas podrían influir en el perfil clínico de colesterol y frecuencia cardíaca.

  • En pacientes asintomáticos, se observa una mayor concentración de diagnósticos graves (colores más claros), con menor frecuencia cardíaca.

  • Los tipos de dolor menos típicos muestran mayor variabilidad, lo que podría indicar perfiles clínicos más heterogéneos.

  • No se aprecia una correlación lineal clara entre colesterol y frecuencia cardíaca en ningún grupo, por lo que se podría complementar con un análisis multivariado.

Gráfica 2: Boxplot con facetado, por tipo de talasemia

La gráfica muestra la distribución de los niveles de colesterol (chol) según el tipo de dolor torácico (cp) y la condición de talasemia (thal). Cada grupo de talasemia —defecto fijo, normal y defecto reversible— contiene boxplots para los cuatro tipos de dolor: asintomático, angina típica, angina atípica y dolor no anginoso.

Interpretación:

  • En pacientes con defecto fijo, los niveles de colesterol tienden a ser más elevados, especialmente en los casos asintomáticos, lo que podría indicar un perfil clínico de riesgo silencioso.

  • Los pacientes con talasemia normal muestran una dispersión más homogénea del colesterol entre los tipos de dolor, sin diferencias marcadas.

  • En el grupo con defecto reversible, se observa una mayor variabilidad, con algunos tipos de dolor (como angina típica) mostrando valores extremos de colesterol.

  • La combinación de dolor torácico y tipo de talasemia parece influir en la distribución del colesterol, lo que sugiere que estas variables podrían interactuar en el perfil metabólico del paciente.

Gráfica 3: Distribución de diagnóstico por tipo de dolor torácico

La gráfica muestra la distribución proporcional de los diagnósticos (num) en función del tipo de dolor torácico (cp). Cada barra representa un tipo de dolor —asintomático, angina típica, angina atípica y dolor no anginoso— y está segmentada por los cinco niveles de diagnóstico (de 0 a 4), indicados por colores.

Interpretación:

  • El dolor asintomático presenta una mayor proporción de diagnósticos graves (num = 3 o 4), lo que sugiere que la ausencia de síntomas no implica menor riesgo clínico.

  • En contraste, los pacientes con angina típica o dolor no anginoso muestran una mayor proporción de diagnósticos leves (num = 0 o 1), lo que podría reflejar una percepción más temprana de síntomas.

  • El tipo de dolor torácico parece estar asociado con el perfil diagnóstico, lo que podría ayudar en la estratificación de riesgo y en la toma de decisiones clínicas.

Gráfica 4: Distribución del colesterol (chol) por tipo de dolor torácico (cp) y diagnóstico (num)

La gráfica muestra la distribución de los niveles de colesterol (chol) mediante curvas de densidad, facetadas por tipo de dolor torácico (cp) y coloreadas por diagnóstico (num). Cada panel representa un subtipo de dolor: asintomático, angina típica, angina atípica y dolor no anginoso.

Interpretación:

  • En pacientes asintomáticos, se observa una mayor concentración de diagnósticos graves (num = 3 o 4) en rangos de colesterol más altos, lo que podría indicar un perfil de riesgo silencioso.

  • Los pacientes con angina típica muestran una distribución más amplia, con presencia de todos los niveles de diagnóstico, lo que sugiere una mayor heterogeneidad.

  • En el grupo con dolor no anginoso, los diagnósticos leves (num = 0 o 1) predominan en rangos de colesterol más bajos, lo que podría reflejar un perfil metabólico más favorable.

  • La superposición de curvas indica que el colesterol por sí solo no discrimina completamente entre diagnósticos, pero su interacción con el tipo de dolor podría ser clínicamente relevante.

  • El análisis sugiere que el tipo de dolor torácico* modula la distribución de colesterol según el diagnóstico, lo que podría ser útil para estratificación de riesgo.

Gráfica 5: Relación entre colesterol (chol) y frecuencia cardíaca máxima (thalch) por tipo de talasemia (thal)

La gráfica muestra la relación entre colesterol (chol) y frecuencia cardíaca máxima (thalch), facetada por tipo de talasemia (thal) y coloreada por diagnóstico (num). Cada panel representa una condición de talasemia: defecto fijo, normal y defecto reversible.

Interpretación:

  • En el grupo con defecto fijo, se observa una mayor concentración de diagnósticos graves (num = 3 o 4) en pacientes con colesterol elevado y frecuencia cardíaca reducida, lo que podría indicar un perfil clínico de alto riesgo.

  • Los pacientes con talasemia normal presentan una distribución más dispersa, con presencia de todos los niveles de diagnóstico, lo que sugiere una mayor heterogeneidad metabólica.

  • En el grupo con defecto reversible, los diagnósticos leves (num = 0 o 1) predominan en rangos de colesterol más bajos y frecuencia cardíaca más alta, lo que podría reflejar un perfil clínico más favorable.

  • La interacción entre colesterol, frecuencia cardíaca máxima y tipo de talasemia parece influir en el perfil diagnóstico, lo que podría ser útil para estratificación de riesgo y personalización del tratamiento.

Gráfica 6: Mapa de calor de correlaciones entre variables clave

La gráfica presenta un mapa de calor que cruza el tipo de dolor torácico (cp) con el diagnóstico clínico (num), mostrando en cada celda el conteo de pacientes y coloreando según el colesterol promedio (chol).

Interpretación:

  • El tipo de dolor asintomático aparece en combinación con todos los niveles de diagnóstico, pero con colesterol promedio más bajo en los casos leves (num = 0) y más alto en los graves (num = 3), lo que sugiere un perfil de riesgo silencioso.

  • La categoría angina atípica muestra el mayor conteo de pacientes en diagnóstico leve (num = 0), con colesterol promedio elevado, lo que podría indicar una población metabólicamente vulnerable.

  • En el grupo angina típica, los casos graves (num = 2 o 3) son menos frecuentes, pero presentan colesterol bajo, lo que podría reflejar un perfil clínico distinto.

  • El dolor no anginoso se asocia principalmente con diagnósticos leves (num = 0), y colesterol moderado, lo que sugiere un perfil clínico más benigno.

Gráfica 7: Mapa de calor de frecuencia cardíaca máxima (thalch) por tipo de talasemia (thal) y diagnóstico (num)

La gráfica muestra un mapa de calor que cruza el tipo de talasemia (thal) con el diagnóstico clínico (num), coloreando cada celda según la frecuencia cardíaca máxima promedio (thalch).

Interpretación:

  • En pacientes con talasemia normal, se observa una frecuencia cardíaca más elevada en los diagnósticos leves (num = 0 o 1), lo que podría reflejar un perfil funcional más saludable.

  • Los casos con defecto fijo presentan frecuencias cardíacas más bajas en los diagnósticos graves (num = 3 o 4), lo que sugiere una posible asociación entre disfunción cardíaca.

  • En el grupo con defecto reversible, la frecuencia cardíaca se mantiene en rangos intermedios, con menor variabilidad entre diagnósticos, lo que podría indicar una respuesta más estable ante el esfuerzo.

  • La interacción entre tipo de talasemia y diagnóstico parece influir en la capacidad funcional del corazón, lo que podría ser útil para estratificación de riesgo y seguimiento terapéutico.

Gráfica 8: Dispersión de colesterol vs frecuencia cardíaca por tipo de dolor torácico

La gráfica muestra la relación entre colesterol (chol) y frecuencia cardíaca máxima (thalch) en pacientes con enfermedad cardíaca, facetada por tipo de dolor torácico (cp) y coloreada por diagnóstico (num). Cada panel incluye una línea de tendencia que permite visualizar el patrón de asociación en cada subtipo de dolor.

Interpretación:

  • En pacientes asintomáticos, se observa una tendencia ligeramente positiva: a mayor colesterol, mayor frecuencia cardíaca máxima, especialmente en diagnósticos más graves (num = 3 o 4), lo que podría indicar un perfil clínico de riesgo silencioso.

  • En el grupo con angina típica, la relación parece más plana, con menor variación en frecuencia cardíaca, lo que sugiere una posible estabilidad funcional en este subtipo.

  • Los pacientes con angina atípica muestran una dispersión amplia y una pendiente menos definida, lo que podría reflejar heterogeneidad clínica.

  • En el grupo con dolor no anginoso, la pendiente es ligeramente positiva, lo que podría indicar que en este subtipo, el colesterol no se asocia negativamente con la capacidad funcional cardíaca.

  • La interacción entre colesterol, frecuencia cardíaca máxima y tipo de dolor torácico podría ser útil para estratificación de riesgo y personalización del tratamiento en pacientes con enfermedad cardíaca.

Gráfica 9: Dispersión de edad vs frecuencia cardíaca máxima (thalch), facetado por tipo de dolor torácico (cp), color por diagnóstico (num), tamaño por colesterol (chol)

La gráfica muestra la relación entre edad (age) y frecuencia cardíaca máxima (thalch), facetada por tipo de dolor torácico (cp), con cada punto representando un paciente. El color indica el diagnóstico (num) y el tamaño del punto representa el colesterol (chol).

Interpretación:

  • En pacientes asintomáticos, se observa una tendencia a menor frecuencia cardíaca en edades avanzadas, especialmente en diagnósticos más graves (num = 3 o 4) y con colesterol elevado (círculos grandes).

  • En el grupo con angina típica, los pacientes tienden a tener frecuencia cardíaca más conservada, incluso en edades mayores, lo que podría reflejar un perfil funcional más estable.

  • Los pacientes con angina atípica muestran una dispersión amplia en edad y frecuencia cardíaca, con presencia de todos los niveles de diagnóstico.

  • En el grupo con dolor no anginoso, predominan los diagnósticos leves (num = 0 o 1) en pacientes más jóvenes, con colesterol moderado, lo que podría indicar un perfil metabólico más favorable.

  • La interacción entre edad, frecuencia cardíaca, colesterol y tipo de dolor torácico permite visualizar perfiles clínicos diferenciados, útiles para estratificación de riesgo y personalización del tratamiento.

Gráfica 10: Edad vs Frecuencia Cardíaca, facetado por tipo de dolor torácico, color por diagnóstico

La gráfica muestra la relación entre edad (age) y frecuencia cardíaca máxima (thalch), facetada por tipo de dolor torácico (cp) y coloreada por diagnóstico (num). Cada panel representa un subtipo de dolor: asintomático, angina típica, angina atípica y dolor no anginoso.

Interpretación:

  • En pacientes asintomáticos, se observa una tendencia descendente: a mayor edad, menor frecuencia cardíaca máxima, especialmente en diagnósticos más graves (num = 3 o 4), lo que podría indicar deterioro funcional silencioso.

  • En el grupo con angina típica, la frecuencia cardíaca se mantiene relativamente estable en distintos rangos de edad, lo que sugiere una posible compensación fisiológica o menor impacto del envejecimiento.

  • Los pacientes con angina atípica presentan una dispersión amplia en edad y frecuencia cardíaca, con presencia de todos los niveles de diagnóstico, lo que refleja una alta heterogeneidad clínica.

  • En el grupo con dolor no anginoso, predominan los diagnósticos leves (num = 0 o 1) en pacientes más jóvenes, lo que podría indicar un perfil clínico más favorable.

  • La interacción entre edad, frecuencia cardíaca máxima y tipo de dolor torácico permite identificar patrones funcionales diferenciados que pueden ser útiles para estratificación de riesgo y personalización del tratamiento.

  • El uso de tooltips interactivos permite acceder a información clínica detallada al pasar el cursor sobre cada punto, enriqueciendo la interpretación visual. En este caso, el tooltip incluye:

    • Edad del paciente (age)
    • Frecuencia cardíaca máxima (thalch)
    • Colesterol (chol)
    • Diagnóstico (num)
    • Tipo de dolor torácico (cp)
  • Esto permite identificar perfiles individuales dentro de cada grupo, facilitando el análisis de casos extremos o patrones ocultos. Ayuda a detectar combinaciones de riesgo, como pacientes jóvenes con colesterol alto y diagnóstico grave.

Conclusiones generales

Tras revisar múltiples visualizaciones que exploran la interacción entre variables clínicas como edad, colesterol, frecuencia cardíaca máxima, tipo de dolor torácico, diagnóstico y talasemia, se identifican los siguientes patrones y recomendaciones:

1. Perfil clínico según tipo de dolor torácico
  • El dolor asintomático se asocia con diagnósticos más graves y perfiles metabólicos de mayor riesgo, a menudo con colesterol elevado y frecuencia cardíaca reducida.
  • Los pacientes con angina típica muestran mayor estabilidad funcional, mientras que los de angina atípica presentan alta heterogeneidad clínica.
  • El dolor no anginoso tiende a concentrar diagnósticos leves, especialmente en pacientes jóvenes con colesterol moderado.
2. Interacción entre colesterol y frecuencia cardíaca
  • No se observa una correlación lineal clara entre colesterol y frecuencia cardíaca máxima, aunque ciertos subgrupos (como pacientes asintomáticos con talasemia fija) muestran patrones de riesgo definidos.
  • Las líneas de tendencia por tipo de dolor torácico revelan que esta relación puede cambiar según el contexto sintomático.
3. Influencia de la talasemia
  • La talasemia fija se asocia con menor frecuencia cardíaca y mayor severidad diagnóstica.
  • La talasemia reversible muestra perfiles más estables, mientras que la talasemia normal presenta mayor dispersión clínica.
4. Distribuciones y proporciones diagnósticas
  • Las proporciones de diagnóstico varían significativamente según el tipo de dolor torácico, lo que sugiere que los síntomas pueden ser útiles para la estratificación de riesgo.
  • Los mapas de calor revelan combinaciones específicas de síntomas y diagnóstico con colesterol o frecuencia cardíaca promedio que podrían guiar decisiones clínicas.