Para este ejercicio, se utilizaron los resultados obtenidos en la Actividad 2, que se enfocaron a corregir los problemas con el dataset Heart Disease UCI, para el cual se realizó lo siguiente:
str), resumen estadístico
(summary,
skim) y duplicados. Se detectaron valores
ausentes en algunas variables.mice, generando 5
datasets y eligiendo el segundo.disease.A continuación se presenta el detalle de estructura del dataframe Heart Disease UCI, para verificar la asignación correcta del tipo de dato.
str(heart)
## 'data.frame': 920 obs. of 15 variables:
## $ age : int 63 67 67 37 41 56 62 57 63 53 ...
## $ sex : chr "Male" "Male" "Male" "Male" ...
## $ dataset : chr "Cleveland" "Cleveland" "Cleveland" "Cleveland" ...
## $ cp : chr "typical angina" "asymptomatic" "asymptomatic" "non-anginal" ...
## $ trestbps: num 145 160 120 130 130 ...
## $ chol : num 233 286 229 250 204 236 268 354 254 203 ...
## $ fbs : logi TRUE FALSE FALSE FALSE FALSE FALSE ...
## $ restecg : chr "lv hypertrophy" "lv hypertrophy" "lv hypertrophy" "normal" ...
## $ thalch : num 150 108 129 187 172 178 160 163 147 155 ...
## $ exang : logi FALSE TRUE TRUE FALSE FALSE FALSE ...
## $ oldpeak : num 1.98 1.5 1.98 1.98 1.4 ...
## $ slope : chr "downsloping" "flat" "flat" "downsloping" ...
## $ ca : int 0 3 2 0 0 0 2 0 1 0 ...
## $ thal : chr "fixed defect" "normal" "reversable defect" "normal" ...
## $ num : int 0 2 1 0 0 0 3 0 2 1 ...
Se obtiene un resumen de las variables que conforman el dataframe:
| Variable | Descripcion |
|---|---|
| age | Edad del paciente en años |
| sex | Sexo del paciente (0 = mujer, 1 = hombre) |
| dataset | Fuente del registro (Cleveland, Hungary, etc.) |
| cp | Tipo de dolor torácico (0–3) |
| trestbps | Presión arterial en reposo (mm Hg) |
| chol | Colesterol sérico (mg/dl) |
| fbs | Azúcar en sangre en ayunas > 120 mg/dl (1 = sí, 0 = no) |
| restecg | Resultado del electrocardiograma en reposo (0–2) |
| thalch | Frecuencia cardíaca máxima alcanzada |
| exang | Angina inducida por ejercicio (1 = sí, 0 = no) |
| oldpeak | Depresión del segmento ST inducida por ejercicio |
| slope | Pendiente del segmento ST durante el esfuerzo (0–2) |
| ca | Número de vasos principales coloreados por fluoroscopia (0–3) |
| thal | Tipo de talasemia (3, 6, 7) |
| num | Diagnóstico de enfermedad cardíaca (0 = sano, 1–4 = enfermo) |
¿Existe una relación entre el tipo de dolor torácico
(cp), el nivel de
colesterol (chol) y la presencia
de enfermedad cardíaca
(num) en pacientes del dataset
heart_limpio?
Esta pregunta busca explorar cómo
una variable categórica (tipo de dolor) y una
continua (colesterol) se relacionan con el
diagnóstico final, considerando además otras
variables relevantes como el ritmo cardíaco
máximo (thalch) y el tipo
de talasemia (thal).
chol
(colesterol), thalch
(frecuencia cardíaca máxima)cp
(tipo de dolor torácico),
thal (tipo de talasemia),
num (diagnóstico de enfermedad
cardíaca)La gráfica muestra la relación entre
colesterol (chol) y
frecuencia cardíaca máxima
(thalch), diferenciando por
diagnóstico (num)
mediante color. Cada punto representa un paciente, y los colores indican
cinco categorías diagnósticas: 0, 1, 2, 3 y 4.
Interpretación:
No se observa una correlación lineal clara entre colesterol y frecuencia cardíaca máxima, lo que sugiere que estas variables pueden variar de forma independiente en el dataset analizado.
Los grupos de diagnóstico muestran dispersión interna considerable, indicando que ni el colesterol ni la frecuencia cardíaca máxima por sí solos permiten distinguir claramente entre estados clínicos.
Algunos pacientes presentan valores extremos de
colesterol
(>300 mg/dl) o frecuencia
cardíaca (<100 bpm), lo que
podría reflejar casos clínicos particulares o
errores de medición.
La distribución de puntos sugiere que
ciertos diagnósticos (por ejemplo,
num = 0 vs
num = 4) tienden a agruparse en
zonas distintas del gráfico, lo que podría indicar
patrones clínicos latentes que requieren análisis
multivariado.
Vamos a agregar facetado por tipo de dolor torácico
(cp) para ver si los síntomas
modifican la relación entre
colesterol y frecuencia cardíaca:
En la gráfica, cada panel representa un subtipo de dolor:
asintomático, angina típica, angina atípica y
dolor no anginoso. Los puntos están coloreados según el
diagnóstico (num).
Interpretación:
La dispersión de los datos varía entre tipos de dolor, lo que sugiere que los síntomas podrían influir en el perfil clínico de colesterol y frecuencia cardíaca.
En pacientes asintomáticos, se observa una mayor concentración de diagnósticos graves (colores más claros), con menor frecuencia cardíaca.
Los tipos de dolor menos típicos muestran mayor variabilidad, lo que podría indicar perfiles clínicos más heterogéneos.
No se aprecia una correlación lineal clara entre colesterol y frecuencia cardíaca en ningún grupo, por lo que se podría complementar con un análisis multivariado.
La gráfica muestra la distribución de los niveles de
colesterol (chol) según
el tipo de dolor torácico
(cp) y la condición de
talasemia (thal). Cada grupo de
talasemia —defecto fijo, normal y defecto
reversible— contiene boxplots para los cuatro tipos de
dolor: asintomático, angina típica,
angina atípica y dolor no anginoso.
Interpretación:
En pacientes con defecto fijo, los niveles de colesterol tienden a ser más elevados, especialmente en los casos asintomáticos, lo que podría indicar un perfil clínico de riesgo silencioso.
Los pacientes con talasemia normal muestran una dispersión más homogénea del colesterol entre los tipos de dolor, sin diferencias marcadas.
En el grupo con defecto reversible, se observa una mayor variabilidad, con algunos tipos de dolor (como angina típica) mostrando valores extremos de colesterol.
La combinación de dolor torácico y tipo de talasemia parece influir en la distribución del colesterol, lo que sugiere que estas variables podrían interactuar en el perfil metabólico del paciente.
La gráfica muestra la distribución proporcional de los
diagnósticos (num) en función del
tipo de dolor torácico
(cp). Cada barra representa un tipo de
dolor —asintomático, angina típica, angina
atípica y dolor no anginoso— y está segmentada por los
cinco niveles de diagnóstico (de 0 a
4), indicados por colores.
Interpretación:
El dolor asintomático presenta una mayor proporción de diagnósticos graves (num = 3 o 4), lo que sugiere que la ausencia de síntomas no implica menor riesgo clínico.
En contraste, los pacientes con angina típica o dolor no anginoso muestran una mayor proporción de diagnósticos leves (num = 0 o 1), lo que podría reflejar una percepción más temprana de síntomas.
El tipo de dolor torácico parece estar asociado con el perfil diagnóstico, lo que podría ayudar en la estratificación de riesgo y en la toma de decisiones clínicas.
chol) por tipo de dolor torácico
(cp) y diagnóstico
(num)La gráfica muestra la distribución de los niveles de
colesterol (chol)
mediante curvas de densidad, facetadas por tipo de dolor
torácico (cp) y coloreadas por
diagnóstico (num). Cada panel
representa un subtipo de dolor: asintomático,
angina típica, angina atípica y
dolor no anginoso.
Interpretación:
En pacientes asintomáticos, se observa una mayor concentración de diagnósticos graves (num = 3 o 4) en rangos de colesterol más altos, lo que podría indicar un perfil de riesgo silencioso.
Los pacientes con angina típica muestran una distribución más amplia, con presencia de todos los niveles de diagnóstico, lo que sugiere una mayor heterogeneidad.
En el grupo con dolor no anginoso, los diagnósticos leves (num = 0 o 1) predominan en rangos de colesterol más bajos, lo que podría reflejar un perfil metabólico más favorable.
La superposición de curvas indica que el colesterol por sí solo no discrimina completamente entre diagnósticos, pero su interacción con el tipo de dolor podría ser clínicamente relevante.
El análisis sugiere que el tipo de dolor torácico* modula la distribución de colesterol según el diagnóstico, lo que podría ser útil para estratificación de riesgo.
chol) y frecuencia cardíaca máxima
(thalch) por tipo de talasemia
(thal)La gráfica muestra la relación entre
colesterol (chol) y
frecuencia cardíaca máxima
(thalch), facetada por tipo de
talasemia (thal) y coloreada por
diagnóstico (num). Cada panel
representa una condición de talasemia: defecto fijo,
normal y defecto reversible.
Interpretación:
En el grupo con defecto fijo, se observa una mayor concentración de diagnósticos graves (num = 3 o 4) en pacientes con colesterol elevado y frecuencia cardíaca reducida, lo que podría indicar un perfil clínico de alto riesgo.
Los pacientes con talasemia normal presentan una distribución más dispersa, con presencia de todos los niveles de diagnóstico, lo que sugiere una mayor heterogeneidad metabólica.
En el grupo con defecto reversible, los diagnósticos leves (num = 0 o 1) predominan en rangos de colesterol más bajos y frecuencia cardíaca más alta, lo que podría reflejar un perfil clínico más favorable.
La interacción entre colesterol, frecuencia cardíaca máxima y tipo de talasemia parece influir en el perfil diagnóstico, lo que podría ser útil para estratificación de riesgo y personalización del tratamiento.
La gráfica presenta un mapa de calor que
cruza el tipo de dolor torácico
(cp) con el diagnóstico
clínico (num), mostrando en cada
celda el conteo de pacientes y coloreando según el
colesterol promedio
(chol).
Interpretación:
El tipo de dolor asintomático aparece en combinación con todos los niveles de diagnóstico, pero con colesterol promedio más bajo en los casos leves (num = 0) y más alto en los graves (num = 3), lo que sugiere un perfil de riesgo silencioso.
La categoría angina atípica muestra el mayor conteo de pacientes en diagnóstico leve (num = 0), con colesterol promedio elevado, lo que podría indicar una población metabólicamente vulnerable.
En el grupo angina típica, los casos graves (num = 2 o 3) son menos frecuentes, pero presentan colesterol bajo, lo que podría reflejar un perfil clínico distinto.
El dolor no anginoso se asocia principalmente con diagnósticos leves (num = 0), y colesterol moderado, lo que sugiere un perfil clínico más benigno.
thalch) por tipo de
talasemia (thal) y diagnóstico
(num)La gráfica muestra un mapa de calor
que cruza el tipo de talasemia
(thal) con el diagnóstico
clínico (num), coloreando cada
celda según la frecuencia cardíaca máxima promedio
(thalch).
Interpretación:
En pacientes con talasemia normal, se observa una frecuencia cardíaca más elevada en los diagnósticos leves (num = 0 o 1), lo que podría reflejar un perfil funcional más saludable.
Los casos con defecto fijo presentan frecuencias cardíacas más bajas en los diagnósticos graves (num = 3 o 4), lo que sugiere una posible asociación entre disfunción cardíaca.
En el grupo con defecto reversible, la frecuencia cardíaca se mantiene en rangos intermedios, con menor variabilidad entre diagnósticos, lo que podría indicar una respuesta más estable ante el esfuerzo.
La interacción entre tipo de talasemia y diagnóstico parece influir en la capacidad funcional del corazón, lo que podría ser útil para estratificación de riesgo y seguimiento terapéutico.
La gráfica muestra la relación entre
colesterol (chol) y
frecuencia cardíaca máxima
(thalch) en pacientes con
enfermedad cardíaca, facetada por tipo de dolor
torácico (cp) y coloreada por
diagnóstico (num). Cada
panel incluye una línea de tendencia
que permite visualizar el patrón de asociación en cada
subtipo de dolor.
Interpretación:
En pacientes asintomáticos, se observa una tendencia ligeramente positiva: a mayor colesterol, mayor frecuencia cardíaca máxima, especialmente en diagnósticos más graves (num = 3 o 4), lo que podría indicar un perfil clínico de riesgo silencioso.
En el grupo con angina típica, la relación parece más plana, con menor variación en frecuencia cardíaca, lo que sugiere una posible estabilidad funcional en este subtipo.
Los pacientes con angina atípica muestran una dispersión amplia y una pendiente menos definida, lo que podría reflejar heterogeneidad clínica.
En el grupo con dolor no anginoso, la pendiente es ligeramente positiva, lo que podría indicar que en este subtipo, el colesterol no se asocia negativamente con la capacidad funcional cardíaca.
La interacción entre colesterol, frecuencia cardíaca máxima y tipo de dolor torácico podría ser útil para estratificación de riesgo y personalización del tratamiento en pacientes con enfermedad cardíaca.
cp), color por diagnóstico (num),
tamaño por colesterol (chol)La gráfica muestra la relación entre
edad (age) y
frecuencia cardíaca máxima
(thalch), facetada por tipo de dolor
torácico (cp), con cada punto
representando un paciente. El color indica el
diagnóstico (num) y el
tamaño del punto representa el
colesterol (chol).
Interpretación:
En pacientes asintomáticos, se observa una tendencia a menor frecuencia cardíaca en edades avanzadas, especialmente en diagnósticos más graves (num = 3 o 4) y con colesterol elevado (círculos grandes).
En el grupo con angina típica, los pacientes tienden a tener frecuencia cardíaca más conservada, incluso en edades mayores, lo que podría reflejar un perfil funcional más estable.
Los pacientes con angina atípica muestran una dispersión amplia en edad y frecuencia cardíaca, con presencia de todos los niveles de diagnóstico.
En el grupo con dolor no anginoso, predominan los diagnósticos leves (num = 0 o 1) en pacientes más jóvenes, con colesterol moderado, lo que podría indicar un perfil metabólico más favorable.
La interacción entre edad, frecuencia cardíaca, colesterol y tipo de dolor torácico permite visualizar perfiles clínicos diferenciados, útiles para estratificación de riesgo y personalización del tratamiento.
La gráfica muestra la relación entre
edad (age) y
frecuencia cardíaca máxima
(thalch), facetada por tipo de dolor
torácico (cp) y coloreada por
diagnóstico (num). Cada panel
representa un subtipo de dolor: asintomático, angina
típica, angina atípica y dolor no anginoso.
Interpretación:
En pacientes asintomáticos, se observa una tendencia descendente: a mayor edad, menor frecuencia cardíaca máxima, especialmente en diagnósticos más graves (num = 3 o 4), lo que podría indicar deterioro funcional silencioso.
En el grupo con angina típica, la frecuencia cardíaca se mantiene relativamente estable en distintos rangos de edad, lo que sugiere una posible compensación fisiológica o menor impacto del envejecimiento.
Los pacientes con angina atípica presentan una dispersión amplia en edad y frecuencia cardíaca, con presencia de todos los niveles de diagnóstico, lo que refleja una alta heterogeneidad clínica.
En el grupo con dolor no anginoso, predominan los diagnósticos leves (num = 0 o 1) en pacientes más jóvenes, lo que podría indicar un perfil clínico más favorable.
La interacción entre edad, frecuencia cardíaca máxima y tipo de dolor torácico permite identificar patrones funcionales diferenciados que pueden ser útiles para estratificación de riesgo y personalización del tratamiento.
El uso de tooltips interactivos permite acceder a información clínica detallada al pasar el cursor sobre cada punto, enriqueciendo la interpretación visual. En este caso, el tooltip incluye:
Esto permite identificar perfiles individuales dentro de cada grupo, facilitando el análisis de casos extremos o patrones ocultos. Ayuda a detectar combinaciones de riesgo, como pacientes jóvenes con colesterol alto y diagnóstico grave.
Tras revisar múltiples visualizaciones que exploran la interacción entre variables clínicas como edad, colesterol, frecuencia cardíaca máxima, tipo de dolor torácico, diagnóstico y talasemia, se identifican los siguientes patrones y recomendaciones: