El conjunto heart_disease_uci proviene de la UCI Machine Learning Repository y contiene información clĆnica de pacientes estudiados por la Cleveland Clinic Foundation para detectar la presencia de enfermedad coronaria.
Se estudiaron 16 parƔmetros de 920 pacientes cuyas edades van desde los 28 hasta los 77.
De esos parÔmetros, ocho son numéricos, dos lógicos y seis son cadenas de caracteres. Siete de las variables son categóricas.
La mayorĆa de los pacientes son hombres:
## sex num porcentaje
## 1 Mujeres 194 21.08696
## 2 Hombres 726 78.91304
MĆ”s de la mitad de los pacientes son asintomĆ”ticos y los menos tienen dolortĆpico de angina de pecho. Aunque parece que eso es cierto para los hombres, para las mujeres es similar la cantidad de asintomĆ”ticas y que presentan angina atĆpica y muy parecido a dolor que nos es de angina.
Las mujeres presentan mayor colesterol en la sangre aunque los hombres tienen mĆ”s casos atĆpicos.
Proporcionalmente, es mÔs común que se induzca angina mediante el ejercico a las mujeres que a los hombres: mÔs de tres veces que sà se indujo en las mujeres.
Las dos terceras partes de los pacientes no estƔn enfermos o su enfermedad es leve.
Las fuentes que mĆ”s contribuyeron con datos fueron Cleveland y HungrĆa. TambiĆ©n fueron las fuentes que mĆ”s mujeres tienen, proporcionalmente.
No se observa ninguna correlación entre la presion en reposo y la frecuencia cardiaca mÔxima.
ggplot(datos, aes(x = chol, y = thalch, color = ca)) +
geom_point(alpha = 0.5, size = 1, na.rm = TRUE) +
labs(
title = "Colesterol vs. frecuencia cardiaca mƔxima",
x = "Colesterol",
y = "Frecuencia cardiaca mƔxima",
) +
theme_minimal()
Tampoco hay una correlación entre el colesterol y la frecuencia cardiaca mÔxima.
ggplot(datos, aes(x = trestbps, y = chol, color = ca)) +
geom_point(alpha = 0.5, size = 1, na.rm = TRUE) +
labs(
title = "Presion en reposo vs. colesterol",
x = "Presion en reposo",
y = "Colesterol",
) +
theme_minimal()
No hay correlación entre la presión arterial en reposo y el colesterol.