Realizado por: Klever Suqui
Fecha: 2024-08-12
Tema: Analítica de datos (utilizando RStudio + highcharter)
Descripción: Este taller calificado consiste en realizar un informe estadístico utilizando alguno de los siguientes conjuntos de datos presentados a continuación.
# Cargar los datos desde la URL
data <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/processed.cleveland.data", header = FALSE, sep = ",", na.strings = '?')
# Renombrar las columnas
names(data) <- c("edad", "sexo", "tipo_dolor_pecho", "presion_arterial", "colesterol", "azucar_en_ayunas", "electrocardiograma", "frecuencia_cardiaca_max", "angina_ejercicio", "depresion_ST", "pendiente_ST", "vasos_obstruidos", "talasemia", "diagnostico")
# Diagrama de barras para la variable 'sexo'
hchart(as.factor(data$sexo), type = "column") %>%
hc_title(text = "Distribución del Sexo", style = list(color = "#446275"))
# Diagrama de barras para la variable 'tipo_dolor_pecho'
hchart(as.factor(data$tipo_dolor_pecho), type = "column") %>%
hc_title(text = "Distribución del Tipo de Dolor de Pecho", style = list(color = "#446275"))
# Diagrama de dispersión para 'edad' y 'colesterol'
hchart(data, "scatter", hcaes(x = edad, y = colesterol)) %>%
hc_title(text = "Relación entre Edad y Colesterol", style = list(color = "#446275"))
# Diagrama de dispersión para 'presion_arterial' y 'frecuencia_cardiaca_max'
hchart(data, "scatter", hcaes(x = presion_arterial, y = frecuencia_cardiaca_max)) %>%
hc_title(text = "Relación entre Presión Arterial y Frecuencia Cardiaca Máxima", style = list(color = "#446275"))
# Matriz de diagramas de dispersión
pairs(data[c("edad", "colesterol", "presion_arterial", "frecuencia_cardiaca_max")],
main = "Matriz de Diagramas de Dispersión", col.main = "#446275", col ="#87CEFA")
# Cambiar el color del título
#title(main = "Matriz de Diagramas de Dispersión", col.main = "#446275")
# Cálculo de la matriz de correlación
cor_matrix <- cor(data[c("edad", "colesterol", "presion_arterial", "frecuencia_cardiaca_max")], use = "complete.obs")
# Convertir la matriz de correlación en un data frame
cor_data <- as.data.frame(as.table(cor_matrix))
# Crear el heatmap con highcharter
hchart(cor_data, type = "heatmap", hcaes(x = Var1, y = Var2, value = Freq)) %>%
hc_title(text = "Matriz de Correlación",style = list(color = "#446275")) %>%
hc_colorAxis(minColor = "#FFFFFF", maxColor = "#87CEFA")
Relación entre edad y presión arterial: Al analizar los resultados y obtener una correlación positiva entre la edad y la presión arterial sugiere que, en general, con el envejesimiento existe una tendencia a tener una presión arterial más alta, lo que denota como un indicador del efecto acumulativo del envejecimiento sobre la presión arterial.
Relación inversa entre frecuencia cardíaca máxima y edad: El resultado negativo de una correlación entre la frecuencia cardíaca máxima y la edad sugiere que a medida que las personas envejecen, la frecuencia cardíaca máxima tiende a disminuir lo que demostraria que la capacidad cardiovascular puede disminuir con la edad.