Informe de Análisis Estadístico

Realizado por: Klever Suqui

Fecha: 2024-08-12

Tema: Analítica de datos (utilizando RStudio + highcharter)

Descripción: Este taller calificado consiste en realizar un informe estadístico utilizando alguno de los siguientes conjuntos de datos presentados a continuación.

1. Carga del Conjunto de Datos

# Cargar los datos desde la URL

data <- read.csv("https://raw.githubusercontent.com/geovannychoez/prueba/master/processed.cleveland.data", header = FALSE, sep = ",", na.strings = '?')

# Renombrar las columnas

names(data) <- c("edad", "sexo", "tipo_dolor_pecho", "presion_arterial", "colesterol", "azucar_en_ayunas", "electrocardiograma", "frecuencia_cardiaca_max", "angina_ejercicio", "depresion_ST", "pendiente_ST", "vasos_obstruidos", "talasemia", "diagnostico")

2. Diagramas Estadística Descriptiva Univariante

# Diagrama de barras para la variable 'sexo'

hchart(as.factor(data$sexo), type = "column") %>%
  hc_title(text = "Distribución del Sexo", style = list(color = "#446275"))
# Diagrama de barras para la variable 'tipo_dolor_pecho'

hchart(as.factor(data$tipo_dolor_pecho), type = "column") %>%
  hc_title(text = "Distribución del Tipo de Dolor de Pecho",  style = list(color = "#446275"))

3. Diagramas Estadística Descriptiva Bivariante

# Diagrama de dispersión para 'edad' y 'colesterol'
hchart(data, "scatter", hcaes(x = edad, y = colesterol)) %>%
  hc_title(text = "Relación entre Edad y Colesterol", style = list(color = "#446275"))
# Diagrama de dispersión para 'presion_arterial' y 'frecuencia_cardiaca_max'
hchart(data, "scatter", hcaes(x = presion_arterial, y = frecuencia_cardiaca_max)) %>%
  hc_title(text = "Relación entre Presión Arterial y Frecuencia Cardiaca Máxima", style = list(color = "#446275"))

4. Estadística descriptiva Multivariante

# Matriz de diagramas de dispersión
pairs(data[c("edad", "colesterol", "presion_arterial", "frecuencia_cardiaca_max")], 
      main = "Matriz de Diagramas de Dispersión", col.main = "#446275", col ="#87CEFA")

# Cambiar el color del título
#title(main = "Matriz de Diagramas de Dispersión", col.main = "#446275")

# Cálculo de la matriz de correlación
  cor_matrix <- cor(data[c("edad", "colesterol", "presion_arterial", "frecuencia_cardiaca_max")], use = "complete.obs")

# Convertir la matriz de correlación en un data frame
  cor_data <- as.data.frame(as.table(cor_matrix))

# Crear el heatmap con highcharter
    hchart(cor_data, type = "heatmap", hcaes(x = Var1, y = Var2, value = Freq)) %>%
  hc_title(text = "Matriz de Correlación",style = list(color = "#446275")) %>%
  hc_colorAxis(minColor = "#FFFFFF", maxColor = "#87CEFA")

5. Conclusiones

  1. Relación entre edad y presión arterial: Al analizar los resultados y obtener una correlación positiva entre la edad y la presión arterial sugiere que, en general, con el envejesimiento existe una tendencia a tener una presión arterial más alta, lo que denota como un indicador del efecto acumulativo del envejecimiento sobre la presión arterial.

  2. Relación inversa entre frecuencia cardíaca máxima y edad: El resultado negativo de una correlación entre la frecuencia cardíaca máxima y la edad sugiere que a medida que las personas envejecen, la frecuencia cardíaca máxima tiende a disminuir lo que demostraria que la capacidad cardiovascular puede disminuir con la edad.