Nesse trabalho analisaremos dados sobre parâmetros de saúde cardíaca em indivíduos de diversos gêneros e idades. Os microdados dessa análise estão disponíveis aqui.
Inicialmente importaremos a base de dados e importaremos as variáveis que nos interessam, temos:
library(tidyverse)
heart <- read.csv("~/heart.csv")
idade = heart$ï..age
sexo = heart$sex
colesterol = heart$chol
pressao_repouso = heart$trestbps
doente = heart$target
base <- as.data.frame(cbind(idade, sexo, colesterol, pressao_repouso, doente))
Em que a variável idade, sexo, e colesterol representam a idade, o sexo e a taxa de colesterol em mg/dl de sangue, respectivamente, doente é uma variável binária que representa a presença ou ausência de doença cardíaca, pressao_repouso indica a pressão sistólica em mmHg do paciente em repouso.
Inicialmente, vamos analisar se há alguma relação aparente entre a taxa de colesterol e a pressão sistólica no grupo analisado. Para melhor visualizar a relação, ajustaremos uma regressão linear:
É visto que tanto para homens quanto para mulheres não parece ter alguma relação aparente entre as taxas, evidenciado pela quantidade de outliers e pela falta de qualidade do ajuste das retas de regressão.
Analisaremos agora a distribuição da taxa de colesterol entre homens e mulheres a fim de inferir se há alguma influência do sexo no valor das taxas:
Em que pela imagem, evidencia-se que os homens apresentam taxas menores de colesterol, inclusive, com um outlier no grupo das mulheres.
Através do uso de histogramas, analiseros a prevalência de doenças cardícas através dos diferentes grupos etários:
No qual, de forma surpreendente, vemos que há uma prevalência maior de doenças cardíacas em indíviduos mais jovens.