Nesse trabalho analisaremos dados sobre parâmetros de saúde cardíaca em indivíduos de diversos gêneros e idades. Os microdados dessa análise estão disponíveis aqui.

Tratamento da base de dados

Inicialmente importaremos a base de dados e importaremos as variáveis que nos interessam, temos:

library(tidyverse)

heart <- read.csv("~/heart.csv")

idade = heart$ï..age
sexo = heart$sex
colesterol = heart$chol
pressao_repouso = heart$trestbps
doente = heart$target

base <- as.data.frame(cbind(idade, sexo, colesterol, pressao_repouso, doente))

Em que a variável idade, sexo, e colesterol representam a idade, o sexo e a taxa de colesterol em mg/dl de sangue, respectivamente, doente é uma variável binária que representa a presença ou ausência de doença cardíaca, pressao_repouso indica a pressão sistólica em mmHg do paciente em repouso.

Análises

Relação entre a pressão sistólica e a taxa de colesterol

Inicialmente, vamos analisar se há alguma relação aparente entre a taxa de colesterol e a pressão sistólica no grupo analisado. Para melhor visualizar a relação, ajustaremos uma regressão linear:

É visto que tanto para homens quanto para mulheres não parece ter alguma relação aparente entre as taxas, evidenciado pela quantidade de outliers e pela falta de qualidade do ajuste das retas de regressão.

Colesterol entre homens e mulheres:

Analisaremos agora a distribuição da taxa de colesterol entre homens e mulheres a fim de inferir se há alguma influência do sexo no valor das taxas:

Em que pela imagem, evidencia-se que os homens apresentam taxas menores de colesterol, inclusive, com um outlier no grupo das mulheres.

Prevalência de doenças cardíacas por idade:

Através do uso de histogramas, analiseros a prevalência de doenças cardícas através dos diferentes grupos etários:

No qual, de forma surpreendente, vemos que há uma prevalência maior de doenças cardíacas em indíviduos mais jovens.