<- read.table("heart_disease_a.txt", header = TRUE, sep = ";")
dados
colnames(dados) = c("sexo", "idade", "fumante", "cigs_por_dia",
"med_hip", "avc", "hipertensao", "diabetes",
"col_tot", "pressao_sis", "pressao_dias", "imc",
"freq_card", "glicose", "risco_doenca_cardiaca")
$sexo = factor(dados$sexo, levels = c(0,1), labels = c("Feminino", "Masculino"))
dados$fumante = factor(dados$fumante, levels = c(0,1), labels = c("Não", "Sim"))
dados$med_hip = factor(dados$med_hip, levels = c(0,1), labels = c("Não", "Sim"))
dados$avc = factor(dados$avc, levels = c(0,1), labels = c("Não", "Sim"))
dados$hipertensao = factor(dados$hipertensao, levels = c(0,1), labels = c("Não", "Sim"))
dados$diabetes = factor(dados$diabetes, levels = c(0,1), labels = c("Não", "Sim"))
dados$risco_doenca_cardiaca = factor(dados$risco_doenca_cardiaca, levels = c(0,1), labels = c("Não", "Sim")) dados
Exercício 3 - Introdução ao R
1) Indivíduos hipertensos
<- dados[dados$hipertensao == "Sim", ]
dados1 head(dados1)
sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
4 Feminino 61 Sim 30 Não Não Sim Não
6 Feminino 43 Não 0 Não Não Sim Não
9 Masculino 52 Não 0 Não Não Sim Não
10 Masculino 43 Sim 30 Não Não Sim Não
13 Masculino 46 Sim 15 Não Não Sim Não
14 Feminino 41 Não 0 Sim Não Sim Não
col_tot pressao_sis pressao_dias imc freq_card glicose
4 225 150.0 95 28.58 65 103
6 228 180.0 110 30.30 77 99
9 260 141.5 89 26.36 76 79
10 225 162.0 107 23.61 93 88
13 294 142.0 94 26.31 98 64
14 332 124.0 88 31.31 65 84
risco_doenca_cardiaca
4 Sim
6 Não
9 Não
10 Não
13 Não
14 Não
2) Indivíduos com risco de doença cardíaca
<- dados[dados$risco_doenca_cardiaca == "Sim",]
dados2 head(dados2)
sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
4 Feminino 61 Sim 30 Não Não Sim Não
7 Feminino 63 Não 0 Não Não Não Não
16 Feminino 38 Sim 20 Não Não Sim Não
18 Feminino 46 Sim 20 Não Não Não Não
26 Masculino 47 Sim 20 Não Não Não Não
29 Feminino 61 Não 0 Não Não Sim Não
col_tot pressao_sis pressao_dias imc freq_card glicose
4 225 150 95 28.58 65 103
7 205 138 71 33.11 60 85
16 221 140 90 21.35 95 70
18 291 112 78 23.38 80 89
26 294 102 68 24.18 62 66
29 272 182 121 32.80 85 65
risco_doenca_cardiaca
4 Sim
7 Sim
16 Sim
18 Sim
26 Sim
29 Sim
3) Indivíduos que fumam mais de 40 cigarros por dia
<- dados[dados$cigs_por_dia > 40,]
dados3 head(dados3)
sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
32 Masculino 43 Sim 43 Não Não Não Não
80 Masculino 41 Sim 43 Não Não Sim Não
89 Masculino 41 Sim 43 Não Não Não Não
108 Masculino 40 Sim 43 Não Não Sim Não
NA <NA> NA <NA> NA <NA> <NA> <NA> <NA>
NA.1 <NA> NA <NA> NA <NA> <NA> <NA> <NA>
col_tot pressao_sis pressao_dias imc freq_card glicose
32 226 115 85.5 27.57 75 75
80 274 152 90.0 30.58 85 65
89 252 124 86.0 28.56 100 70
108 290 138 90.0 27.54 85 73
NA NA NA NA NA NA NA
NA.1 NA NA NA NA NA NA
risco_doenca_cardiaca
32 Não
80 Não
89 Não
108 Sim
NA <NA>
NA.1 <NA>
4) Indivíduos com idade ≤ 40 e risco de doença cardíaca
<- dados[dados$idade <= 40 & dados$risco_doenca_cardiaca == "Sim",]
idade_rdc head(idade_rdc)
sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
16 Feminino 38 Sim 20 Não Não Sim Não
60 Feminino 40 Sim 20 Não Não Não Não
82 Masculino 39 Não 0 Não Não Sim Não
98 Feminino 40 Não 0 Não Não Não Não
108 Masculino 40 Sim 43 Não Não Sim Não
191 Masculino 38 Sim 20 Não Não Sim Não
col_tot pressao_sis pressao_dias imc freq_card glicose
16 221 140 90 21.35 95 70
60 205 158 102 25.45 75 87
82 285 155 110 32.51 84 70
98 205 100 60 NA 60 72
108 290 138 90 27.54 85 73
191 253 133 92 28.82 80 63
risco_doenca_cardiaca
16 Sim
60 Sim
82 Sim
98 Sim
108 Sim
191 Sim
5) Indivíduos não hipertensos e com AVC
<- dados[dados$hipertensao == "Não" & dados$avc == "Sim",]
dados4 head(dados4)
sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
476 Masculino 53 Sim 15 Não Sim Não Não
647 Masculino 38 Não 0 Não Sim Não Não
2037 Feminino 54 Não 0 Não Sim Não Não
2472 Masculino 52 Não 0 Não Sim Não Não
3315 Feminino 47 Não 0 Não Sim Não Não
3605 Feminino 42 Não 0 Não Sim Não Não
col_tot pressao_sis pressao_dias imc freq_card glicose
476 161 116.0 74.5 19.82 80 90
647 224 127.5 81.0 20.39 80 90
2037 321 150.0 93.0 22.50 75 131
2472 202 136.0 94.0 29.93 83 67
3315 220 124.0 75.5 24.71 65 68
3605 206 101.0 75.0 18.73 55 84
risco_doenca_cardiaca
476 Não
647 Não
2037 Não
2472 Sim
3315 Não
3605 Não
6) Indivíduos não hipertensos com risco de doença cardíaca
<- dados[dados$hipertensao == "Não" & dados$risco_doenca_cardiaca == "Sim",]
dados5 head(dados5)
sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
7 Feminino 63 Não 0 Não Não Não Não
18 Feminino 46 Sim 20 Não Não Não Não
26 Masculino 47 Sim 20 Não Não Não Não
34 Masculino 61 Sim 5 Não Não Não Não
49 Feminino 63 Sim 40 Não Não Não Não
60 Feminino 40 Sim 20 Não Não Não Não
col_tot pressao_sis pressao_dias imc freq_card glicose
7 205 138 71.0 33.11 60 85
18 291 112 78.0 23.38 80 89
26 294 102 68.0 24.18 62 66
34 175 134 82.5 18.59 72 75
49 179 116 69.0 22.15 95 75
60 205 158 102.0 25.45 75 87
risco_doenca_cardiaca
7 Sim
18 Sim
26 Sim
34 Sim
49 Sim
60 Sim
7) Medidas descritivas: col_tot, pressao_sis, pressao_dias
summary(dados$col_tot)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
107.0 206.0 234.0 236.7 263.0 696.0 50
summary(dados$pressao_sis)
Min. 1st Qu. Median Mean 3rd Qu. Max.
83.5 117.0 128.0 132.4 144.0 295.0
summary(dados$pressao_dias)
Min. 1st Qu. Median Mean 3rd Qu. Max.
48.00 75.00 82.00 82.89 89.88 142.50
8) Matriz de correlação de Pearson (observações completas)
<- dados[complete.cases(dados), ]
dados_completos cor(dados_completos[, c("idade", "cigs_por_dia", "col_tot", "pressao_sis", "pressao_dias", "imc", "freq_card", "glicose")], method = "pearson")
idade cigs_por_dia col_tot pressao_sis pressao_dias
idade 1.000000000 -0.18861133 0.26096680 0.38855806 0.20577366
cigs_por_dia -0.188611327 1.00000000 -0.03042748 -0.09229195 -0.05610784
col_tot 0.260966799 -0.03042748 1.00000000 0.21657184 0.17035327
pressao_sis 0.388558055 -0.09229195 0.21657184 1.00000000 0.78590912
pressao_dias 0.205773658 -0.05610784 0.17035327 0.78590912 1.00000000
imc 0.136093082 -0.09003152 0.11939794 0.33056910 0.38416646
freq_card -0.005857222 0.06672562 0.09480177 0.18148237 0.17517526
glicose 0.118426437 -0.05516509 0.04676909 0.13292806 0.06189051
imc freq_card glicose
idade 0.13609308 -0.005857222 0.11842644
cigs_por_dia -0.09003152 0.066725623 -0.05516509
col_tot 0.11939794 0.094801770 0.04676909
pressao_sis 0.33056910 0.181482373 0.13292806
pressao_dias 0.38416646 0.175175261 0.06189051
imc 1.00000000 0.071952767 0.08812125
freq_card 0.07195277 1.000000000 0.09952796
glicose 0.08812125 0.099527961 1.00000000