Exercício 3 - Introdução ao R

Author

Ezequiel da Silva Ferreira

dados <- read.table("heart_disease_a.txt", header = TRUE, sep = ";")

colnames(dados) = c("sexo", "idade", "fumante", "cigs_por_dia",
                    "med_hip", "avc", "hipertensao", "diabetes",
                    "col_tot", "pressao_sis", "pressao_dias", "imc",
                    "freq_card", "glicose", "risco_doenca_cardiaca")

dados$sexo = factor(dados$sexo, levels = c(0,1), labels = c("Feminino", "Masculino"))
dados$fumante = factor(dados$fumante, levels = c(0,1), labels = c("Não", "Sim"))
dados$med_hip = factor(dados$med_hip, levels = c(0,1), labels = c("Não", "Sim"))
dados$avc = factor(dados$avc, levels = c(0,1), labels = c("Não", "Sim"))
dados$hipertensao = factor(dados$hipertensao, levels = c(0,1), labels = c("Não", "Sim"))
dados$diabetes = factor(dados$diabetes, levels = c(0,1), labels = c("Não", "Sim"))
dados$risco_doenca_cardiaca = factor(dados$risco_doenca_cardiaca, levels = c(0,1), labels = c("Não", "Sim"))

1) Indivíduos hipertensos

dados1 <- dados[dados$hipertensao == "Sim", ]
head(dados1)
        sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
4   Feminino    61     Sim           30     Não Não         Sim      Não
6   Feminino    43     Não            0     Não Não         Sim      Não
9  Masculino    52     Não            0     Não Não         Sim      Não
10 Masculino    43     Sim           30     Não Não         Sim      Não
13 Masculino    46     Sim           15     Não Não         Sim      Não
14  Feminino    41     Não            0     Sim Não         Sim      Não
   col_tot pressao_sis pressao_dias   imc freq_card glicose
4      225       150.0           95 28.58        65     103
6      228       180.0          110 30.30        77      99
9      260       141.5           89 26.36        76      79
10     225       162.0          107 23.61        93      88
13     294       142.0           94 26.31        98      64
14     332       124.0           88 31.31        65      84
   risco_doenca_cardiaca
4                    Sim
6                    Não
9                    Não
10                   Não
13                   Não
14                   Não

2) Indivíduos com risco de doença cardíaca

dados2 <- dados[dados$risco_doenca_cardiaca == "Sim",]
head(dados2)
        sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
4   Feminino    61     Sim           30     Não Não         Sim      Não
7   Feminino    63     Não            0     Não Não         Não      Não
16  Feminino    38     Sim           20     Não Não         Sim      Não
18  Feminino    46     Sim           20     Não Não         Não      Não
26 Masculino    47     Sim           20     Não Não         Não      Não
29  Feminino    61     Não            0     Não Não         Sim      Não
   col_tot pressao_sis pressao_dias   imc freq_card glicose
4      225         150           95 28.58        65     103
7      205         138           71 33.11        60      85
16     221         140           90 21.35        95      70
18     291         112           78 23.38        80      89
26     294         102           68 24.18        62      66
29     272         182          121 32.80        85      65
   risco_doenca_cardiaca
4                    Sim
7                    Sim
16                   Sim
18                   Sim
26                   Sim
29                   Sim

3) Indivíduos que fumam mais de 40 cigarros por dia

dados3 <- dados[dados$cigs_por_dia > 40,]
head(dados3)
          sexo idade fumante cigs_por_dia med_hip  avc hipertensao diabetes
32   Masculino    43     Sim           43     Não  Não         Não      Não
80   Masculino    41     Sim           43     Não  Não         Sim      Não
89   Masculino    41     Sim           43     Não  Não         Não      Não
108  Masculino    40     Sim           43     Não  Não         Sim      Não
NA        <NA>    NA    <NA>           NA    <NA> <NA>        <NA>     <NA>
NA.1      <NA>    NA    <NA>           NA    <NA> <NA>        <NA>     <NA>
     col_tot pressao_sis pressao_dias   imc freq_card glicose
32       226         115         85.5 27.57        75      75
80       274         152         90.0 30.58        85      65
89       252         124         86.0 28.56       100      70
108      290         138         90.0 27.54        85      73
NA        NA          NA           NA    NA        NA      NA
NA.1      NA          NA           NA    NA        NA      NA
     risco_doenca_cardiaca
32                     Não
80                     Não
89                     Não
108                    Sim
NA                    <NA>
NA.1                  <NA>

4) Indivíduos com idade ≤ 40 e risco de doença cardíaca

idade_rdc <- dados[dados$idade <= 40 & dados$risco_doenca_cardiaca == "Sim",]
head(idade_rdc)
         sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
16   Feminino    38     Sim           20     Não Não         Sim      Não
60   Feminino    40     Sim           20     Não Não         Não      Não
82  Masculino    39     Não            0     Não Não         Sim      Não
98   Feminino    40     Não            0     Não Não         Não      Não
108 Masculino    40     Sim           43     Não Não         Sim      Não
191 Masculino    38     Sim           20     Não Não         Sim      Não
    col_tot pressao_sis pressao_dias   imc freq_card glicose
16      221         140           90 21.35        95      70
60      205         158          102 25.45        75      87
82      285         155          110 32.51        84      70
98      205         100           60    NA        60      72
108     290         138           90 27.54        85      73
191     253         133           92 28.82        80      63
    risco_doenca_cardiaca
16                    Sim
60                    Sim
82                    Sim
98                    Sim
108                   Sim
191                   Sim

5) Indivíduos não hipertensos e com AVC

dados4 <- dados[dados$hipertensao == "Não" & dados$avc == "Sim",]
head(dados4)
          sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
476  Masculino    53     Sim           15     Não Sim         Não      Não
647  Masculino    38     Não            0     Não Sim         Não      Não
2037  Feminino    54     Não            0     Não Sim         Não      Não
2472 Masculino    52     Não            0     Não Sim         Não      Não
3315  Feminino    47     Não            0     Não Sim         Não      Não
3605  Feminino    42     Não            0     Não Sim         Não      Não
     col_tot pressao_sis pressao_dias   imc freq_card glicose
476      161       116.0         74.5 19.82        80      90
647      224       127.5         81.0 20.39        80      90
2037     321       150.0         93.0 22.50        75     131
2472     202       136.0         94.0 29.93        83      67
3315     220       124.0         75.5 24.71        65      68
3605     206       101.0         75.0 18.73        55      84
     risco_doenca_cardiaca
476                    Não
647                    Não
2037                   Não
2472                   Sim
3315                   Não
3605                   Não

6) Indivíduos não hipertensos com risco de doença cardíaca

dados5 <- dados[dados$hipertensao == "Não" & dados$risco_doenca_cardiaca == "Sim",]
head(dados5)
        sexo idade fumante cigs_por_dia med_hip avc hipertensao diabetes
7   Feminino    63     Não            0     Não Não         Não      Não
18  Feminino    46     Sim           20     Não Não         Não      Não
26 Masculino    47     Sim           20     Não Não         Não      Não
34 Masculino    61     Sim            5     Não Não         Não      Não
49  Feminino    63     Sim           40     Não Não         Não      Não
60  Feminino    40     Sim           20     Não Não         Não      Não
   col_tot pressao_sis pressao_dias   imc freq_card glicose
7      205         138         71.0 33.11        60      85
18     291         112         78.0 23.38        80      89
26     294         102         68.0 24.18        62      66
34     175         134         82.5 18.59        72      75
49     179         116         69.0 22.15        95      75
60     205         158        102.0 25.45        75      87
   risco_doenca_cardiaca
7                    Sim
18                   Sim
26                   Sim
34                   Sim
49                   Sim
60                   Sim

7) Medidas descritivas: col_tot, pressao_sis, pressao_dias

summary(dados$col_tot)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
  107.0   206.0   234.0   236.7   263.0   696.0      50 
summary(dados$pressao_sis)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   83.5   117.0   128.0   132.4   144.0   295.0 
summary(dados$pressao_dias)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  48.00   75.00   82.00   82.89   89.88  142.50 

8) Matriz de correlação de Pearson (observações completas)

dados_completos <- dados[complete.cases(dados), ]
cor(dados_completos[, c("idade", "cigs_por_dia", "col_tot", "pressao_sis", "pressao_dias", "imc", "freq_card", "glicose")], method = "pearson")
                    idade cigs_por_dia     col_tot pressao_sis pressao_dias
idade         1.000000000  -0.18861133  0.26096680  0.38855806   0.20577366
cigs_por_dia -0.188611327   1.00000000 -0.03042748 -0.09229195  -0.05610784
col_tot       0.260966799  -0.03042748  1.00000000  0.21657184   0.17035327
pressao_sis   0.388558055  -0.09229195  0.21657184  1.00000000   0.78590912
pressao_dias  0.205773658  -0.05610784  0.17035327  0.78590912   1.00000000
imc           0.136093082  -0.09003152  0.11939794  0.33056910   0.38416646
freq_card    -0.005857222   0.06672562  0.09480177  0.18148237   0.17517526
glicose       0.118426437  -0.05516509  0.04676909  0.13292806   0.06189051
                     imc    freq_card     glicose
idade         0.13609308 -0.005857222  0.11842644
cigs_por_dia -0.09003152  0.066725623 -0.05516509
col_tot       0.11939794  0.094801770  0.04676909
pressao_sis   0.33056910  0.181482373  0.13292806
pressao_dias  0.38416646  0.175175261  0.06189051
imc           1.00000000  0.071952767  0.08812125
freq_card     0.07195277  1.000000000  0.09952796
glicose       0.08812125  0.099527961  1.00000000