Carregamento das Bibliotecas

knitr::opts_chunk$set(echo = TRUE)

library(tidyverse)
library(DescTools)
library(lubridate)
library(readxl)
library(kableExtra)
library(gmodels)
options(scipen = 9999)

Epi84 - Exercício

Questão.

Alguns autores descrevem a existência de uma associação entre uso de álcool e hipertensão arterial. Utilizando o banco de dados, teste essa associação com pontos de corte para ingestão média diária de álcool em zero, 10 e 25 gramas. Teste como esta associação se comporta entre as pessoas magras e eutróficas, com sobrepeso e obesas.

Orientações:

Crie um único arquivo de sintaxe para o desenvolvimento das variáveis derivadas e das análises propriamente dita. Os resultados devem ficar gravados em um arquivo do tipo xls com o mesmo nome da sintaxe. Antes de iniciar a análise propriamente dita confira se todos os valores coletados são aceitáveis para sua análise. Se algum valor for incompatível, documente a sintaxe e exclua o caso ou o valor.

Informações:

  • Arquivo de dados: e_alcool_Epi84.xls
  • Casos: 676.
  • Variáveis: 15

Definições:

Álcool

  • Uma garrafa de cerveja contém 25 gramas de álcool.
  • Uma taça de vinho contém 10 gramas de álcool.
  • Uma dose de pinga contém 15 gramas de álcool.

Tempo

  • Uma semana = 7 dias.
  • Um mês = 30,4 dias.
  • Um ano = 365,25 dias

Hipertenso

Sistólica maior ou igual a 140 mm Hg ou diastólica maior ou igual a 90 mm Hg.

Obesidade

  • normais = IMC até 25
  • sobrepeso = IMC entre 25 e 30
  • Obeso = IMC maior que 30
Dicionário de Variáveis
Nome Descrição Conteúdo
NQT Número do questionário Número
QCER Quantidade de cerveja Garrafas
FCER Frequência de uso de cerveja 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca
QVIN Quantidade de vinho Taças
FVIN Frequência de uso de vinho 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca
QPIN Quantidade de pinga e outras bebidas Doses
FPIN Frequência de uso de pinga 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca
SEXO Sexo 1=homens, 2=mulheres
COR Cor da pele 1=brancos, 2=negros, 3=mulatos, 4=outros
PESO Peso Quilogramas
SIST Pressão sistólica Milímetros de mercúrio
DIAS Pressão diastólica Milímetros de mercúrio
IDADE Idade Anos
BEBE Uso de bebida alcoólica 1=sim, 2=não
ALTURA Altura Metros

Carregamento do Banco de Dados

# Banco carregado na Variável epi84_raw
epi84_raw <- read_excel("e_alcool_epi84.xls")
epi84 <- epi84_raw

Análise exploratória das variáveis

Número de identificação

# NQT - Número do questionário
# Amostra com 676 questionários

# Teste para avaliar se o número de identificação dos  questionários é igual ao número de linhas existentes no banco
sum(table(epi84$NQT)) == nrow(epi84)
## [1] TRUE

Não foram detectados números duplicados.

Variáveis relacionadas ao consumo de cerveja

  • A variável FCER foi convertida para um fator com os rótulos: dia, semana, mês, ano e nunca
# Tipo de frequência de Cerveja
epi84$fcer <- factor(epi84$FCER, levels = c(1:5), labels = c("dia", "semana", "mês", "ano", "nunca"))
Desc(epi84$fecr)
## Warning: Unknown or uninitialised column: 'fecr'.
## ------------------------------------------------------------------------- 
## epi84$fecr (NULL)
## 
## class is NULL, so there's nothing else to describe
# QCER - Quantidade de Cervejas (Em garrafas)
Desc(epi84$QCER)
## ------------------------------------------------------------------------- 
## epi84$QCER (numeric)
## 
##   length       n    NAs  unique     0s  mean  meanCI
##      676     676      0      16    376  1.45    1.18
##           100.0%   0.0%          55.6%          1.71
##                                                     
##      .05     .10    .25  median    .75   .90     .95
##     0.00    0.00   0.00    0.00   2.00  4.00    6.00
##                                                     
##    range      sd  vcoef     mad    IQR  skew    kurt
##    60.00    3.57   2.47    0.00   2.00  8.75  117.53
##                                                     
## lowest : 0.0 (376), 1.0 (101), 2.0 (87), 3.0 (37), 4.0 (24)
## highest: 15.0, 20.0, 24.0 (2), 30.0, 60.0

unique(epi84$QCER)
##  [1]  0  2  4 10  1  5  3  6 12 15  8  7 20 24 30 60
table(epi84$QCER, epi84$fcer)
##     
##      dia semana mês ano nunca
##   0    0      0   0   0   376
##   1    6     61  31   3     0
##   2    4     54  26   3     0
##   3    3     19  14   1     0
##   4    0     14   9   0     1
##   5    1      4   6   0     0
##   6    0      8   5   6     0
##   7    0      1   0   0     0
##   8    0      2   1   0     0
##   10   0      4   1   0     0
##   12   0      2   3   1     0
##   15   0      0   1   0     0
##   20   0      0   1   0     0
##   24   0      0   1   1     0
##   30   0      0   0   1     0
##   60   0      0   0   1     0
# Busca por inconsistências entre a quantidade e a frequência
epi84 %>% 
  filter((fcer == "nunca" & QCER != 0) | (fcer != "nunca" & QCER == 0) )
## # A tibble: 1 x 16
##     NQT  QCER  FCER  QVIN  FVIN  QPIN  FPIN  SEXO   COR  PESO  SIST  DIAS
##   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1   429     4     5     0     5     0     3     2     1    54   100    75
## # … with 4 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## #   fcer <fct>

Foi detectada uma inconsistência no questionário número 429 onde o indivíduo referia o consumo de 4 cervejas mas a frequência foi cadastrada como “nunca”. Neste mesmo indivíduo também se observa que ele refere um consumo mensal de 0 pinga (e não nunca).

Variáveis relacionadas ao consumo de Vinho

  • A variável FVIN foi convertida para um fator com os rótulos: dia, semana, mês, ano e nunca
# Tipo de frequência de vinho   1=dia, 2=semana, 3=mês, 4=ano, 5=nunca
epi84$fvin <- factor(epi84$FVIN, levels = c(1:5), labels = c("dia", "semana", "mês", "ano", "nunca"))
Desc(epi84$fvin)
## ------------------------------------------------------------------------- 
## epi84$fvin (factor)
## 
##   length      n    NAs unique levels  dupes
##      676    676      0      5      5      y
##          100.0%   0.0%                     
## 
##     level  freq   perc  cumfreq  cumperc
## 1   nunca   487  72.0%      487    72.0%
## 2     mês    72  10.7%      559    82.7%
## 3  semana    58   8.6%      617    91.3%
## 4     ano    45   6.7%      662    97.9%
## 5     dia    14   2.1%      676   100.0%

# QVIN - Quantidade de vinho (em taças)
Desc(epi84$QVIN)
## ------------------------------------------------------------------------- 
## epi84$QVIN (numeric)
## 
##   length       n    NAs  unique     0s  mean  meanCI
##      676     676      0      26    486  1.88    1.29
##           100.0%   0.0%          71.9%          2.47
##                                                     
##      .05     .10    .25  median    .75   .90     .95
##     0.00    0.00   0.00    0.00   1.00  4.00    8.00
##                                                     
##    range      sd  vcoef     mad    IQR  skew    kurt
##    90.00    7.81   4.15    0.00   1.00  8.18   76.38
##                                                     
## lowest : 0.0 (486), 1.0 (51), 2.0 (45), 3.0 (19), 4.0 (20)
## highest: 56.0, 60.0, 64.0, 80.0, 90.0 (2)

summary(epi84$QVIN)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    0.00    1.88    1.00   90.00
unique(epi84$QVIN)
##  [1]  0  8  1  3  2  4  9  6  7 15  5 14 20 10 24 16 56 48 80 36 90 12 64
## [24] 13 21 60
table(epi84$QVIN, epi84$fvin)
##     
##      dia semana mês ano nunca
##   0    0      0   0   0   486
##   1    6     18  23   3     1
##   2    4     16  18   7     0
##   3    0      8   8   3     0
##   4    1      5  11   3     0
##   5    0      4   0   2     0
##   6    0      3   0   3     0
##   7    1      1   4   2     0
##   8    0      2   2   1     0
##   9    0      0   2   1     0
##   10   0      0   2   3     0
##   12   1      1   0   1     0
##   13   0      0   0   1     0
##   14   0      0   0   1     0
##   15   1      0   0   1     0
##   16   0      0   1   1     0
##   20   0      0   1   2     0
##   21   0      0   0   1     0
##   24   0      0   0   1     0
##   36   0      0   0   1     0
##   48   0      0   0   1     0
##   56   0      0   0   1     0
##   60   0      0   0   1     0
##   64   0      0   0   1     0
##   80   0      0   0   1     0
##   90   0      0   0   2     0
# Busca por inconsistências entre a quantidade e a frequência
epi84 %>% 
  filter((fvin == "nunca" & QVIN != 0) | (fvin != "nunca" & QVIN == 0) )
## # A tibble: 1 x 17
##     NQT  QCER  FCER  QVIN  FVIN  QPIN  FPIN  SEXO   COR  PESO  SIST  DIAS
##   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1   274     1     2     1     5     2     3     2     1    64   146    80
## # … with 5 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## #   fcer <fct>, fvin <fct>

Foi detectada uma inconsistência nas respostas do indivíduo do questionário número 274, onde ele afirma o consumo de 1 taça de vinho numa frequência “nunca”.

# FPIN - Tipo de frequência do consumo de pinga: 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca
epi84$fpin <- factor(epi84$FPIN, levels = c(1:5), labels = c("dia", "semana", "mês", "ano", "nunca"))
Desc(epi84$fpin)
## ------------------------------------------------------------------------- 
## epi84$fpin (factor)
## 
##   length      n    NAs unique levels  dupes
##      676    676      0      5      5      y
##          100.0%   0.0%                     
## 
##     level  freq   perc  cumfreq  cumperc
## 1   nunca   478  70.7%      478    70.7%
## 2  semana    86  12.7%      564    83.4%
## 3     mês    57   8.4%      621    91.9%
## 4     dia    38   5.6%      659    97.5%
## 5     ano    17   2.5%      676   100.0%

# QPIN - Quantidade de pinga (em doses)
Desc(epi84$QPIN)
## ------------------------------------------------------------------------- 
## epi84$QPIN (numeric)
## 
##   length       n    NAs  unique     0s  mean  meanCI
##      676     676      0      15    480  0.97    0.75
##           100.0%   0.0%          71.0%          1.20
##                                                     
##      .05     .10    .25  median    .75   .90     .95
##     0.00    0.00   0.00    0.00   1.00  3.00    4.00
##                                                     
##    range      sd  vcoef     mad    IQR  skew    kurt
##    48.00    3.00   3.09    0.00   1.00  8.40  104.52
##                                                     
## lowest : 0.0 (480), 1.0 (75), 2.0 (50), 3.0 (22), 4.0 (16)
## highest: 12.0 (3), 15.0 (2), 17.0 (2), 30.0, 48.0

summary(epi84$QPIN)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0000  0.0000  0.0000  0.9719  1.0000 48.0000
unique(epi84$QPIN)
##  [1]  0  6  3  4  2 15  8  1  5 10 48 12 17  7 30
table(epi84$QPIN, epi84$fpin)
##     
##      dia semana mês ano nunca
##   0    0      0   2   0   478
##   1   14     30  24   7     0
##   2    7     23  19   1     0
##   3    8      7   4   3     0
##   4    2      9   5   0     0
##   5    1      2   1   0     0
##   6    0      5   0   2     0
##   7    0      1   0   1     0
##   8    1      4   1   0     0
##   10   3      1   0   1     0
##   12   1      0   1   1     0
##   15   0      2   0   0     0
##   17   1      1   0   0     0
##   30   0      0   0   1     0
##   48   0      1   0   0     0
# Busca por inconsistências entre a quantidade e a frequência
epi84 %>% 
  filter((fpin != "nunca" & QPIN == 0) | (fpin == "nunca" & QPIN != 0) )
## # A tibble: 2 x 18
##     NQT  QCER  FCER  QVIN  FVIN  QPIN  FPIN  SEXO   COR  PESO  SIST  DIAS
##   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1   316     2     2     0     5     0     3     1     1    67   110    70
## 2   429     4     5     0     5     0     3     2     1    54   100    75
## # … with 6 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## #   fcer <fct>, fvin <fct>, fpin <fct>

Foi detectada uma inconsistência de preenchimento no Questionário 316, com uma frequência de mensal de consumo de zero doses de pinga. Esta inconsistência não invalida a observação porque não motifica o fato do consumo de pinga ser zero. O questionario 429 já havia sido invalidado por causa da inconsistência no consumo de 4 cervejas com uma frequência de nunca.
A decisão de remover as observações é discricionária e aberta ao debate. Foi optado remover observações onde a quantidade foi diferente de zero e a frequência apontada como nunca e manter as observações onde a quantidade era zero e a frequência foi diferente de nunca. Nesta lógica foram removidas as observações 429 e 274 e mantida a observação 316.

epi84 <- epi84 %>% 
  filter(!NQT %in% c(429,274))

Sexo

# Conversão para variável qualitativa (criando a variável sexo)
epi84$sexo <- factor(epi84$SEXO, levels = c(1,2), labels = c("homem", "mulher"))
Desc(epi84$sexo)
## ------------------------------------------------------------------------- 
## epi84$sexo (factor - dichotomous)
## 
##   length      n    NAs unique
##      674    674      0      2
##          100.0%   0.0%       
## 
##         freq   perc  lci.95  uci.95'
## homem    259  38.4%   34.8%   42.2%
## mulher   415  61.6%   57.8%   65.2%
## 
## ' 95%-CI Wilson

Desc(epi84$SEXO)
## ------------------------------------------------------------------------- 
## epi84$SEXO (numeric)
## 
##   length       n    NAs  unique    0s   mean  meanCI
##      674     674      0       2     0   1.62    1.58
##           100.0%   0.0%          0.0%           1.65
##                                                     
##      .05     .10    .25  median   .75    .90     .95
##     1.00    1.00   1.00    2.00  2.00   2.00    2.00
##                                                     
##    range      sd  vcoef     mad   IQR   skew    kurt
##     1.00    0.49   0.30    0.00  1.00  -0.47   -1.78
##                                                     
## 
##    level  freq   perc  cumfreq  cumperc
## 1      1   259  38.4%      259    38.4%
## 2      2   415  61.6%      674   100.0%

Cor

# 1=brancos, 2=negros, 3=mulatos, 4=outros
epi84$cor <- factor(epi84$COR, levels = c(1:4), labels = c("brancos", "negros", "mulatos", "outros"))
Desc(epi84$cor)
## ------------------------------------------------------------------------- 
## epi84$cor (factor)
## 
##   length      n    NAs unique levels  dupes
##      674    674      0      4      4      y
##          100.0%   0.0%                     
## 
##      level  freq   perc  cumfreq  cumperc
## 1  brancos   483  71.7%      483    71.7%
## 2  mulatos   122  18.1%      605    89.8%
## 3   negros    67   9.9%      672    99.7%
## 4   outros     2   0.3%      674   100.0%

Desc(epi84$COR)
## ------------------------------------------------------------------------- 
## epi84$COR (numeric)
## 
##   length       n    NAs  unique    0s  mean  meanCI
##      674     674      0       4     0  1.47    1.41
##           100.0%   0.0%          0.0%          1.53
##                                                    
##      .05     .10    .25  median   .75   .90     .95
##     1.00    1.00   1.00    1.00  2.00  3.00    3.00
##                                                    
##    range      sd  vcoef     mad   IQR  skew    kurt
##     3.00    0.79   0.54    0.00  1.00  1.27   -0.09
##                                                    
## 
##    level  freq   perc  cumfreq  cumperc
## 1      1   483  71.7%      483    71.7%
## 2      2    67   9.9%      550    81.6%
## 3      3   122  18.1%      672    99.7%
## 4      4     2   0.3%      674   100.0%

Peso

Desc(epi84$PESO)
## ------------------------------------------------------------------------- 
## epi84$PESO (numeric)
## 
##   length       n    NAs  unique     0s   mean  meanCI
##      674     674      0      67      0  63.83   62.87
##           100.0%   0.0%           0.0%          64.79
##                                                      
##      .05     .10    .25  median    .75    .90     .95
##    47.00   50.00  55.00   62.00  70.00  80.70   86.35
##                                                      
##    range      sd  vcoef     mad    IQR   skew    kurt
##    90.00   12.69   0.20   11.86  15.00   0.89    1.34
##                                                      
## lowest : 36.0, 37.0, 40.0 (2), 41.0, 42.0 (7)
## highest: 106.0, 108.0, 110.0, 115.0, 126.0

Pressão Sistólica

Desc(epi84$SIST)
## ------------------------------------------------------------------------- 
## epi84$SIST (numeric)
## 
##   length       n     NAs  unique      0s    mean  meanCI
##      674     674       0      75       0  122.25  120.47
##           100.0%    0.0%            0.0%          124.03
##                                                         
##      .05     .10     .25  median     .75     .90     .95
##    96.00  100.00  108.25  118.50  130.00  150.00  170.00
##                                                         
##    range      sd   vcoef     mad     IQR    skew    kurt
##   160.00   23.50    0.19   17.05   21.75    1.65    4.01
##                                                         
## lowest : 80.0 (5), 82.0, 84.0, 88.0 (4), 90.0 (14)
## highest: 208.0, 214.0, 230.0 (2), 238.0, 240.0

Pressão Diastólica

Desc(epi84$DIAS)
## ------------------------------------------------------------------------- 
## epi84$DIAS (numeric)
## 
##   length       n    NAs  unique     0s   mean  meanCI
##      674     674      0      60      0  75.48   74.28
##           100.0%   0.0%           0.0%          76.67
##                                                      
##      .05     .10    .25  median    .75    .90     .95
##    54.00   58.00  66.00   74.00  82.00  95.00  102.00
##                                                      
##    range      sd  vcoef     mad    IQR   skew    kurt
##   124.00   15.78   0.21   11.86  16.00   0.93    2.23
##                                                      
## lowest : 20.0, 40.0 (2), 42.0, 44.0 (3), 46.0
## highest: 122.0, 126.0, 138.0 (2), 140.0 (3), 144.0

Relações entre Pressão Sistólica e Diastólica

plot(epi84$DIAS, epi84$SIST)

# Avalição da existência de Pressão de pulso negativa
epi84[epi84$SIST <= epi84$DIAS,]
## # A tibble: 1 x 20
##     NQT  QCER  FCER  QVIN  FVIN  QPIN  FPIN  SEXO   COR  PESO  SIST  DIAS
##   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1   137     1     3     1     3     0     5     2     2    73   130   140
## # … with 8 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## #   fcer <fct>, fvin <fct>, fpin <fct>, sexo <fct>, cor <fct>
# Pressão Diastólica menor 30 mmHg
epi84[epi84$DIAS <= 30,]
## # A tibble: 1 x 20
##     NQT  QCER  FCER  QVIN  FVIN  QPIN  FPIN  SEXO   COR  PESO  SIST  DIAS
##   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1   486     0     5     0     5     0     5     2     2    68   124    20
## # … with 8 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## #   fcer <fct>, fvin <fct>, fpin <fct>, sexo <fct>, cor <fct>
# Pressão de pulso
epi84$pulso <- epi84$SIST - epi84$DIAS
Desc(epi84$pulso)
## ------------------------------------------------------------------------- 
## epi84$pulso (numeric)
## 
##   length       n    NAs  unique     0s   mean  meanCI
##      674     674      0      59      0  46.77   45.69
##           100.0%   0.0%           0.0%          47.85
##                                                      
##      .05     .10    .25  median    .75    .90     .95
##    30.00   32.00  38.00   44.00  52.00  64.00   72.70
##                                                      
##    range      sd  vcoef     mad    IQR   skew    kurt
##   130.00   14.28   0.31   10.38  14.00   1.19    2.91
##                                                      
## lowest : -10.0, 16.0, 20.0 (5), 24.0 (6), 25.0 (3)
## highest: 96.0 (2), 98.0 (2), 100.0, 104.0 (2), 120.0

# Remoção da análise
epi84 <- epi84 %>% 
  filter(!NQT %in% c(137,486))

Foi analisada as relações entre a pressão sistólica e diastólica e detectado o questionário 137 onde a pressão de pulso (pressão sistólica - pressão diastólica) foi negativa. Considerando que limite de detecção do esfigmomanômetro é em torno de 40 mmHg e aparelhos eletrônicos o limite é de 30 mmHg, foi detectado o questionário 486 com uma pressão diastólica de 20. Ambas as observações foram removidas da análise.

Idade

Desc(epi84$IDADE)
## ------------------------------------------------------------------------- 
## epi84$IDADE (numeric)
## 
##   length       n    NAs  unique     0s   mean  meanCI
##      672     672      0      51      0  35.81   34.87
##           100.0%   0.0%           0.0%          36.74
##                                                      
##      .05     .10    .25  median    .75    .90     .95
##    18.00   21.00  27.00   34.00  44.00  54.00   59.00
##                                                      
##    range      sd  vcoef     mad    IQR   skew    kurt
##    50.00   12.41   0.35   11.86  17.00   0.47   -0.67
##                                                      
## lowest : 15.0 (3), 16.0 (12), 17.0 (16), 18.0 (18), 19.0 (7)
## highest: 61.0 (7), 62.0 (4), 63.0 (7), 64.0 (3), 65.0

### Bebe

# 1=sim, 2=não
# Conversão para variável categórica
epi84$bebe <- factor(epi84$BEBE, levels = c(1,2), labels = c("Sim", "Não"))

Altura

Desc(epi84$ALTURA)
## ------------------------------------------------------------------------- 
## epi84$ALTURA (numeric)
## 
##   length       n    NAs  unique    0s  mean  meanCI
##      672     672      0      50     0  1.61    1.61
##           100.0%   0.0%          0.0%          1.62
##                                                    
##      .05     .10    .25  median   .75   .90     .95
##     1.47    1.50   1.55    1.61  1.67  1.72    1.77
##                                                    
##    range      sd  vcoef     mad   IQR  skew    kurt
##     0.61    0.09   0.06    0.09  0.12  0.10    0.10
##                                                    
## lowest : 1.29, 1.34, 1.38 (2), 1.39, 1.41 (3)
## highest: 1.82 (6), 1.83 (2), 1.84 (2), 1.85, 1.9

### Interação entre peso e altura

# Teste por inconsistências entre peso e altura

epi84$imc <- epi84$PESO / epi84$ALTURA^2
Desc(epi84$imc)
## ------------------------------------------------------------------------- 
## epi84$imc (numeric)
## 
##     length         n       NAs    unique        0s      mean    meanCI
##        672       672         0       503         0  24.55320  24.21518
##               100.0%      0.0%                0.0%            24.89122
##                                                                       
##        .05       .10       .25    median       .75       .90       .95
##   18.85109  19.55556  21.47667  23.81174  26.91273  30.17182  32.88394
##                                                                       
##      range        sd     vcoef       mad       IQR      skew      kurt
##   31.71472   4.46264   0.18175   4.03268   5.43605   1.15317   2.33465
##                                                                       
## lowest : 16.35931, 16.40625, 16.88872, 16.89624, 17.00882
## highest: 40.79084, 41.00987, 43.03762, 44.0, 48.07403

epi84[epi84$imc > 40,]
## # A tibble: 5 x 23
##     NQT  QCER  FCER  QVIN  FVIN  QPIN  FPIN  SEXO   COR  PESO  SIST  DIAS
##   <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1    43     0     5     0     5     0     5     2     1    99   108    62
## 2    46     0     5     0     5     0     5     2     2    98   165   100
## 3   149     1     2     5     2     4     2     2     3    80   140    98
## 4   497     0     5     0     5     0     5     2     1    93   140    80
## 5   592     0     5     0     5     0     5     2     1    96   120    78
## # … with 11 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## #   fcer <fct>, fvin <fct>, fpin <fct>, sexo <fct>, cor <fct>,
## #   pulso <dbl>, bebe <fct>, imc <dbl>

Há 5 casos de IMC acima de 40, sendo um caso de IMC 48, ainda dentro do espectro de ocorrerência na população.

Criação de variáveis auxiliares

Foram criadas no banco as seguintes variáveis auxiliares, baseadas nas variáveis presentes no banco originalmente

  • cervejas_ano: Quantidades de cervejas consumidas em 1 ano,
  • vinhos_ano: Quantidade de taças de vinho consumidas em 1 ano.
  • pingas_ano: Quantidade de doses de pinga consumidas em 1 ano.
  • g_alcool_ano: Quantidade de gramas de álcool consumidas em 1 ano.
  • ingestao_media_diaria_alcool: Quantidade média de álcool ingerida diariamente (em g).
  • ingestao_media_diaria_alcool_ordinal: Variável anterior categorizada em faixas 0 / 0-10 / 10-25 / 25 ou +
# Uma garrafa de cerveja contém 25 gramas de álcool
# Uma taça de vinho contém 10 gramas de álcool
# Uma dose de pinga contém 15 gramas de álcool


epi84 <- epi84 %>% 
  mutate(cervejas_ano = 
           case_when(
             FCER == 1 ~ QCER,
             FCER == 2 ~ QCER/7,
             FCER == 3 ~ QCER/30.4,
             FCER == 4 ~ QCER/365.25,
             TRUE ~ 0
           ) *365.25,
         vinhos_ano = 
           case_when(
             FVIN == 1 ~ QVIN,
             FVIN == 2 ~ QVIN/7,
             FVIN == 3 ~ QVIN/30.4,
             FVIN == 4 ~ QVIN/365.25,
             TRUE ~ 0
           ) * 365.25,
         pingas_ano = 
           case_when(
             FPIN == 1 ~ QPIN,
             FPIN == 2 ~ QPIN/7,
             FPIN == 3 ~ QPIN/30.4,
             FPIN == 4 ~ QPIN/365.25,
             TRUE ~ 0
           ) * 365.25,
         g_alcool_ano = (cervejas_ano*25) + (vinhos_ano*10) + (pingas_ano*15),
         ingestao_media_diaria_alcool = g_alcool_ano/365.4,
         ingestao_media_diaria_alcool_ordinal = cut(ingestao_media_diaria_alcool, 
                                                    breaks = c(0,1*10^-30,10,25, Inf),
                                                    include.lowest = TRUE),
         hipertenso = as.factor(if_else(SIST >=140 | DIAS >=90, "Hipertenso", "Não hipertenso")),
         IMC = PESO / ALTURA^2,
         obesidade = cut(IMC, c(-Inf, 25, 30, +Inf), labels = c("Normais", "Sobrepeso", "Obeso")
      )
  )

epi84$g_alcool_ano
##   [1]      0.0000    600.7401      0.0000  14088.2143      0.0000
##   [6]   3149.5947      0.0000  16175.3571      0.0000   1482.9699
##  [11]      0.0000      0.0000      0.0000      0.0000      0.0000
##  [16]   2969.3727  21915.0000      0.0000  20128.7500      0.0000
##  [21]      0.0000      0.0000   2943.6266      0.0000      0.0000
##  [26]      0.0000      0.0000      0.0000      0.0000   1304.4643
##  [31]   6261.4286   1304.4643   1565.3571      0.0000   2608.9286
##  [36]      0.0000   4174.2857   3149.5947      0.0000      0.0000
##  [41]   1304.4643      0.0000      0.0000    420.5181   7305.0000
##  [46]      0.0000      0.0000     90.0000      0.0000  27393.7500
##  [51]  29480.8929     25.0000      0.0000      0.0000   5478.7500
##  [56]      0.0000      0.0000   5478.7500  15090.5921   1349.4643
##  [61]      0.0000   4435.1786  12639.5724   8408.5714      0.0000
##  [66]      0.0000    300.3701      0.0000      0.0000      0.0000
##  [71]   2608.9286   2608.9286      0.0000      0.0000   8348.5714
##  [76]      0.0000      0.0000   3431.0844   3702.5000      0.0000
##  [81]  23799.6076    782.6786      0.0000      0.0000  10174.8214
##  [86]      0.0000      0.0000      0.0000  21915.0000      0.0000
##  [91]    841.0362    600.7401   3652.5000      0.0000      0.0000
##  [96]      0.0000   1304.4643      0.0000      0.0000      0.0000
## [101]   9913.9286   2584.8990      0.0000   3604.4408      0.0000
## [106]   5578.3012      0.0000      0.0000      0.0000      0.0000
## [111]      0.0000   7826.7857      0.0000      0.0000      0.0000
## [116]      0.0000   5779.1201   2608.9286      0.0000      0.0000
## [121]      0.0000   4174.2857   1304.4643      0.0000      0.0000
## [126]      0.0000      0.0000      0.0000      0.0000 109575.0000
## [131]      0.0000   1565.3571  37568.5714   6261.4286   8648.9415
## [136]      0.0000   1304.4643      0.0000      0.0000    841.0362
## [141]      0.0000    300.3701      0.0000      0.0000      0.0000
## [146]      0.0000      0.0000   7044.1071      0.0000      0.0000
## [151]   2643.2566      0.0000   3130.7143      0.0000  54787.5000
## [156]      0.0000    600.7401  17036.9901   5478.7500   4956.9643
## [161]    300.3701      0.0000      0.0000      0.0000   2608.9286
## [166]      0.0000  15653.5714      0.0000    720.8882      0.0000
## [171]   6522.3214   7826.7857      0.0000   5217.8571      0.0000
## [176]      0.0000      0.0000   2087.1429   1141.4062      0.0000
## [181]      0.0000      0.0000   2608.9286   8842.8947      0.0000
## [186]      0.0000      0.0000   2608.9286   1141.4062   1785.0564
## [191]      0.0000   1441.7763    420.5181      0.0000      0.0000
## [196]      0.0000   3130.7143      0.0000  16436.2500      0.0000
## [201]      0.0000      0.0000      0.0000      0.0000      0.0000
## [206]  20610.5357      0.0000   7164.2552      0.0000      0.0000
## [211]   7102.4648      0.0000  34698.7500      0.0000   1216.4803
## [216]   1141.4062   1221.4803   6783.2143      0.0000      0.0000
## [221]   3913.3929    640.7401  15210.7401   3913.3929      0.0000
## [226]   1664.9084   1965.2784      0.0000      0.0000   2137.1429
## [231]    390.2961      0.0000      0.0000      0.0000  10004.3010
## [236]   2969.3727  22134.6992   4048.5409      0.0000   4654.8778
## [241]   6261.4286      0.0000   1201.4803      0.0000    440.3701
## [246]      0.0000      0.0000      0.0000   1454.4643   4543.9850
## [251]      0.0000      0.0000      0.0000   3130.7143      0.0000
## [256]   6882.7655  23741.2500   1304.4643      0.0000   2608.9286
## [261]      0.0000      0.0000      0.0000      0.0000   6000.5357
## [266]  11218.3929      0.0000   4205.1809   6783.2143   3230.2655
## [271]   3913.3929  74876.2500      0.0000      0.0000    822.1558
## [276]      0.0000      0.0000   1321.6283      0.0000      0.0000
## [281]      0.0000      0.0000      0.0000      0.0000   1682.0724
## [286]   2466.4673      0.0000      0.0000    315.1480  13666.4286
## [291]      0.0000  21393.2143   1826.2500      0.0000      0.0000
## [296]   1664.9084   1020.9622      0.0000   2849.2246      0.0000
## [301]      0.0000      0.0000  10435.7143      0.0000   1664.9084
## [306]      0.0000   1903.4880      0.0000      0.0000   1802.2204
## [311]      0.0000   8705.5827      0.0000   2608.9286    300.3701
## [316]      0.0000  12261.9643   8870.3571  12261.9643      0.0000
## [321]  27713.0005   5777.8571      0.0000   4654.2857   3130.7143
## [326]      0.0000   2608.9286      0.0000   1304.4643      0.0000
## [331]  37053.6513      0.0000      0.0000    671.7857     75.0000
## [336]    590.3701   8482.4507   1361.4803   2887.1429      0.0000
## [341]      0.0000   6522.3214      0.0000    807.6786   3913.3929
## [346]  31046.2500    615.7401    420.5181    300.3701   3511.7552
## [351]   2162.6645  20088.7500    790.9622     35.0000    600.7401
## [356]   8774.2387   2042.5164    365.3701   5597.1816    350.3701
## [361]   1081.3322    600.7401   5798.0005   1604.8344   1824.5336
## [366]    320.3701   3173.8487   3929.8860    900.0000   4435.1786
## [371]   1424.6123      0.0000   2668.9286   2968.9286   4813.3929
## [376]   3039.3727      0.0000    250.0000      0.0000    330.0000
## [381]   1644.3116   3913.3929    300.3701   2207.1429   3367.5775
## [386]   2608.9286     65.0000   5317.4084   4814.2857      0.0000
## [391]      0.0000    901.1102    901.1102   7926.3369   1103.0486
## [396]    480.5921      0.0000    961.1842   6983.2143      0.0000
## [401]    490.5921   2265.6485      0.0000      0.0000      0.0000
## [406]   1304.4643   1484.6863      0.0000      0.0000   8417.8336
## [411]   4775.0258   3391.6071      0.0000      0.0000  24942.7303
## [416]      0.0000  12821.5108      0.0000      0.0000      0.0000
## [421]      0.0000    480.5921      0.0000      0.0000      0.0000
## [426]   2608.9286   2869.8214   1261.5543      0.0000   7565.8929
## [431]    600.7401      0.0000  17479.8214   2006.4720   9131.2500
## [436]      0.0000      0.0000   1304.4643      0.0000      0.0000
## [441]    901.1102   4153.6889      0.0000      0.0000      0.0000
## [446]    480.5921    822.1558   2608.9286  11740.1786    480.5921
## [451]   6261.4286   4174.2857   3913.3929      0.0000      0.0000
## [456]   2608.9286    180.2220      0.0000    780.9622      0.0000
## [461]      0.0000      0.0000    450.5181      0.0000  12522.8571
## [466]   2909.2986    901.1102   1321.6283      0.0000      0.0000
## [471]      0.0000  45134.4643   4174.2857      0.0000      0.0000
## [476]      0.0000      0.0000      0.0000      0.0000      0.0000
## [481]   1383.4187  21915.0000      0.0000   6261.4286   7826.7857
## [486]      0.0000      0.0000      0.0000   8187.2298  19306.0714
## [491]      0.0000      0.0000      0.0000    300.3701      0.0000
## [496]    600.7401      0.0000      0.0000      0.0000   1565.3571
## [501]  65745.0000      0.0000      0.0000      0.0000      0.0000
## [506]      0.0000  10154.2246      0.0000    420.5181   1544.7603
## [511]      0.0000  27513.8980      0.0000      0.0000   3130.7143
## [516]      0.0000  20610.5357      0.0000      0.0000    300.3701
## [521]   5458.1532   9392.1429   5137.1863      0.0000   5458.1532
## [526]   2608.9286   1304.4643   3913.3929     60.0000      0.0000
## [531]    780.9622      0.0000      0.0000      0.0000   4204.2857
## [536]   4174.2857      0.0000   3039.3727      0.0000      0.0000
## [541]    120.1480   1111.3322      0.0000      0.0000   1424.6123
## [546]      0.0000      0.0000      0.0000      0.0000      0.0000
## [551]   2608.9286   6261.4286   2608.9286   7926.7857      0.0000
## [556]    360.4441   3810.4088      0.0000      0.0000      0.0000
## [561]      0.0000      0.0000      0.0000      0.0000      0.0000
## [566]      0.0000      0.0000      0.0000      0.0000      0.0000
## [571]    521.7857   3391.6071   2087.1429      0.0000      0.0000
## [576]      0.0000   2608.9286   2217.1429      0.0000   1544.7603
## [581]      0.0000      0.0000      0.0000   3329.8167   2744.0766
## [586]      0.0000      0.0000      0.0000      0.0000   9251.3980
## [591]      0.0000      0.0000      0.0000  44010.2220   1826.2500
## [596]      0.0000      0.0000   2618.9286      0.0000    961.1842
## [601]      0.0000   2348.0357  18262.5000      0.0000   4956.9643
## [606]      0.0000      0.0000      0.0000      0.0000    300.3701
## [611]   2087.1429   1742.1464   2686.3322      0.0000   2526.5414
## [616]   6438.2178   4153.6889      0.0000   6980.6003      0.0000
## [621]      0.0000      0.0000      0.0000      0.0000      0.0000
## [626]   1565.3571      0.0000      0.0000   1743.8628      0.0000
## [631]      0.0000      0.0000    600.7401      0.0000      0.0000
## [636]      0.0000      0.0000    300.3701   9131.2500      0.0000
## [641]      0.0000  30263.5714  67832.1429   8087.6786   3604.4408
## [646]   2608.9286  93138.7500      0.0000      0.0000      0.0000
## [651]      0.0000   2072.2944    630.7401      0.0000      0.0000
## [656]      0.0000   1304.4643      0.0000   7905.7401      0.0000
## [661]      0.0000      0.0000      0.0000      0.0000    570.5181
## [666]   1082.6786   1650.0000      0.0000      0.0000   7866.7857
## [671]      0.0000    600.7401
Desc(epi84$ingestao_media_diaria_alcool)
## ------------------------------------------------------------------------- 
## epi84$ingestao_media_diaria_alcool (numeric)
## 
##       length          n       NAs    unique        0s       mean
##          672        672         0       227       341   9.110059
##                  100.0%      0.0%               50.7%           
##                                                                 
##          .05        .10       .25    median       .75        .90
##     0.000000   0.000000  0.000000  0.000000  7.251436  21.693325
##                                                                 
##        range         sd     vcoef       mad       IQR       skew
##   299.876847  25.469061  2.795708  0.000000  7.251436   6.255447
##                                                                 
##      meanCI
##    7.180934
##   11.039184
##            
##         .95
##   44.588831
##            
##        kurt
##   50.996281
##            
## lowest : 0.0 (341), 0.068418, 0.095785, 0.164204, 0.177887
## highest: 179.926108, 185.638048, 204.915846, 254.89532, 299.876847
summary(epi84$ingestao_media_diaria_alcool)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   0.000   0.000   9.110   7.251 299.877
Desc(epi84$ingestao_media_diaria_alcool)  
## ------------------------------------------------------------------------- 
## epi84$ingestao_media_diaria_alcool (numeric)
## 
##       length          n       NAs    unique        0s       mean
##          672        672         0       227       341   9.110059
##                  100.0%      0.0%               50.7%           
##                                                                 
##          .05        .10       .25    median       .75        .90
##     0.000000   0.000000  0.000000  0.000000  7.251436  21.693325
##                                                                 
##        range         sd     vcoef       mad       IQR       skew
##   299.876847  25.469061  2.795708  0.000000  7.251436   6.255447
##                                                                 
##      meanCI
##    7.180934
##   11.039184
##            
##         .95
##   44.588831
##            
##        kurt
##   50.996281
##            
## lowest : 0.0 (341), 0.068418, 0.095785, 0.164204, 0.177887
## highest: 179.926108, 185.638048, 204.915846, 254.89532, 299.876847

hist(epi84$ingestao_media_diaria_alcool)

Interção entre consumo de álcool e bebe

table(epi84$bebe, if_else(epi84$g_alcool_ano == 0, "0", "Maior que 0"))
##      
##         0 Maior que 0
##   Sim   0         331
##   Não 341           0

Associação entre a Hipertensão Arterial e 4 níveis de consumo de álcool

Escolha do teste

  • Varíavel Desfecho: hipertenso, qualitativa dicotômica (“Hipertenso” ou “Não hipertenso”)
  • Amostras: 4 amostras independentes de acordo com a ingestao_media_diaria_alcool_ordinal, que é uma variável qualitativa ordinal (0, >0 a 10, 10 a 25 e >25 )
  • Teste sugerido: Qui-quadrado de homogeneidade

Avaliação das suposições do teste

Tabela de contingência e Teste Qui-Quadrado de homogeneidade

CrossTable(y = epi84$hipertenso, x = epi84$ingestao_media_diaria_alcool_ordinal, expected = TRUE, digits = 2)
## 
##  
##    Cell Contents
## |-------------------------|
## |                       N |
## |              Expected N |
## | Chi-square contribution |
## |           N / Row Total |
## |           N / Col Total |
## |         N / Table Total |
## |-------------------------|
## 
##  
## Total Observations in Table:  672 
## 
##  
##                                            | epi84$hipertenso 
## epi84$ingestao_media_diaria_alcool_ordinal |     Hipertenso | Não hipertenso |      Row Total | 
## -------------------------------------------|----------------|----------------|----------------|
##                                  [0,1e-30] |             69 |            272 |            341 | 
##                                            |          75.10 |         265.90 |                | 
##                                            |           0.50 |           0.14 |                | 
##                                            |           0.20 |           0.80 |           0.51 | 
##                                            |           0.47 |           0.52 |                | 
##                                            |           0.10 |           0.40 |                | 
## -------------------------------------------|----------------|----------------|----------------|
##                                 (1e-30,10] |             34 |            160 |            194 | 
##                                            |          42.73 |         151.27 |                | 
##                                            |           1.78 |           0.50 |                | 
##                                            |           0.18 |           0.82 |           0.29 | 
##                                            |           0.23 |           0.31 |                | 
##                                            |           0.05 |           0.24 |                | 
## -------------------------------------------|----------------|----------------|----------------|
##                                    (10,25] |             23 |             60 |             83 | 
##                                            |          18.28 |          64.72 |                | 
##                                            |           1.22 |           0.34 |                | 
##                                            |           0.28 |           0.72 |           0.12 | 
##                                            |           0.16 |           0.11 |                | 
##                                            |           0.03 |           0.09 |                | 
## -------------------------------------------|----------------|----------------|----------------|
##                                   (25,Inf] |             22 |             32 |             54 | 
##                                            |          11.89 |          42.11 |                | 
##                                            |           8.59 |           2.43 |                | 
##                                            |           0.41 |           0.59 |           0.08 | 
##                                            |           0.15 |           0.06 |                | 
##                                            |           0.03 |           0.05 |                | 
## -------------------------------------------|----------------|----------------|----------------|
##                               Column Total |            148 |            524 |            672 | 
##                                            |           0.22 |           0.78 |                | 
## -------------------------------------------|----------------|----------------|----------------|
## 
##  
## Statistics for All Table Factors
## 
## 
## Pearson's Chi-squared test 
## ------------------------------------------------------------
## Chi^2 =  15.49996     d.f. =  3     p =  0.001435614 
## 
## 
## 

O teste de qui-quadrado de homogeneidade teve um p-valor > 0,001 rejeitando a hipótese nula e suportanto a hipótese de associação entre as variáveis hipertensão e

Associação entre pressão arterial, consumo de álcool e obesidade

Como se trata do cruzamento entre 3 variáveis categóricas foi criada uma tabela de contingência tridimensional e aplicado o teste de Cochran-Mantel-Haenszel, que foi significativo, rejeitando a hipótese nula e suportando a associação entre as 3 variáveis.

xtabs(~epi84$hipertenso + epi84$ingestao_media_diaria_alcool_ordinal + epi84$obesidade)
## , , epi84$obesidade = Normais
## 
##                 epi84$ingestao_media_diaria_alcool_ordinal
## epi84$hipertenso [0,1e-30] (1e-30,10] (10,25] (25,Inf]
##   Hipertenso            21         14       9       13
##   Não hipertenso       170        109      45       20
## 
## , , epi84$obesidade = Sobrepeso
## 
##                 epi84$ingestao_media_diaria_alcool_ordinal
## epi84$hipertenso [0,1e-30] (1e-30,10] (10,25] (25,Inf]
##   Hipertenso            25         13       8        9
##   Não hipertenso        76         42      15       10
## 
## , , epi84$obesidade = Obeso
## 
##                 epi84$ingestao_media_diaria_alcool_ordinal
## epi84$hipertenso [0,1e-30] (1e-30,10] (10,25] (25,Inf]
##   Hipertenso            23          7       6        0
##   Não hipertenso        26          9       0        2
mantelhaen.test(xtabs(~epi84$hipertenso + epi84$ingestao_media_diaria_alcool_ordinal + epi84$obesidade))
## 
##  Cochran-Mantel-Haenszel test
## 
## data:  xtabs(~epi84$hipertenso + epi84$ingestao_media_diaria_alcool_ordinal +     epi84$obesidade)
## Cochran-Mantel-Haenszel M^2 = 20.972, df = 3, p-value = 0.0001067