knitr::opts_chunk$set(echo = TRUE)
library(tidyverse)
library(DescTools)
library(lubridate)
library(readxl)
library(kableExtra)
library(gmodels)
options(scipen = 9999)
Alguns autores descrevem a existência de uma associação entre uso de álcool e hipertensão arterial. Utilizando o banco de dados, teste essa associação com pontos de corte para ingestão média diária de álcool em zero, 10 e 25 gramas. Teste como esta associação se comporta entre as pessoas magras e eutróficas, com sobrepeso e obesas.
Crie um único arquivo de sintaxe para o desenvolvimento das variáveis derivadas e das análises propriamente dita. Os resultados devem ficar gravados em um arquivo do tipo xls com o mesmo nome da sintaxe. Antes de iniciar a análise propriamente dita confira se todos os valores coletados são aceitáveis para sua análise. Se algum valor for incompatível, documente a sintaxe e exclua o caso ou o valor.
Sistólica maior ou igual a 140 mm Hg ou diastólica maior ou igual a 90 mm Hg.
| Nome | Descrição | Conteúdo |
|---|---|---|
| NQT | Número do questionário | Número |
| QCER | Quantidade de cerveja | Garrafas |
| FCER | Frequência de uso de cerveja | 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca |
| QVIN | Quantidade de vinho | Taças |
| FVIN | Frequência de uso de vinho | 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca |
| QPIN | Quantidade de pinga e outras bebidas | Doses |
| FPIN | Frequência de uso de pinga | 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca |
| SEXO | Sexo | 1=homens, 2=mulheres |
| COR | Cor da pele | 1=brancos, 2=negros, 3=mulatos, 4=outros |
| PESO | Peso | Quilogramas |
| SIST | Pressão sistólica | Milímetros de mercúrio |
| DIAS | Pressão diastólica | Milímetros de mercúrio |
| IDADE | Idade | Anos |
| BEBE | Uso de bebida alcoólica | 1=sim, 2=não |
| ALTURA | Altura | Metros |
# Banco carregado na Variável epi84_raw
epi84_raw <- read_excel("e_alcool_epi84.xls")
epi84 <- epi84_raw
# NQT - Número do questionário
# Amostra com 676 questionários
# Teste para avaliar se o número de identificação dos questionários é igual ao número de linhas existentes no banco
sum(table(epi84$NQT)) == nrow(epi84)
## [1] TRUE
Não foram detectados números duplicados.
# Tipo de frequência de Cerveja
epi84$fcer <- factor(epi84$FCER, levels = c(1:5), labels = c("dia", "semana", "mês", "ano", "nunca"))
Desc(epi84$fecr)
## Warning: Unknown or uninitialised column: 'fecr'.
## -------------------------------------------------------------------------
## epi84$fecr (NULL)
##
## class is NULL, so there's nothing else to describe
# QCER - Quantidade de Cervejas (Em garrafas)
Desc(epi84$QCER)
## -------------------------------------------------------------------------
## epi84$QCER (numeric)
##
## length n NAs unique 0s mean meanCI
## 676 676 0 16 376 1.45 1.18
## 100.0% 0.0% 55.6% 1.71
##
## .05 .10 .25 median .75 .90 .95
## 0.00 0.00 0.00 0.00 2.00 4.00 6.00
##
## range sd vcoef mad IQR skew kurt
## 60.00 3.57 2.47 0.00 2.00 8.75 117.53
##
## lowest : 0.0 (376), 1.0 (101), 2.0 (87), 3.0 (37), 4.0 (24)
## highest: 15.0, 20.0, 24.0 (2), 30.0, 60.0
unique(epi84$QCER)
## [1] 0 2 4 10 1 5 3 6 12 15 8 7 20 24 30 60
table(epi84$QCER, epi84$fcer)
##
## dia semana mês ano nunca
## 0 0 0 0 0 376
## 1 6 61 31 3 0
## 2 4 54 26 3 0
## 3 3 19 14 1 0
## 4 0 14 9 0 1
## 5 1 4 6 0 0
## 6 0 8 5 6 0
## 7 0 1 0 0 0
## 8 0 2 1 0 0
## 10 0 4 1 0 0
## 12 0 2 3 1 0
## 15 0 0 1 0 0
## 20 0 0 1 0 0
## 24 0 0 1 1 0
## 30 0 0 0 1 0
## 60 0 0 0 1 0
# Busca por inconsistências entre a quantidade e a frequência
epi84 %>%
filter((fcer == "nunca" & QCER != 0) | (fcer != "nunca" & QCER == 0) )
## # A tibble: 1 x 16
## NQT QCER FCER QVIN FVIN QPIN FPIN SEXO COR PESO SIST DIAS
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 429 4 5 0 5 0 3 2 1 54 100 75
## # … with 4 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## # fcer <fct>
Foi detectada uma inconsistência no questionário número 429 onde o indivíduo referia o consumo de 4 cervejas mas a frequência foi cadastrada como “nunca”. Neste mesmo indivíduo também se observa que ele refere um consumo mensal de 0 pinga (e não nunca).
# Tipo de frequência de vinho 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca
epi84$fvin <- factor(epi84$FVIN, levels = c(1:5), labels = c("dia", "semana", "mês", "ano", "nunca"))
Desc(epi84$fvin)
## -------------------------------------------------------------------------
## epi84$fvin (factor)
##
## length n NAs unique levels dupes
## 676 676 0 5 5 y
## 100.0% 0.0%
##
## level freq perc cumfreq cumperc
## 1 nunca 487 72.0% 487 72.0%
## 2 mês 72 10.7% 559 82.7%
## 3 semana 58 8.6% 617 91.3%
## 4 ano 45 6.7% 662 97.9%
## 5 dia 14 2.1% 676 100.0%
# QVIN - Quantidade de vinho (em taças)
Desc(epi84$QVIN)
## -------------------------------------------------------------------------
## epi84$QVIN (numeric)
##
## length n NAs unique 0s mean meanCI
## 676 676 0 26 486 1.88 1.29
## 100.0% 0.0% 71.9% 2.47
##
## .05 .10 .25 median .75 .90 .95
## 0.00 0.00 0.00 0.00 1.00 4.00 8.00
##
## range sd vcoef mad IQR skew kurt
## 90.00 7.81 4.15 0.00 1.00 8.18 76.38
##
## lowest : 0.0 (486), 1.0 (51), 2.0 (45), 3.0 (19), 4.0 (20)
## highest: 56.0, 60.0, 64.0, 80.0, 90.0 (2)
summary(epi84$QVIN)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 0.00 1.88 1.00 90.00
unique(epi84$QVIN)
## [1] 0 8 1 3 2 4 9 6 7 15 5 14 20 10 24 16 56 48 80 36 90 12 64
## [24] 13 21 60
table(epi84$QVIN, epi84$fvin)
##
## dia semana mês ano nunca
## 0 0 0 0 0 486
## 1 6 18 23 3 1
## 2 4 16 18 7 0
## 3 0 8 8 3 0
## 4 1 5 11 3 0
## 5 0 4 0 2 0
## 6 0 3 0 3 0
## 7 1 1 4 2 0
## 8 0 2 2 1 0
## 9 0 0 2 1 0
## 10 0 0 2 3 0
## 12 1 1 0 1 0
## 13 0 0 0 1 0
## 14 0 0 0 1 0
## 15 1 0 0 1 0
## 16 0 0 1 1 0
## 20 0 0 1 2 0
## 21 0 0 0 1 0
## 24 0 0 0 1 0
## 36 0 0 0 1 0
## 48 0 0 0 1 0
## 56 0 0 0 1 0
## 60 0 0 0 1 0
## 64 0 0 0 1 0
## 80 0 0 0 1 0
## 90 0 0 0 2 0
# Busca por inconsistências entre a quantidade e a frequência
epi84 %>%
filter((fvin == "nunca" & QVIN != 0) | (fvin != "nunca" & QVIN == 0) )
## # A tibble: 1 x 17
## NQT QCER FCER QVIN FVIN QPIN FPIN SEXO COR PESO SIST DIAS
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 274 1 2 1 5 2 3 2 1 64 146 80
## # … with 5 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## # fcer <fct>, fvin <fct>
Foi detectada uma inconsistência nas respostas do indivíduo do questionário número 274, onde ele afirma o consumo de 1 taça de vinho numa frequência “nunca”.
# FPIN - Tipo de frequência do consumo de pinga: 1=dia, 2=semana, 3=mês, 4=ano, 5=nunca
epi84$fpin <- factor(epi84$FPIN, levels = c(1:5), labels = c("dia", "semana", "mês", "ano", "nunca"))
Desc(epi84$fpin)
## -------------------------------------------------------------------------
## epi84$fpin (factor)
##
## length n NAs unique levels dupes
## 676 676 0 5 5 y
## 100.0% 0.0%
##
## level freq perc cumfreq cumperc
## 1 nunca 478 70.7% 478 70.7%
## 2 semana 86 12.7% 564 83.4%
## 3 mês 57 8.4% 621 91.9%
## 4 dia 38 5.6% 659 97.5%
## 5 ano 17 2.5% 676 100.0%
# QPIN - Quantidade de pinga (em doses)
Desc(epi84$QPIN)
## -------------------------------------------------------------------------
## epi84$QPIN (numeric)
##
## length n NAs unique 0s mean meanCI
## 676 676 0 15 480 0.97 0.75
## 100.0% 0.0% 71.0% 1.20
##
## .05 .10 .25 median .75 .90 .95
## 0.00 0.00 0.00 0.00 1.00 3.00 4.00
##
## range sd vcoef mad IQR skew kurt
## 48.00 3.00 3.09 0.00 1.00 8.40 104.52
##
## lowest : 0.0 (480), 1.0 (75), 2.0 (50), 3.0 (22), 4.0 (16)
## highest: 12.0 (3), 15.0 (2), 17.0 (2), 30.0, 48.0
summary(epi84$QPIN)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0000 0.0000 0.0000 0.9719 1.0000 48.0000
unique(epi84$QPIN)
## [1] 0 6 3 4 2 15 8 1 5 10 48 12 17 7 30
table(epi84$QPIN, epi84$fpin)
##
## dia semana mês ano nunca
## 0 0 0 2 0 478
## 1 14 30 24 7 0
## 2 7 23 19 1 0
## 3 8 7 4 3 0
## 4 2 9 5 0 0
## 5 1 2 1 0 0
## 6 0 5 0 2 0
## 7 0 1 0 1 0
## 8 1 4 1 0 0
## 10 3 1 0 1 0
## 12 1 0 1 1 0
## 15 0 2 0 0 0
## 17 1 1 0 0 0
## 30 0 0 0 1 0
## 48 0 1 0 0 0
# Busca por inconsistências entre a quantidade e a frequência
epi84 %>%
filter((fpin != "nunca" & QPIN == 0) | (fpin == "nunca" & QPIN != 0) )
## # A tibble: 2 x 18
## NQT QCER FCER QVIN FVIN QPIN FPIN SEXO COR PESO SIST DIAS
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 316 2 2 0 5 0 3 1 1 67 110 70
## 2 429 4 5 0 5 0 3 2 1 54 100 75
## # … with 6 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## # fcer <fct>, fvin <fct>, fpin <fct>
Foi detectada uma inconsistência de preenchimento no Questionário 316, com uma frequência de mensal de consumo de zero doses de pinga. Esta inconsistência não invalida a observação porque não motifica o fato do consumo de pinga ser zero. O questionario 429 já havia sido invalidado por causa da inconsistência no consumo de 4 cervejas com uma frequência de nunca.
A decisão de remover as observações é discricionária e aberta ao debate. Foi optado remover observações onde a quantidade foi diferente de zero e a frequência apontada como nunca e manter as observações onde a quantidade era zero e a frequência foi diferente de nunca. Nesta lógica foram removidas as observações 429 e 274 e mantida a observação 316.
epi84 <- epi84 %>%
filter(!NQT %in% c(429,274))
# Conversão para variável qualitativa (criando a variável sexo)
epi84$sexo <- factor(epi84$SEXO, levels = c(1,2), labels = c("homem", "mulher"))
Desc(epi84$sexo)
## -------------------------------------------------------------------------
## epi84$sexo (factor - dichotomous)
##
## length n NAs unique
## 674 674 0 2
## 100.0% 0.0%
##
## freq perc lci.95 uci.95'
## homem 259 38.4% 34.8% 42.2%
## mulher 415 61.6% 57.8% 65.2%
##
## ' 95%-CI Wilson
Desc(epi84$SEXO)
## -------------------------------------------------------------------------
## epi84$SEXO (numeric)
##
## length n NAs unique 0s mean meanCI
## 674 674 0 2 0 1.62 1.58
## 100.0% 0.0% 0.0% 1.65
##
## .05 .10 .25 median .75 .90 .95
## 1.00 1.00 1.00 2.00 2.00 2.00 2.00
##
## range sd vcoef mad IQR skew kurt
## 1.00 0.49 0.30 0.00 1.00 -0.47 -1.78
##
##
## level freq perc cumfreq cumperc
## 1 1 259 38.4% 259 38.4%
## 2 2 415 61.6% 674 100.0%
# 1=brancos, 2=negros, 3=mulatos, 4=outros
epi84$cor <- factor(epi84$COR, levels = c(1:4), labels = c("brancos", "negros", "mulatos", "outros"))
Desc(epi84$cor)
## -------------------------------------------------------------------------
## epi84$cor (factor)
##
## length n NAs unique levels dupes
## 674 674 0 4 4 y
## 100.0% 0.0%
##
## level freq perc cumfreq cumperc
## 1 brancos 483 71.7% 483 71.7%
## 2 mulatos 122 18.1% 605 89.8%
## 3 negros 67 9.9% 672 99.7%
## 4 outros 2 0.3% 674 100.0%
Desc(epi84$COR)
## -------------------------------------------------------------------------
## epi84$COR (numeric)
##
## length n NAs unique 0s mean meanCI
## 674 674 0 4 0 1.47 1.41
## 100.0% 0.0% 0.0% 1.53
##
## .05 .10 .25 median .75 .90 .95
## 1.00 1.00 1.00 1.00 2.00 3.00 3.00
##
## range sd vcoef mad IQR skew kurt
## 3.00 0.79 0.54 0.00 1.00 1.27 -0.09
##
##
## level freq perc cumfreq cumperc
## 1 1 483 71.7% 483 71.7%
## 2 2 67 9.9% 550 81.6%
## 3 3 122 18.1% 672 99.7%
## 4 4 2 0.3% 674 100.0%
Desc(epi84$PESO)
## -------------------------------------------------------------------------
## epi84$PESO (numeric)
##
## length n NAs unique 0s mean meanCI
## 674 674 0 67 0 63.83 62.87
## 100.0% 0.0% 0.0% 64.79
##
## .05 .10 .25 median .75 .90 .95
## 47.00 50.00 55.00 62.00 70.00 80.70 86.35
##
## range sd vcoef mad IQR skew kurt
## 90.00 12.69 0.20 11.86 15.00 0.89 1.34
##
## lowest : 36.0, 37.0, 40.0 (2), 41.0, 42.0 (7)
## highest: 106.0, 108.0, 110.0, 115.0, 126.0
Desc(epi84$SIST)
## -------------------------------------------------------------------------
## epi84$SIST (numeric)
##
## length n NAs unique 0s mean meanCI
## 674 674 0 75 0 122.25 120.47
## 100.0% 0.0% 0.0% 124.03
##
## .05 .10 .25 median .75 .90 .95
## 96.00 100.00 108.25 118.50 130.00 150.00 170.00
##
## range sd vcoef mad IQR skew kurt
## 160.00 23.50 0.19 17.05 21.75 1.65 4.01
##
## lowest : 80.0 (5), 82.0, 84.0, 88.0 (4), 90.0 (14)
## highest: 208.0, 214.0, 230.0 (2), 238.0, 240.0
Desc(epi84$DIAS)
## -------------------------------------------------------------------------
## epi84$DIAS (numeric)
##
## length n NAs unique 0s mean meanCI
## 674 674 0 60 0 75.48 74.28
## 100.0% 0.0% 0.0% 76.67
##
## .05 .10 .25 median .75 .90 .95
## 54.00 58.00 66.00 74.00 82.00 95.00 102.00
##
## range sd vcoef mad IQR skew kurt
## 124.00 15.78 0.21 11.86 16.00 0.93 2.23
##
## lowest : 20.0, 40.0 (2), 42.0, 44.0 (3), 46.0
## highest: 122.0, 126.0, 138.0 (2), 140.0 (3), 144.0
plot(epi84$DIAS, epi84$SIST)
# Avalição da existência de Pressão de pulso negativa
epi84[epi84$SIST <= epi84$DIAS,]
## # A tibble: 1 x 20
## NQT QCER FCER QVIN FVIN QPIN FPIN SEXO COR PESO SIST DIAS
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 137 1 3 1 3 0 5 2 2 73 130 140
## # … with 8 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## # fcer <fct>, fvin <fct>, fpin <fct>, sexo <fct>, cor <fct>
# Pressão Diastólica menor 30 mmHg
epi84[epi84$DIAS <= 30,]
## # A tibble: 1 x 20
## NQT QCER FCER QVIN FVIN QPIN FPIN SEXO COR PESO SIST DIAS
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 486 0 5 0 5 0 5 2 2 68 124 20
## # … with 8 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## # fcer <fct>, fvin <fct>, fpin <fct>, sexo <fct>, cor <fct>
# Pressão de pulso
epi84$pulso <- epi84$SIST - epi84$DIAS
Desc(epi84$pulso)
## -------------------------------------------------------------------------
## epi84$pulso (numeric)
##
## length n NAs unique 0s mean meanCI
## 674 674 0 59 0 46.77 45.69
## 100.0% 0.0% 0.0% 47.85
##
## .05 .10 .25 median .75 .90 .95
## 30.00 32.00 38.00 44.00 52.00 64.00 72.70
##
## range sd vcoef mad IQR skew kurt
## 130.00 14.28 0.31 10.38 14.00 1.19 2.91
##
## lowest : -10.0, 16.0, 20.0 (5), 24.0 (6), 25.0 (3)
## highest: 96.0 (2), 98.0 (2), 100.0, 104.0 (2), 120.0
# Remoção da análise
epi84 <- epi84 %>%
filter(!NQT %in% c(137,486))
Foi analisada as relações entre a pressão sistólica e diastólica e detectado o questionário 137 onde a pressão de pulso (pressão sistólica - pressão diastólica) foi negativa. Considerando que limite de detecção do esfigmomanômetro é em torno de 40 mmHg e aparelhos eletrônicos o limite é de 30 mmHg, foi detectado o questionário 486 com uma pressão diastólica de 20. Ambas as observações foram removidas da análise.
Desc(epi84$IDADE)
## -------------------------------------------------------------------------
## epi84$IDADE (numeric)
##
## length n NAs unique 0s mean meanCI
## 672 672 0 51 0 35.81 34.87
## 100.0% 0.0% 0.0% 36.74
##
## .05 .10 .25 median .75 .90 .95
## 18.00 21.00 27.00 34.00 44.00 54.00 59.00
##
## range sd vcoef mad IQR skew kurt
## 50.00 12.41 0.35 11.86 17.00 0.47 -0.67
##
## lowest : 15.0 (3), 16.0 (12), 17.0 (16), 18.0 (18), 19.0 (7)
## highest: 61.0 (7), 62.0 (4), 63.0 (7), 64.0 (3), 65.0
### Bebe
# 1=sim, 2=não
# Conversão para variável categórica
epi84$bebe <- factor(epi84$BEBE, levels = c(1,2), labels = c("Sim", "Não"))
Desc(epi84$ALTURA)
## -------------------------------------------------------------------------
## epi84$ALTURA (numeric)
##
## length n NAs unique 0s mean meanCI
## 672 672 0 50 0 1.61 1.61
## 100.0% 0.0% 0.0% 1.62
##
## .05 .10 .25 median .75 .90 .95
## 1.47 1.50 1.55 1.61 1.67 1.72 1.77
##
## range sd vcoef mad IQR skew kurt
## 0.61 0.09 0.06 0.09 0.12 0.10 0.10
##
## lowest : 1.29, 1.34, 1.38 (2), 1.39, 1.41 (3)
## highest: 1.82 (6), 1.83 (2), 1.84 (2), 1.85, 1.9
### Interação entre peso e altura
# Teste por inconsistências entre peso e altura
epi84$imc <- epi84$PESO / epi84$ALTURA^2
Desc(epi84$imc)
## -------------------------------------------------------------------------
## epi84$imc (numeric)
##
## length n NAs unique 0s mean meanCI
## 672 672 0 503 0 24.55320 24.21518
## 100.0% 0.0% 0.0% 24.89122
##
## .05 .10 .25 median .75 .90 .95
## 18.85109 19.55556 21.47667 23.81174 26.91273 30.17182 32.88394
##
## range sd vcoef mad IQR skew kurt
## 31.71472 4.46264 0.18175 4.03268 5.43605 1.15317 2.33465
##
## lowest : 16.35931, 16.40625, 16.88872, 16.89624, 17.00882
## highest: 40.79084, 41.00987, 43.03762, 44.0, 48.07403
epi84[epi84$imc > 40,]
## # A tibble: 5 x 23
## NQT QCER FCER QVIN FVIN QPIN FPIN SEXO COR PESO SIST DIAS
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 43 0 5 0 5 0 5 2 1 99 108 62
## 2 46 0 5 0 5 0 5 2 2 98 165 100
## 3 149 1 2 5 2 4 2 2 3 80 140 98
## 4 497 0 5 0 5 0 5 2 1 93 140 80
## 5 592 0 5 0 5 0 5 2 1 96 120 78
## # … with 11 more variables: IDADE <dbl>, BEBE <dbl>, ALTURA <dbl>,
## # fcer <fct>, fvin <fct>, fpin <fct>, sexo <fct>, cor <fct>,
## # pulso <dbl>, bebe <fct>, imc <dbl>
Há 5 casos de IMC acima de 40, sendo um caso de IMC 48, ainda dentro do espectro de ocorrerência na população.
Foram criadas no banco as seguintes variáveis auxiliares, baseadas nas variáveis presentes no banco originalmente
# Uma garrafa de cerveja contém 25 gramas de álcool
# Uma taça de vinho contém 10 gramas de álcool
# Uma dose de pinga contém 15 gramas de álcool
epi84 <- epi84 %>%
mutate(cervejas_ano =
case_when(
FCER == 1 ~ QCER,
FCER == 2 ~ QCER/7,
FCER == 3 ~ QCER/30.4,
FCER == 4 ~ QCER/365.25,
TRUE ~ 0
) *365.25,
vinhos_ano =
case_when(
FVIN == 1 ~ QVIN,
FVIN == 2 ~ QVIN/7,
FVIN == 3 ~ QVIN/30.4,
FVIN == 4 ~ QVIN/365.25,
TRUE ~ 0
) * 365.25,
pingas_ano =
case_when(
FPIN == 1 ~ QPIN,
FPIN == 2 ~ QPIN/7,
FPIN == 3 ~ QPIN/30.4,
FPIN == 4 ~ QPIN/365.25,
TRUE ~ 0
) * 365.25,
g_alcool_ano = (cervejas_ano*25) + (vinhos_ano*10) + (pingas_ano*15),
ingestao_media_diaria_alcool = g_alcool_ano/365.4,
ingestao_media_diaria_alcool_ordinal = cut(ingestao_media_diaria_alcool,
breaks = c(0,1*10^-30,10,25, Inf),
include.lowest = TRUE),
hipertenso = as.factor(if_else(SIST >=140 | DIAS >=90, "Hipertenso", "Não hipertenso")),
IMC = PESO / ALTURA^2,
obesidade = cut(IMC, c(-Inf, 25, 30, +Inf), labels = c("Normais", "Sobrepeso", "Obeso")
)
)
epi84$g_alcool_ano
## [1] 0.0000 600.7401 0.0000 14088.2143 0.0000
## [6] 3149.5947 0.0000 16175.3571 0.0000 1482.9699
## [11] 0.0000 0.0000 0.0000 0.0000 0.0000
## [16] 2969.3727 21915.0000 0.0000 20128.7500 0.0000
## [21] 0.0000 0.0000 2943.6266 0.0000 0.0000
## [26] 0.0000 0.0000 0.0000 0.0000 1304.4643
## [31] 6261.4286 1304.4643 1565.3571 0.0000 2608.9286
## [36] 0.0000 4174.2857 3149.5947 0.0000 0.0000
## [41] 1304.4643 0.0000 0.0000 420.5181 7305.0000
## [46] 0.0000 0.0000 90.0000 0.0000 27393.7500
## [51] 29480.8929 25.0000 0.0000 0.0000 5478.7500
## [56] 0.0000 0.0000 5478.7500 15090.5921 1349.4643
## [61] 0.0000 4435.1786 12639.5724 8408.5714 0.0000
## [66] 0.0000 300.3701 0.0000 0.0000 0.0000
## [71] 2608.9286 2608.9286 0.0000 0.0000 8348.5714
## [76] 0.0000 0.0000 3431.0844 3702.5000 0.0000
## [81] 23799.6076 782.6786 0.0000 0.0000 10174.8214
## [86] 0.0000 0.0000 0.0000 21915.0000 0.0000
## [91] 841.0362 600.7401 3652.5000 0.0000 0.0000
## [96] 0.0000 1304.4643 0.0000 0.0000 0.0000
## [101] 9913.9286 2584.8990 0.0000 3604.4408 0.0000
## [106] 5578.3012 0.0000 0.0000 0.0000 0.0000
## [111] 0.0000 7826.7857 0.0000 0.0000 0.0000
## [116] 0.0000 5779.1201 2608.9286 0.0000 0.0000
## [121] 0.0000 4174.2857 1304.4643 0.0000 0.0000
## [126] 0.0000 0.0000 0.0000 0.0000 109575.0000
## [131] 0.0000 1565.3571 37568.5714 6261.4286 8648.9415
## [136] 0.0000 1304.4643 0.0000 0.0000 841.0362
## [141] 0.0000 300.3701 0.0000 0.0000 0.0000
## [146] 0.0000 0.0000 7044.1071 0.0000 0.0000
## [151] 2643.2566 0.0000 3130.7143 0.0000 54787.5000
## [156] 0.0000 600.7401 17036.9901 5478.7500 4956.9643
## [161] 300.3701 0.0000 0.0000 0.0000 2608.9286
## [166] 0.0000 15653.5714 0.0000 720.8882 0.0000
## [171] 6522.3214 7826.7857 0.0000 5217.8571 0.0000
## [176] 0.0000 0.0000 2087.1429 1141.4062 0.0000
## [181] 0.0000 0.0000 2608.9286 8842.8947 0.0000
## [186] 0.0000 0.0000 2608.9286 1141.4062 1785.0564
## [191] 0.0000 1441.7763 420.5181 0.0000 0.0000
## [196] 0.0000 3130.7143 0.0000 16436.2500 0.0000
## [201] 0.0000 0.0000 0.0000 0.0000 0.0000
## [206] 20610.5357 0.0000 7164.2552 0.0000 0.0000
## [211] 7102.4648 0.0000 34698.7500 0.0000 1216.4803
## [216] 1141.4062 1221.4803 6783.2143 0.0000 0.0000
## [221] 3913.3929 640.7401 15210.7401 3913.3929 0.0000
## [226] 1664.9084 1965.2784 0.0000 0.0000 2137.1429
## [231] 390.2961 0.0000 0.0000 0.0000 10004.3010
## [236] 2969.3727 22134.6992 4048.5409 0.0000 4654.8778
## [241] 6261.4286 0.0000 1201.4803 0.0000 440.3701
## [246] 0.0000 0.0000 0.0000 1454.4643 4543.9850
## [251] 0.0000 0.0000 0.0000 3130.7143 0.0000
## [256] 6882.7655 23741.2500 1304.4643 0.0000 2608.9286
## [261] 0.0000 0.0000 0.0000 0.0000 6000.5357
## [266] 11218.3929 0.0000 4205.1809 6783.2143 3230.2655
## [271] 3913.3929 74876.2500 0.0000 0.0000 822.1558
## [276] 0.0000 0.0000 1321.6283 0.0000 0.0000
## [281] 0.0000 0.0000 0.0000 0.0000 1682.0724
## [286] 2466.4673 0.0000 0.0000 315.1480 13666.4286
## [291] 0.0000 21393.2143 1826.2500 0.0000 0.0000
## [296] 1664.9084 1020.9622 0.0000 2849.2246 0.0000
## [301] 0.0000 0.0000 10435.7143 0.0000 1664.9084
## [306] 0.0000 1903.4880 0.0000 0.0000 1802.2204
## [311] 0.0000 8705.5827 0.0000 2608.9286 300.3701
## [316] 0.0000 12261.9643 8870.3571 12261.9643 0.0000
## [321] 27713.0005 5777.8571 0.0000 4654.2857 3130.7143
## [326] 0.0000 2608.9286 0.0000 1304.4643 0.0000
## [331] 37053.6513 0.0000 0.0000 671.7857 75.0000
## [336] 590.3701 8482.4507 1361.4803 2887.1429 0.0000
## [341] 0.0000 6522.3214 0.0000 807.6786 3913.3929
## [346] 31046.2500 615.7401 420.5181 300.3701 3511.7552
## [351] 2162.6645 20088.7500 790.9622 35.0000 600.7401
## [356] 8774.2387 2042.5164 365.3701 5597.1816 350.3701
## [361] 1081.3322 600.7401 5798.0005 1604.8344 1824.5336
## [366] 320.3701 3173.8487 3929.8860 900.0000 4435.1786
## [371] 1424.6123 0.0000 2668.9286 2968.9286 4813.3929
## [376] 3039.3727 0.0000 250.0000 0.0000 330.0000
## [381] 1644.3116 3913.3929 300.3701 2207.1429 3367.5775
## [386] 2608.9286 65.0000 5317.4084 4814.2857 0.0000
## [391] 0.0000 901.1102 901.1102 7926.3369 1103.0486
## [396] 480.5921 0.0000 961.1842 6983.2143 0.0000
## [401] 490.5921 2265.6485 0.0000 0.0000 0.0000
## [406] 1304.4643 1484.6863 0.0000 0.0000 8417.8336
## [411] 4775.0258 3391.6071 0.0000 0.0000 24942.7303
## [416] 0.0000 12821.5108 0.0000 0.0000 0.0000
## [421] 0.0000 480.5921 0.0000 0.0000 0.0000
## [426] 2608.9286 2869.8214 1261.5543 0.0000 7565.8929
## [431] 600.7401 0.0000 17479.8214 2006.4720 9131.2500
## [436] 0.0000 0.0000 1304.4643 0.0000 0.0000
## [441] 901.1102 4153.6889 0.0000 0.0000 0.0000
## [446] 480.5921 822.1558 2608.9286 11740.1786 480.5921
## [451] 6261.4286 4174.2857 3913.3929 0.0000 0.0000
## [456] 2608.9286 180.2220 0.0000 780.9622 0.0000
## [461] 0.0000 0.0000 450.5181 0.0000 12522.8571
## [466] 2909.2986 901.1102 1321.6283 0.0000 0.0000
## [471] 0.0000 45134.4643 4174.2857 0.0000 0.0000
## [476] 0.0000 0.0000 0.0000 0.0000 0.0000
## [481] 1383.4187 21915.0000 0.0000 6261.4286 7826.7857
## [486] 0.0000 0.0000 0.0000 8187.2298 19306.0714
## [491] 0.0000 0.0000 0.0000 300.3701 0.0000
## [496] 600.7401 0.0000 0.0000 0.0000 1565.3571
## [501] 65745.0000 0.0000 0.0000 0.0000 0.0000
## [506] 0.0000 10154.2246 0.0000 420.5181 1544.7603
## [511] 0.0000 27513.8980 0.0000 0.0000 3130.7143
## [516] 0.0000 20610.5357 0.0000 0.0000 300.3701
## [521] 5458.1532 9392.1429 5137.1863 0.0000 5458.1532
## [526] 2608.9286 1304.4643 3913.3929 60.0000 0.0000
## [531] 780.9622 0.0000 0.0000 0.0000 4204.2857
## [536] 4174.2857 0.0000 3039.3727 0.0000 0.0000
## [541] 120.1480 1111.3322 0.0000 0.0000 1424.6123
## [546] 0.0000 0.0000 0.0000 0.0000 0.0000
## [551] 2608.9286 6261.4286 2608.9286 7926.7857 0.0000
## [556] 360.4441 3810.4088 0.0000 0.0000 0.0000
## [561] 0.0000 0.0000 0.0000 0.0000 0.0000
## [566] 0.0000 0.0000 0.0000 0.0000 0.0000
## [571] 521.7857 3391.6071 2087.1429 0.0000 0.0000
## [576] 0.0000 2608.9286 2217.1429 0.0000 1544.7603
## [581] 0.0000 0.0000 0.0000 3329.8167 2744.0766
## [586] 0.0000 0.0000 0.0000 0.0000 9251.3980
## [591] 0.0000 0.0000 0.0000 44010.2220 1826.2500
## [596] 0.0000 0.0000 2618.9286 0.0000 961.1842
## [601] 0.0000 2348.0357 18262.5000 0.0000 4956.9643
## [606] 0.0000 0.0000 0.0000 0.0000 300.3701
## [611] 2087.1429 1742.1464 2686.3322 0.0000 2526.5414
## [616] 6438.2178 4153.6889 0.0000 6980.6003 0.0000
## [621] 0.0000 0.0000 0.0000 0.0000 0.0000
## [626] 1565.3571 0.0000 0.0000 1743.8628 0.0000
## [631] 0.0000 0.0000 600.7401 0.0000 0.0000
## [636] 0.0000 0.0000 300.3701 9131.2500 0.0000
## [641] 0.0000 30263.5714 67832.1429 8087.6786 3604.4408
## [646] 2608.9286 93138.7500 0.0000 0.0000 0.0000
## [651] 0.0000 2072.2944 630.7401 0.0000 0.0000
## [656] 0.0000 1304.4643 0.0000 7905.7401 0.0000
## [661] 0.0000 0.0000 0.0000 0.0000 570.5181
## [666] 1082.6786 1650.0000 0.0000 0.0000 7866.7857
## [671] 0.0000 600.7401
Desc(epi84$ingestao_media_diaria_alcool)
## -------------------------------------------------------------------------
## epi84$ingestao_media_diaria_alcool (numeric)
##
## length n NAs unique 0s mean
## 672 672 0 227 341 9.110059
## 100.0% 0.0% 50.7%
##
## .05 .10 .25 median .75 .90
## 0.000000 0.000000 0.000000 0.000000 7.251436 21.693325
##
## range sd vcoef mad IQR skew
## 299.876847 25.469061 2.795708 0.000000 7.251436 6.255447
##
## meanCI
## 7.180934
## 11.039184
##
## .95
## 44.588831
##
## kurt
## 50.996281
##
## lowest : 0.0 (341), 0.068418, 0.095785, 0.164204, 0.177887
## highest: 179.926108, 185.638048, 204.915846, 254.89532, 299.876847
summary(epi84$ingestao_media_diaria_alcool)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 0.000 0.000 9.110 7.251 299.877
Desc(epi84$ingestao_media_diaria_alcool)
## -------------------------------------------------------------------------
## epi84$ingestao_media_diaria_alcool (numeric)
##
## length n NAs unique 0s mean
## 672 672 0 227 341 9.110059
## 100.0% 0.0% 50.7%
##
## .05 .10 .25 median .75 .90
## 0.000000 0.000000 0.000000 0.000000 7.251436 21.693325
##
## range sd vcoef mad IQR skew
## 299.876847 25.469061 2.795708 0.000000 7.251436 6.255447
##
## meanCI
## 7.180934
## 11.039184
##
## .95
## 44.588831
##
## kurt
## 50.996281
##
## lowest : 0.0 (341), 0.068418, 0.095785, 0.164204, 0.177887
## highest: 179.926108, 185.638048, 204.915846, 254.89532, 299.876847
hist(epi84$ingestao_media_diaria_alcool)
table(epi84$bebe, if_else(epi84$g_alcool_ano == 0, "0", "Maior que 0"))
##
## 0 Maior que 0
## Sim 0 331
## Não 341 0
CrossTable(y = epi84$hipertenso, x = epi84$ingestao_media_diaria_alcool_ordinal, expected = TRUE, digits = 2)
##
##
## Cell Contents
## |-------------------------|
## | N |
## | Expected N |
## | Chi-square contribution |
## | N / Row Total |
## | N / Col Total |
## | N / Table Total |
## |-------------------------|
##
##
## Total Observations in Table: 672
##
##
## | epi84$hipertenso
## epi84$ingestao_media_diaria_alcool_ordinal | Hipertenso | Não hipertenso | Row Total |
## -------------------------------------------|----------------|----------------|----------------|
## [0,1e-30] | 69 | 272 | 341 |
## | 75.10 | 265.90 | |
## | 0.50 | 0.14 | |
## | 0.20 | 0.80 | 0.51 |
## | 0.47 | 0.52 | |
## | 0.10 | 0.40 | |
## -------------------------------------------|----------------|----------------|----------------|
## (1e-30,10] | 34 | 160 | 194 |
## | 42.73 | 151.27 | |
## | 1.78 | 0.50 | |
## | 0.18 | 0.82 | 0.29 |
## | 0.23 | 0.31 | |
## | 0.05 | 0.24 | |
## -------------------------------------------|----------------|----------------|----------------|
## (10,25] | 23 | 60 | 83 |
## | 18.28 | 64.72 | |
## | 1.22 | 0.34 | |
## | 0.28 | 0.72 | 0.12 |
## | 0.16 | 0.11 | |
## | 0.03 | 0.09 | |
## -------------------------------------------|----------------|----------------|----------------|
## (25,Inf] | 22 | 32 | 54 |
## | 11.89 | 42.11 | |
## | 8.59 | 2.43 | |
## | 0.41 | 0.59 | 0.08 |
## | 0.15 | 0.06 | |
## | 0.03 | 0.05 | |
## -------------------------------------------|----------------|----------------|----------------|
## Column Total | 148 | 524 | 672 |
## | 0.22 | 0.78 | |
## -------------------------------------------|----------------|----------------|----------------|
##
##
## Statistics for All Table Factors
##
##
## Pearson's Chi-squared test
## ------------------------------------------------------------
## Chi^2 = 15.49996 d.f. = 3 p = 0.001435614
##
##
##
O teste de qui-quadrado de homogeneidade teve um p-valor > 0,001 rejeitando a hipótese nula e suportanto a hipótese de associação entre as variáveis hipertensão e
Como se trata do cruzamento entre 3 variáveis categóricas foi criada uma tabela de contingência tridimensional e aplicado o teste de Cochran-Mantel-Haenszel, que foi significativo, rejeitando a hipótese nula e suportando a associação entre as 3 variáveis.
xtabs(~epi84$hipertenso + epi84$ingestao_media_diaria_alcool_ordinal + epi84$obesidade)
## , , epi84$obesidade = Normais
##
## epi84$ingestao_media_diaria_alcool_ordinal
## epi84$hipertenso [0,1e-30] (1e-30,10] (10,25] (25,Inf]
## Hipertenso 21 14 9 13
## Não hipertenso 170 109 45 20
##
## , , epi84$obesidade = Sobrepeso
##
## epi84$ingestao_media_diaria_alcool_ordinal
## epi84$hipertenso [0,1e-30] (1e-30,10] (10,25] (25,Inf]
## Hipertenso 25 13 8 9
## Não hipertenso 76 42 15 10
##
## , , epi84$obesidade = Obeso
##
## epi84$ingestao_media_diaria_alcool_ordinal
## epi84$hipertenso [0,1e-30] (1e-30,10] (10,25] (25,Inf]
## Hipertenso 23 7 6 0
## Não hipertenso 26 9 0 2
mantelhaen.test(xtabs(~epi84$hipertenso + epi84$ingestao_media_diaria_alcool_ordinal + epi84$obesidade))
##
## Cochran-Mantel-Haenszel test
##
## data: xtabs(~epi84$hipertenso + epi84$ingestao_media_diaria_alcool_ordinal + epi84$obesidade)
## Cochran-Mantel-Haenszel M^2 = 20.972, df = 3, p-value = 0.0001067