1 Contextualização

O banco de dados analisado traz os resultados de um experimento realizado com homens e mulheres que consumiram ou não álcool (divididos em três grupos: não consumiu álcool, consumiu duas canecas, consumiu três canecas). Após esse consumo, foi avaliada a memória e a latência para a realização de uma tarefa cognitiva. Desejamos avaliar se o consumo de álcool afetou a memória e se esse efeito depende do gênero. Para isso, será realizada uma ANOVA de duas vias, com “Gênero” e “Consumo de Álcool” como variáveis independentes.

2 Carregamento dos pacotes

## —-Authentificate to Google Drive——– googledrive::drive_auth()

2.1 —-List all your Google sheets———–

gs4_find()

2.2 —-Read Google Sheet———————

3 Leitura e visualização do banco de dados

#kable(head(dados, 10), col.names = c("Gênero", "Álcool", "Memória", "Latência")) %>%
 # kable_styling(full_width = F, bootstrap_options = c("striped", "hover", "condensed", "responsive"))


Retirando as variáveis sem variabilidade. Logo, todas as conclusões sobre a população em estudo consideram que os pacientes poussuem : Pancreatite, IAM,Obesidade,Venturi,CNAF, Expontanea,Gentamicina, Anfotericina B.


Retirada do único indivíduo com Hiper.

4 Análise descritiva

4.1 Histograma - Distribuições das Variáveis

str(dRegistro)

4.1.1 Registro

4.2 Correlograma

descritive<- gs4_create(“Descritive”, sheets = list(“Descritive”=dataclean)) # Criando uma Google Sheet com 2 conjuntos de dados, que ficarão em Sheets diferentes

4.3 Médias e desvios

Gênero Classificação Desfecho Variável n Média Desvio Padrão
0 0 0 MgE 5 1.460 0.261
0 0 1 MgE 5 1.500 0.071
0 1 0 MgE 3 2.000 0.265
0 1 1 MgE 4 1.775 0.096
1 0 0 MgE 2 1.500 0.000
1 0 1 MgE 5 1.540 0.089
1 1 0 MgE 7 2.029 0.150
1 1 1 MgE 4 1.975 0.189


Construir uma base com os níveis nomeados para as variáveis com correlação interessante com MgE

4.4 Boxplots

4.4.1 Classificação

ggplot(data = dRegistro, aes(x =Idade)) + stat_density() + facet_wrap(~Registro, scales = “free”) (data = dRegistro, aes(x =Idade))

5 Material de Apoio

6 Créditos

Material criado por Fernanda F. Peres.

6.1 Ordenando a variável “Álcool”

Colocar as categorias em uma ordem lógica (nenhum consumo, duas canecas e quatro canecas) vai facilitar a visualização dos dados no gráfico.

#dados$Alcool <- factor(dados$Alcool,
#                       levels = c("Nenhum",
 #                                 "2 Canecas",
 #                                 "4 Canecas"))

7 Verificação dos pressupostos do modelo

7.1 Normalidade

A variável dependente (“Memória”) deve apresentar distribuição aproximadamente normal dentro de cada grupo. Os grupos aqui serão formados pela combinação das duas variáveis independentes (“Gênero” e “Álcool”). A normalidade será avaliada pelo teste de Shapiro-Wilk.

#dados %>% group_by(Genero, Alcool) %>% 
 # shapiro_test(Memoria)

Todos os grupos apresentam distribuição normal (valores de p superiores a 0,05).

7.2 Ausência de outliers

Outro pressuposto da ANOVA é a ausência de outliers em todos os grupos. Isso pode ser verificado através de um gráfico do tipo boxplot.

#boxplot(dados$Memoria ~ dados$Genero:dados$Alcool, ylab = "Memória", xlab = "Grupo",
       # names = c("F N", "M N", "F 2C", "M 2C", "F 4C", "M 4C"))

Os gráficos mostram que não há outliers nos grupos analisados.

7.3 Homogeneidade de variâncias

Outro pressuposto da ANOVA é que os grupos apresentem variâncias homogêneas. Esse pressuposto será analisado aqui pelo teste de Levene.

#leveneTest(Memoria ~ Genero*Alcool, dados, center = mean)

Os resultados indicam que as variâncias são homogêneas, uma vez que o teste de Levene apresentou p superior a 0,05.

8 Realização do teste de ANOVA de duas vias

8.1 Trocando o tipo de contraste

Para essa análise, será utilizado o contraste “soma”.

#options(contrasts = c("contr.sum", "contr.poly"))

8.2 Criação do modelo de ANOVA

Será criado um modelo de ANOVA usando a função aov. O modelo escolhido é um modelo fatorial completo, que inclui os efeitos principais das variáveis independentes “Gênero” e “Álcool” bem como a interação entre elas.

#mod.ANOVA <- aov(Memoria ~ Genero*Alcool, dados)

8.3 Análise dos resultados do modelo

Para avaliar a significância das variáveis independentes e da sua interação, será utilizada a soma de quadrados do tipo III. Mais informações sobre os tipos de soma dos quadrados podem ser encontradas no livro “Discovering Statistics Using R” 1.

#Anova(mod.ANOVA, type = 'III')

O resultado nos indica que há efeito do “Álcool” [F(2,42) = 20,07; p < 0,001] e da interação entre “Gênero” e “Álcool” [F(2,42) = 11,91; p < 0,001] sobre a memória. Dado que existe interação, os efeitos principais não devem ser interpretados. Para investigar melhor essa interação, será feito um gráfico de linhas.

8.4 Análise da interação entre “Gênero” e “Álcool” sobre a “Memória”

#ggplot(dados, aes(x = Alcool, y = Memoria, group = Genero, color = Genero)) +
 # geom_line(stat = "summary", fun.data = "mean_se", size = 0.6) +
 # geom_point(stat = "summary", fun.y = "mean") +
 # geom_errorbar(stat = "summary", fun.data = "mean_se", width = 0.2) +
 # ylab("Escore de memória") +
 # xlab("Consumo de álcool") +
 # labs(color = "Gênero")

Pelo gráfico, parece que o consumo de álcool não afetou a memória entre as mulheres. Para os homens, o padrão indica que não houve diferença entre não consumir álcool e consumir duas canecas, mas que o consumo de quatro canecas reduziu o escore de memória.
Para verificar se essas diferenças são estatisticamente significativas, faremos comparações entre pares.

8.5 Comparações entre pares

#dados %>% group_by(Genero) %>% 
 # emmeans_test(Memoria ~ Alcool, p.adjust.method = "bonferroni")
#dados %>% group_by(Alcool) %>% 
  #emmeans_test(Memoria ~ Genero, p.adjust.method = "bonferroni")

Os resultados da comparação entre pares confirmam a hipótese levantada com a análise do gráfico. Há diferença entre os gêneros no escore de memória apenas na condição na qual foram consumidas quatro canecas de álcool. Para o gênero feminino, não houve efeito do álcool sobre a memória. Já para o gênero masculino, o consumo de quatro canecas diminuiu o escore de memória.

8.6 Gráficos de dispersão por grupo

Legenda: F = Feminino, M = Masculino, N = Nenhum consumo de álcool, 2C = Consumo de 2 canecas, 4C = Consumo de 4 Canecas.


  1. Field, A. P., Miles, J., & Field, Z. (2012). Discovering statistics using R.↩︎