Artigo de Bioestatística

Author

Grupo: Filipe de Sá, Marcos Bonfim, Rayane Melo, Júlia Xavier, Gabrielle e Maria

library(readxl)
estudantes_matematica <- read_excel("C:/Users/filip/Downloads/estudantes matematica.xlsx")
View(estudantes_matematica)
estudantes_matematica$romantic <- NULL
estudantes_matematica$school <- NULL
estudantes_matematica$famsize <- NULL 
estudantes_matematica$Pstatus <- NULL 
estudantes_matematica$address <- NULL
estudantes_matematica$Medu <- NULL 
estudantes_matematica$Fedu <- NULL 
estudantes_matematica$Mjob <- NULL 
estudantes_matematica$Fjob <- NULL
estudantes_matematica$guardian <- NULL
estudantes_matematica$reason <- NULL
estudantes_matematica$failures <- NULL
estudantes_matematica$schoolsup <- NULL
estudantes_matematica$nursery <- NULL
estudantes_matematica$activities <- NULL
estudantes_matematica$famsup <- NULL
estudantes_matematica$paid <- NULL
estudantes_matematica$goout<- NULL
estudantes_matematica$G2 <- NULL
estudantes_matematica$G3 <- NULL
estudantes_matematica$health <- NULL
estudantes_matematica$traveltime <- NULL
estudantes_matematica$Tempo_de_estudo_em_horas <- NULL
estudantes_matematica$`Tempo de estudo em (horas)` <- NULL
colnames(estudantes_matematica)
 [1] "sex"       "age"       "studytime" "higher"    "internet"  "famrel"   
 [7] "freetime"  "Dalc"      "Walc"      "absences"  "G1"       
colnames(estudantes_matematica) [1] <- "Sexo"
colnames(estudantes_matematica)  [2] <- "Idade"
colnames(estudantes_matematica)  [3] <- "Tempo de estudo"
colnames(estudantes_matematica)  [4] <- "Deseja cursar ensino superior"
colnames(estudantes_matematica)  [5] <- "Acesso à internet"
colnames(estudantes_matematica)  [6] <- "Relação familiar"
colnames(estudantes_matematica)  [7] <- "Tempo livre"
colnames(estudantes_matematica)  [8] <- "Consumo diário de álcool"
colnames(estudantes_matematica)  [9] <- "Consumo semanal de álcool"
colnames(estudantes_matematica)  [10] <- "Faltas"
colnames(estudantes_matematica)  [11] <- "Notas 1° trimestre"
str(estudantes_matematica)
tibble [395 × 11] (S3: tbl_df/tbl/data.frame)
 $ Sexo                         : chr [1:395] "F" "F" "F" "F" ...
 $ Idade                        : num [1:395] 18 17 15 15 16 16 16 17 15 15 ...
 $ Tempo de estudo              : num [1:395] 2 2 2 3 2 2 2 2 2 2 ...
 $ Deseja cursar ensino superior: chr [1:395] "yes" "yes" "yes" "yes" ...
 $ Acesso à internet            : chr [1:395] "no" "yes" "yes" "yes" ...
 $ Relação familiar             : num [1:395] 4 5 4 3 4 5 4 4 4 5 ...
 $ Tempo livre                  : num [1:395] 3 3 3 2 3 4 4 1 2 5 ...
 $ Consumo diário de álcool     : num [1:395] 1 1 2 1 1 1 1 1 1 1 ...
 $ Consumo semanal de álcool    : num [1:395] 1 1 3 1 2 2 1 1 1 1 ...
 $ Faltas                       : num [1:395] 6 4 10 2 4 10 0 6 0 0 ...
 $ Notas 1° trimestre           : num [1:395] 5 5 7 15 6 15 12 6 16 14 ...
estudantes_matematica$Sexo <- as.factor(estudantes_matematica$Sexo)
estudantes_matematica$Idade <- as.numeric(estudantes_matematica$Idade)
estudantes_matematica$`Tempo de estudo` <- as.numeric(estudantes_matematica$`Tempo de estudo`) 
estudantes_matematica$`Deseja cursar ensino superior` <- as.factor(estudantes_matematica$`Deseja cursar ensino superior`)
estudantes_matematica$`Acesso à internet` <- as.factor(estudantes_matematica$`Acesso à internet`)
estudantes_matematica$`Relação familiar` <- as.factor(estudantes_matematica$`Relação familiar`)
estudantes_matematica$`Tempo livre` <- as.numeric(estudantes_matematica$`Tempo livre`)
estudantes_matematica$`Consumo diário de álcool` <- as.factor(estudantes_matematica$`Consumo diário de álcool`)
estudantes_matematica$`Consumo semanal de álcool` <- as.factor(estudantes_matematica$`Consumo semanal de álcool`)
estudantes_matematica$Faltas <- as.numeric(estudantes_matematica$Faltas)
estudantes_matematica$`Notas 1° trimestre` <- as.numeric(estudantes_matematica$`Notas 1° trimestre`)

str(estudantes_matematica)
tibble [395 × 11] (S3: tbl_df/tbl/data.frame)
 $ Sexo                         : Factor w/ 2 levels "F","M": 1 1 1 1 1 2 2 1 2 2 ...
 $ Idade                        : num [1:395] 18 17 15 15 16 16 16 17 15 15 ...
 $ Tempo de estudo              : num [1:395] 2 2 2 3 2 2 2 2 2 2 ...
 $ Deseja cursar ensino superior: Factor w/ 2 levels "no","yes": 2 2 2 2 2 2 2 2 2 2 ...
 $ Acesso à internet            : Factor w/ 2 levels "no","yes": 1 2 2 2 1 2 2 1 2 2 ...
 $ Relação familiar             : Factor w/ 5 levels "1","2","3","4",..: 4 5 4 3 4 5 4 4 4 5 ...
 $ Tempo livre                  : num [1:395] 3 3 3 2 3 4 4 1 2 5 ...
 $ Consumo diário de álcool     : Factor w/ 5 levels "1","2","3","4",..: 1 1 2 1 1 1 1 1 1 1 ...
 $ Consumo semanal de álcool    : Factor w/ 5 levels "1","2","3","4",..: 1 1 3 1 2 2 1 1 1 1 ...
 $ Faltas                       : num [1:395] 6 4 10 2 4 10 0 6 0 0 ...
 $ Notas 1° trimestre           : num [1:395] 5 5 7 15 6 15 12 6 16 14 ...
levels(estudantes_matematica$Sexo)
[1] "F" "M"
levels(estudantes_matematica$Sexo) <- c("Feminino", "Masculino")

levels(estudantes_matematica$`Relação familiar`)
[1] "1" "2" "3" "4" "5"
levels(estudantes_matematica$`Relação familiar`) <- c("Péssimo" , "Ruim", "Regular", "Bom", "Ótimo")

levels(estudantes_matematica$`Consumo diário de álcool`)
[1] "1" "2" "3" "4" "5"
levels(estudantes_matematica$`Consumo diário de álcool`) <- c("Muito Baixo", "Baixo", "Moderado", "Alto", "Muito Alto")

levels(estudantes_matematica$`Consumo semanal de álcool`)
[1] "1" "2" "3" "4" "5"
levels(estudantes_matematica$`Consumo semanal de álcool`) <- c("Muito Baixo", "Baixo", "Moderado", "Alto", "Muito Alto")

levels(estudantes_matematica$`Acesso à internet`)
[1] "no"  "yes"
levels(estudantes_matematica$`Acesso à internet`) <- c("Sim", "Não")

levels(estudantes_matematica$`Deseja cursar ensino superior`)
[1] "no"  "yes"
levels(estudantes_matematica$`Deseja cursar ensino superior`) <- c("Sim", "Não")
estudantes_matematica$Tempo_de_estudo_em_horas <- cut(estudantes_matematica$`Tempo de estudo`, c( 0, 1, 2, 3, 4))
estudantes_matematica$Tempo_de_estudo_em_horas
  [1] (1,2] (1,2] (1,2] (2,3] (1,2] (1,2] (1,2] (1,2] (1,2] (1,2] (1,2] (2,3]
 [13] (0,1] (1,2] (2,3] (0,1] (2,3] (1,2] (0,1] (0,1] (1,2] (0,1] (1,2] (1,2]
 [25] (2,3] (0,1] (0,1] (0,1] (1,2] (1,2] (1,2] (1,2] (1,2] (1,2] (0,1] (0,1]
 [37] (2,3] (2,3] (2,3] (0,1] (1,2] (0,1] (1,2] (0,1] (1,2] (1,2] (1,2] (3,4]
 [49] (1,2] (1,2] (1,2] (1,2] (0,1] (0,1] (0,1] (1,2] (1,2] (1,2] (1,2] (1,2]
 [61] (1,2] (0,1] (1,2] (2,3] (1,2] (1,2] (3,4] (3,4] (1,2] (3,4] (3,4] (3,4]
 [73] (1,2] (0,1] (1,2] (1,2] (3,4] (3,4] (0,1] (1,2] (0,1] (2,3] (1,2] (1,2]
 [85] (1,2] (1,2] (1,2] (2,3] (1,2] (1,2] (2,3] (0,1] (1,2] (1,2] (3,4] (3,4]
 [97] (0,1] (1,2] (0,1] (2,3] (0,1] (2,3] (0,1] (1,2] (1,2] (3,4] (3,4] (2,3]
[109] (3,4] (2,3] (0,1] (2,3] (1,2] (0,1] (1,2] (1,2] (1,2] (0,1] (1,2] (0,1]
[121] (1,2] (3,4] (1,2] (0,1] (1,2] (0,1] (1,2] (1,2] (0,1] (0,1] (2,3] (0,1]
[133] (0,1] (0,1] (1,2] (2,3] (1,2] (0,1] (1,2] (0,1] (3,4] (0,1] (2,3] (0,1]
[145] (0,1] (1,2] (1,2] (1,2] (0,1] (0,1] (0,1] (0,1] (2,3] (0,1] (0,1] (1,2]
[157] (0,1] (0,1] (0,1] (1,2] (0,1] (1,2] (0,1] (0,1] (1,2] (0,1] (1,2] (1,2]
[169] (1,2] (1,2] (0,1] (1,2] (1,2] (1,2] (1,2] (1,2] (1,2] (1,2] (0,1] (1,2]
[181] (1,2] (1,2] (1,2] (1,2] (1,2] (1,2] (0,1] (1,2] (1,2] (1,2] (1,2] (1,2]
[193] (1,2] (0,1] (0,1] (1,2] (0,1] (0,1] (0,1] (1,2] (1,2] (1,2] (1,2] (0,1]
[205] (3,4] (2,3] (1,2] (1,2] (0,1] (2,3] (3,4] (1,2] (1,2] (1,2] (0,1] (1,2]
[217] (1,2] (1,2] (0,1] (2,3] (1,2] (2,3] (1,2] (1,2] (2,3] (1,2] (1,2] (1,2]
[229] (1,2] (2,3] (1,2] (1,2] (1,2] (1,2] (1,2] (2,3] (1,2] (0,1] (1,2] (1,2]
[241] (1,2] (1,2] (0,1] (0,1] (2,3] (0,1] (0,1] (0,1] (1,2] (0,1] (0,1] (1,2]
[253] (0,1] (0,1] (0,1] (0,1] (3,4] (1,2] (1,2] (3,4] (1,2] (1,2] (2,3] (2,3]
[265] (2,3] (1,2] (1,2] (1,2] (1,2] (1,2] (1,2] (3,4] (1,2] (1,2] (1,2] (1,2]
[277] (1,2] (0,1] (1,2] (0,1] (0,1] (0,1] (3,4] (1,2] (1,2] (1,2] (2,3] (2,3]
[289] (2,3] (1,2] (1,2] (2,3] (1,2] (3,4] (2,3] (0,1] (1,2] (1,2] (3,4] (0,1]
[301] (1,2] (0,1] (2,3] (3,4] (1,2] (1,2] (0,1] (0,1] (1,2] (1,2] (1,2] (1,2]
[313] (1,2] (1,2] (2,3] (2,3] (1,2] (2,3] (2,3] (1,2] (1,2] (1,2] (2,3] (2,3]
[325] (2,3] (2,3] (0,1] (0,1] (2,3] (2,3] (3,4] (2,3] (1,2] (1,2] (3,4] (2,3]
[337] (2,3] (1,2] (3,4] (1,2] (2,3] (1,2] (1,2] (1,2] (2,3] (2,3] (2,3] (2,3]
[349] (2,3] (0,1] (1,2] (1,2] (0,1] (0,1] (1,2] (1,2] (1,2] (1,2] (0,1] (2,3]
[361] (1,2] (1,2] (1,2] (1,2] (1,2] (1,2] (2,3] (0,1] (0,1] (1,2] (1,2] (0,1]
[373] (2,3] (0,1] (2,3] (2,3] (2,3] (1,2] (1,2] (1,2] (1,2] (0,1] (1,2] (0,1]
[385] (0,1] (2,3] (0,1] (2,3] (1,2] (1,2] (1,2] (0,1] (0,1] (0,1] (0,1]
Levels: (0,1] (1,2] (2,3] (3,4]
levels(estudantes_matematica$Tempo_de_estudo_em_horas) <- c("Maior que 2h",
                                                            "2 a 5h",
                                                            "5 a 10h",
                                                            "Maior que 10h")
estudantes_matematica$Tempo_livre_em_horas <- cut(estudantes_matematica$`Tempo livre`, c( 0, 1, 2, 3, 4, 5))
estudantes_matematica$Tempo_livre_em_horas
  [1] (2,3] (2,3] (2,3] (1,2] (2,3] (3,4] (3,4] (0,1] (1,2] (4,5] (2,3] (1,2]
 [13] (2,3] (3,4] (4,5] (3,4] (1,2] (2,3] (4,5] (0,1] (3,4] (3,4] (4,5] (3,4]
 [25] (2,3] (1,2] (1,2] (1,2] (2,3] (3,4] (3,4] (2,3] (4,5] (2,3] (3,4] (4,5]
 [37] (3,4] (3,4] (2,3] (2,3] (2,3] (3,4] (2,3] (3,4] (2,3] (1,2] (2,3] (1,2]
 [49] (2,3] (3,4] (2,3] (2,3] (4,5] (2,3] (2,3] (2,3] (2,3] (1,2] (2,3] (1,2]
 [61] (3,4] (4,5] (3,4] (3,4] (3,4] (3,4] (2,3] (2,3] (0,1] (3,4] (2,3] (2,3]
 [73] (2,3] (2,3] (2,3] (2,3] (3,4] (1,2] (4,5] (3,4] (1,2] (2,3] (3,4] (2,3]
 [85] (2,3] (3,4] (2,3] (2,3] (3,4] (0,1] (2,3] (4,5] (2,3] (2,3] (2,3] (0,1]
 [97] (2,3] (2,3] (2,3] (2,3] (4,5] (3,4] (2,3] (2,3] (3,4] (2,3] (0,1] (2,3]
[109] (2,3] (3,4] (4,5] (0,1] (0,1] (4,5] (3,4] (3,4] (3,4] (3,4] (1,2] (3,4]
[121] (1,2] (4,5] (1,2] (3,4] (3,4] (4,5] (2,3] (3,4] (2,3] (4,5] (1,2] (2,3]
[133] (3,4] (1,2] (2,3] (2,3] (3,4] (2,3] (3,4] (2,3] (1,2] (2,3] (1,2] (3,4]
[145] (3,4] (3,4] (2,3] (2,3] (2,3] (4,5] (2,3] (3,4] (1,2] (4,5] (1,2] (3,4]
[157] (1,2] (1,2] (1,2] (4,5] (2,3] (3,4] (3,4] (2,3] (2,3] (4,5] (2,3] (1,2]
[169] (0,1] (3,4] (3,4] (2,3] (3,4] (2,3] (3,4] (3,4] (3,4] (2,3] (2,3] (1,2]
[181] (3,4] (1,2] (3,4] (2,3] (1,2] (2,3] (2,3] (1,2] (2,3] (0,1] (2,3] (2,3]
[193] (3,4] (2,3] (2,3] (2,3] (1,2] (2,3] (1,2] (4,5] (2,3] (3,4] (3,4] (2,3]
[205] (2,3] (3,4] (2,3] (2,3] (2,3] (3,4] (2,3] (2,3] (2,3] (3,4] (1,2] (3,4]
[217] (3,4] (1,2] (2,3] (2,3] (1,2] (2,3] (2,3] (2,3] (2,3] (2,3] (2,3] (2,3]
[229] (2,3] (1,2] (1,2] (4,5] (4,5] (1,2] (3,4] (2,3] (3,4] (4,5] (0,1] (4,5]
[241] (4,5] (2,3] (3,4] (2,3] (3,4] (2,3] (1,2] (3,4] (2,3] (2,3] (3,4] (2,3]
[253] (1,2] (2,3] (3,4] (3,4] (1,2] (2,3] (1,2] (3,4] (0,1] (2,3] (2,3] (1,2]
[265] (2,3] (1,2] (3,4] (2,3] (3,4] (2,3] (2,3] (4,5] (3,4] (4,5] (2,3] (3,4]
[277] (0,1] (1,2] (3,4] (1,2] (4,5] (3,4] (1,2] (3,4] (3,4] (2,3] (2,3] (2,3]
[289] (1,2] (3,4] (2,3] (1,2] (3,4] (0,1] (3,4] (3,4] (2,3] (3,4] (2,3] (3,4]
[301] (1,2] (0,1] (2,3] (1,2] (3,4] (3,4] (4,5] (2,3] (4,5] (3,4] (1,2] (3,4]
[313] (4,5] (1,2] (0,1] (0,1] (2,3] (2,3] (2,3] (3,4] (1,2] (1,2] (2,3] (3,4]
[325] (2,3] (2,3] (2,3] (3,4] (3,4] (2,3] (4,5] (3,4] (2,3] (2,3] (3,4] (3,4]
[337] (3,4] (2,3] (2,3] (2,3] (2,3] (2,3] (2,3] (2,3] (2,3] (3,4] (2,3] (3,4]
[349] (3,4] (4,5] (3,4] (4,5] (2,3] (3,4] (4,5] (2,3] (2,3] (1,2] (2,3] (2,3]
[361] (2,3] (3,4] (2,3] (2,3] (1,2] (2,3] (1,2] (1,2] (1,2] (1,2] (1,2] (2,3]
[373] (3,4] (4,5] (3,4] (2,3] (3,4] (3,4] (0,1] (4,5] (1,2] (3,4] (3,4] (2,3]
[385] (3,4] (2,3] (3,4] (3,4] (2,3] (0,1] (4,5] (3,4] (4,5] (3,4] (1,2]
Levels: (0,1] (1,2] (2,3] (3,4] (4,5]
levels(estudantes_matematica$Tempo_livre_em_horas) <- c("Muito curto",
                                                        "Curto",
                                                        "Moderado",
                                                        "Longo",
                                                        "Muito longo")

#Tabela…..

gtsummary::tbl_summary(estudantes_matematica)
Characteristic N = 3951
Sexo
    Feminino 208 (53%)
    Masculino 187 (47%)
Idade
    15 82 (21%)
    16 104 (26%)
    17 98 (25%)
    18 82 (21%)
    19 24 (6.1%)
    20 3 (0.8%)
    21 1 (0.3%)
    22 1 (0.3%)
Tempo de estudo
    1 105 (27%)
    2 198 (50%)
    3 65 (16%)
    4 27 (6.8%)
Deseja cursar ensino superior
    Sim 20 (5.1%)
    Não 375 (95%)
Acesso à internet
    Sim 66 (17%)
    Não 329 (83%)
Relação familiar
    Péssimo 8 (2.0%)
    Ruim 18 (4.6%)
    Regular 68 (17%)
    Bom 195 (49%)
    Ótimo 106 (27%)
Tempo livre
    1 19 (4.8%)
    2 64 (16%)
    3 157 (40%)
    4 115 (29%)
    5 40 (10%)
Consumo diário de álcool
    Muito Baixo 276 (70%)
    Baixo 75 (19%)
    Moderado 26 (6.6%)
    Alto 9 (2.3%)
    Muito Alto 9 (2.3%)
Consumo semanal de álcool
    Muito Baixo 151 (38%)
    Baixo 85 (22%)
    Moderado 80 (20%)
    Alto 51 (13%)
    Muito Alto 28 (7.1%)
Faltas 4.0 (0.0, 8.0)
Notas 1° trimestre 11.0 (8.0, 13.0)
Tempo_de_estudo_em_horas
    Maior que 2h 105 (27%)
    2 a 5h 198 (50%)
    5 a 10h 65 (16%)
    Maior que 10h 27 (6.8%)
Tempo_livre_em_horas
    Muito curto 19 (4.8%)
    Curto 64 (16%)
    Moderado 157 (40%)
    Longo 115 (29%)
    Muito longo 40 (10%)
1 n (%); Median (IQR)

Há Relação entre o tempo livre após a escola e o desejo de cursar ensino superior? (QUALI X QUALI)

library(ggplot2)

ggplot(estudantes_matematica) +
 aes(x = Tempo_livre_em_horas, fill = `Deseja cursar ensino superior`) +
 geom_bar() +
 scale_fill_hue(direction = 1) +
 labs(x = "Tempo livre", y = "Frequência", title = "Figura 2. Relação entre o tempo livre após a escola e o desejo de cursar ensino superior", 
 caption = "CC0: Public Domain") +
 theme_light() +
 theme(plot.title = element_text(face = "bold", hjust = 0.5), 
 plot.caption = element_text(face = "italic"), axis.title.y = element_text(face = "bold.italic"), 
 axis.title.x = element_text(face = "bold.italic"))

#Segundo o gráfico é possível afirmar que a maioria dos indivíduos não têm o desejo de cursar o ensino superior. Dos indivíduos com mais de duas horas de tempo livre 11,4% querem cursar ensino superior, daqueles que têm de duas a cinco horas de tempo livre apenas 4% desejam cursar o ensino superior, e os que possuem mais de cinco horas de tempo livre não apresentam interesse em cursar ensino superior

library(summarytools)
ctable(estudantes_matematica$Tempo_de_estudo_em_horas, estudantes_matematica$`Deseja cursar ensino superior`)
Cross-Tabulation, Row Proportions  
Tempo_de_estudo_em_horas * `Deseja cursar ensino superior`  
Data Frame: estudantes_matematica  

-------------------------- ------------------------------- ------------ -------------- --------------
                             Deseja cursar ensino superior          Sim            Não          Total
  Tempo_de_estudo_em_horas                                                                           
              Maior que 2h                                   12 (11.4%)    93 ( 88.6%)   105 (100.0%)
                    2 a 5h                                    8 ( 4.0%)   190 ( 96.0%)   198 (100.0%)
                   5 a 10h                                    0 ( 0.0%)    65 (100.0%)    65 (100.0%)
             Maior que 10h                                    0 ( 0.0%)    27 (100.0%)    27 (100.0%)
                     Total                                   20 ( 5.1%)   375 ( 94.9%)   395 (100.0%)
-------------------------- ------------------------------- ------------ -------------- --------------

Qual a relação entre o acesso à internet e o tempo de estudo entre os estudantes? (QUALI X QUALI)

library(ggplot2)

ggplot(estudantes_matematica) +
 aes(x = `Acesso à internet`, fill = Tempo_de_estudo_em_horas) +
 geom_bar() +
 scale_fill_hue(direction = 1) +
 labs(y = "Frequência", title = "Figura 3. Relação entre o acesso à internet e o tempo de estudo dos estudantes", caption = "CC0: Public Domain", fill = "Tempo de estudo em horas") +
 theme_light() +
 theme(plot.title = element_text(face = "bold", hjust = 0.5), plot.caption = element_text(face = "italic"), 
 axis.title.y = element_text(face = "bold.italic"), axis.title.x = element_text(face = "bold.italic"))

##Relação entre o acesso à internet e tempo de estudo:

No gráfico, é notável que os indivíduos sem acesso à internet tiveram um tempo maior de estudo. Os Alunos com tempo de estudo de 5 a 10 horas sem acesso à internet representou 17,9%, enquanto que a porcentagem dos alunos com acesso à internet foi de 9,1%. Além disso, houve uma frequência maior de alunos sem acesso à internet com os tempos de estudo equivalentes a 2 a 5 horas e maior que 2 horas em relação aos indivíduos com acesso à internet nas respectivas horas de estudo.

library(summarytools)
ctable(estudantes_matematica$`Acesso à internet`, estudantes_matematica$Tempo_de_estudo_em_horas)
Cross-Tabulation, Row Proportions  
`Acesso à internet` * Tempo_de_estudo_em_horas  
Data Frame: estudantes_matematica  

------------------- -------------------------- -------------- ------------- ------------ --------------- --------------
                      Tempo_de_estudo_em_horas   Maior que 2h        2 a 5h      5 a 10h   Maior que 10h          Total
  Acesso à internet                                                                                                    
                Sim                                19 (28.8%)    37 (56.1%)    6 ( 9.1%)        4 (6.1%)    66 (100.0%)
                Não                                86 (26.1%)   161 (48.9%)   59 (17.9%)       23 (7.0%)   329 (100.0%)
              Total                               105 (26.6%)   198 (50.1%)   65 (16.5%)       27 (6.8%)   395 (100.0%)
------------------- -------------------------- -------------- ------------- ------------ --------------- --------------

Há Relação entre sexo e consumo diário de álcool? (QUALI X QUALI)

library(ggplot2)

ggplot(estudantes_matematica) +
 aes(x = Sexo, fill = `Consumo diário de álcool`) +
 geom_bar(position = "dodge") +
 scale_fill_hue(direction = 1) +
 labs(y = "Frequência (100%)", title = "Figura 3. Proporção entre o sexo e o consumo diário de álcool entre os estudantes", caption = "CC0: Public Domain") +
 theme_light() +
 theme(plot.title = element_text(face = "bold", hjust = 0.5), plot.caption = element_text(face = "italic"), 
 axis.title.y = element_text(face = "bold.italic"), axis.title.x = element_text(face = "bold.italic"))

##Pela primeira visão do gráfico é possível dizer que o consumo diário de álcool é maior entre os estudantes do sexo masculino do que entre as estudantes do sexo feminino. Também pode se notar que o consumo diário de álcool muito baixo destaca-se em ambos os sexos de estudantes. O baixo consumo diário de álcool é similar entre os dois sexos, sendo levemente maior entre os estudantes do sexo masculino. Já o consumo moderado diário de álcool no sexo masculino é de 11,2% enquanto que no sexo feminino é de 2,4%. O alto consumo diário de álcool entre os estudante de sexo masculino é de 3,7% enquanto que entre as estudantes de sexo feminino é 1%.

library(summarytools)
ctable(estudantes_matematica$Sexo, estudantes_matematica$`Consumo diário de álcool`)
Cross-Tabulation, Row Proportions  
Sexo * `Consumo diário de álcool`  
Data Frame: estudantes_matematica  

----------- -------------------------- ------------- ------------ ------------ ---------- ------------ --------------
              Consumo diário de álcool   Muito Baixo        Baixo     Moderado       Alto   Muito Alto          Total
       Sexo                                                                                                          
   Feminino                              167 (80.3%)   33 (15.9%)    5 ( 2.4%)   2 (1.0%)     1 (0.5%)   208 (100.0%)
  Masculino                              109 (58.3%)   42 (22.5%)   21 (11.2%)   7 (3.7%)     8 (4.3%)   187 (100.0%)
      Total                              276 (69.9%)   75 (19.0%)   26 ( 6.6%)   9 (2.3%)     9 (2.3%)   395 (100.0%)
----------- -------------------------- ------------- ------------ ------------ ---------- ------------ --------------

Existe Relação entre a idade e a relação familiar? QUANTI X QUALI

library(ggplot2)

ggplot(estudantes_matematica) +
 aes(x = "", y = Idade, fill = `Relação familiar`) +
 geom_boxplot() +
 scale_fill_hue(direction = 1) +
 labs(title = "Figura 4. Relação entre a idade e a relação familiar", caption = "CC0: Public Domain") +
 theme_minimal() +
 theme(plot.title = element_text(face = "bold"), 
 plot.caption = element_text(face = "italic"), axis.title.y = element_text(face = "bold.italic"), 
 axis.title.x = element_text(face = "bold.italic"))

#Através do gráfico acima, pôde-se notar que 75% dos alunos com as idades até 18 anos possuem uma ótima ou boa relação familiar e 75% dos alunos com idade ate 17 anos possuem relação familiar ruim ou regular. Além disso, 50% dos alunos com relação familiar péssima tinham até 16 anos. Nos grupos “ruim”, “regular” e “ótimo” foram observados valores discrepantes (19, 19, 22).

Há Relação entre as faltas e as notas do primeiro trimestre dos estudantes ?QUANTI X QUANTI

library(ggplot2)

ggplot(estudantes_matematica) +
 aes(x = `Notas 1° trimestre`, y = Faltas) +
 geom_point(shape = "circle", 
 size = 1.5, colour = "#112446") +
   geom_smooth(span = 1L) +
 labs(title = "Figura 5. Relação entre as faltas e as notas do primeiro trimestre dos estudantes", caption = "CC0: Public Domain") +
 theme_minimal() +
 theme(plot.title = element_text(face = "bold", 
 hjust = 0.5), plot.caption = element_text(face = "italic"), axis.title.y = element_text(face = "bold.italic"), 
 axis.title.x = element_text(face = "bold.italic"))
`geom_smooth()` using method = 'loess' and formula = 'y ~ x'