BOXPLOT

library(readxl)
Quest_Est <- read_excel("C:/Users/Windows 10/Documents/MESTRADO - UFF/Estatistica aplicada a engenharia/Base_de_dados-master/Questionario_Estresse.xls")


Quest_Est$Trabalha <- ifelse(Quest_Est$Trabalha == 1,"Trabalha","Não trabalha")
View(Quest_Est)

boxplot(Quest_Est$Horas_estudo ~ Quest_Est$Trabalha,
        main="Gráfico 1 - Boxplot da relação entre trabalho e horas de estudo",
        col=c("cadetblue2","brown2"),
        xlab="Horas de estudo",
        ylab="Trabalho",
        horizontal = TRUE)

TABELA

library(dplyr)
library(flextable)

Quest_Est %>% select(Horas_estudo, Trabalha) %>%
  group_by(Trabalha) %>%
  summarise(Média=round(mean(Horas_estudo),2),
            DesvioPadrão=round(sd(Horas_estudo),2),
            Tamanho=n()) %>%
  flextable() %>%
  add_header_lines("Tabela 1 - Estatísticas das horas de estudo") %>%
  theme_vanilla()

ANÁLISE

Este trabalho é resultado de uma pesquisa sobre grau de estresse aplicada em duas turmas do curso de psicologia. Foram realizadas diversas perguntas, entre elas se os alunos trabalhavam e quantas horas estudavam por semana. 95 alunos participaram da pesquisa.

A tabela com os dados estatísticos mostra que participaram da pesquisa 59 alunos que não trabalham e 36 alunos que trabalha e que a média de horas de estudo para os alunos que não trabalham é de 31,56h/semana, valor maior que o encontrado para os alunos que trabalham, de 29,36h/semana, o que era esperado, visto que os alunos que não trabalham dispõem de mais tempo para se dedicar aos estudos. O desvio padrão foi mais alto para os alunos que trabalham do que para os que não trabalham, 7,72 e 6,93, respectivamente.

Do boxplot apresentado pode-se concluir que:

• As horas de estudo das pessoas que trabalham apresentam maior variabilidade que das pessoas que não trabalham;

• As medianas dos dois grupos são praticamente iguais;

• Os dois conjuntos de dados apresentam um outlier cada;

• Alunos que não trabalham tendem a estudar mais tempo que alunos que trabalham;

• O conjunto de dados dos alunos que trabalham apresenta maior simetria que o dos alunos que não trabalham;

• O menor valor encontrado foi para os alunos que trabalham e o maior valor foi para os alunos que não trabalham;

• A dispersão dos dados é maior para os alunos que trabalham;

• Os alunos que não trabalham possuem os dados mais concentrados.