library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(readxl)
library(flextable)
read_excel("C:/Users/bruno/OneDrive/Desktop/R/Base_de_dados-master/Questionario_Estresse.xls")
## # A tibble: 95 x 10
## Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 1 2 2 2 2 8.89 23 27
## 2 2 1 1 1 2 2 8.8 24 28
## 3 3 1 2 2 2 2 8 25 25
## 4 4 1 2 2 1 1 8.8 38 21
## 5 5 1 2 2 2 1 8.9 41 18
## 6 6 1 2 2 1 1 8.1 25 29
## 7 7 1 2 2 2 2 9.2 41 26
## 8 8 1 1 1 1 1 8.5 20 24
## 9 9 1 1 1 2 1 8.7 26 20
## 10 10 1 1 1 2 1 8.3 36 49
## # ... with 85 more rows, and 1 more variable: Horas_estudo <dbl>
QE <- read_excel("C:/Users/bruno/OneDrive/Desktop/R/Base_de_dados-master/Questionario_Estresse.xls")
QE$Trabalha <- ifelse(QE$Trabalha== 1, 'Sim','Não')
QE %>% select(Desempenho,Trabalha) %>% group_by(Trabalha) %>%
summarise(Média=round(mean(Desempenho),2),
Mediana=median(Desempenho),
Desvio_Padrão=round(sd(Desempenho),2)) %>%
flextable()
Trabalha | Média | Mediana | Desvio_Padrão |
Não | 8.63 | 8.8 | 0.7 |
Sim | 8.54 | 8.7 | 0.9 |
Tanto as pessoas que trabalham como as que não trabalham têm uma média do desempenho próxima da mediana do desempenho, o que indica uma tendência a simetria nos dados apresentados.
Além disso, é possivel dizer que há pouca dispersão nos valores apresentados, já que os desvios padrão são baixos, ou seja, os dados tendem a estar entorno das médias.
Por fim, a partir dos dados apresentados, é possível concluir que é vantajoso que os alunos trabalhem enquanto estudam, já que as médias de desempenho (pessoas que trabalham e pessoas que não trabalham) são bem próximas (além do baixo desvio padrão), ou seja, os alunos, no geral, não são prejudicados por realizarem ambas as funções.
boxplot(QE$Desempenho ~ QE$Trabalha,
col=c("red","blue"),
xlab = "Trabalha",
ylab = "Desempenho",
main= "Grafico 1 - Boxplot")
O boxplot mais largo dos alunos que trabalham demonstra o maior desvio padrão que esses alunos apresentam, indicando uma maior dispersão entre os dados.
Além disso, a posição do primeiro quartil, mediana e terceiro quartil se mostra bem próxima nas duas situações, indicando que há pouca diferença entre alunos que trabalham e alunos que não trabalham.
Por fim, os pontos nos gráficos indicam a presença de outliers, ou seja, pontos fora da curva, que no caso, são alunos com baixo desempenho. Mas como há outliers tanto em alunos que trabalham quanto alunos que não trabalham, é possível imaginar que o trabalho não é a causa principal pelo baixo desempenho dos alunos, o que reforça a ideia de que é vantajoso o aluno estudar e trabalhar.