Para fazer a análise da base de dados Questinário de Estresse, escolhi utilizar as variáveis quantitativas: Estresse, Horas de Estudo e Desempenho, com o interesse de avaliar se estudantes que tiram mais horas para estudar são mais estressados do que tiram poucas, como também envolve o seu desempenho escolar.
library(readxl)
Questionario_Estresse <- read_excel("C:/Users/Ana Beatriz/Downloads/Base_de_dados-master/Questionario_Estresse.xls")
head(Questionario_Estresse)
## # A tibble: 6 x 10
## Aluno Turma Mora_pais RJ `Namorado(a)` Trabalha Desempenho Estresse
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 1 2 2 2 2 8.89 23
## 2 2 1 1 1 2 2 8.8 24
## 3 3 1 2 2 2 2 8 25
## 4 4 1 2 2 1 1 8.8 38
## 5 5 1 2 2 2 1 8.9 41
## 6 6 1 2 2 1 1 8.1 25
## # ... with 2 more variables: Créditos <dbl>, Horas_estudo <dbl>
library(ggplot2)
ggplot(Questionario_Estresse) +
aes(x = Horas_estudo, y = Estresse, colour = Desempenho) +
geom_point(size = 1L) +
scale_color_viridis_c(option = "inferno") +
labs(x = "Horas de Estudo", y = "Estresse", title = "Grafico de Horas de Estudo, Estresse e Desempenho", color = "Desempenho") +
theme_minimal()
Foi utilizado: Desempenho sendo medido por cor (maior desempenho é mais perto do amarelo, menos desempenho é mais perto do azul), Estresse como Y e Horas de Estudo como X.
É possÃvel identificar que o maior nÃvel de estresse ocorre entre alunos que estudam de 20 a 40 horas por semana, sendo a maioria com bom desempenho, tendo a exceção de um aluno que estuda 20 horas por semana, não tem um bom desempenho mas tem um nÃvel de estresse 40, um dos mais altos.
Podemos concluir que boa parte dos estudantes estudam 20 a 40 horas por dia, tem um nÃvel de estresse de 20 a 40 (considerado alto) conseguem ter um desempenho bom nos estudos, mas ocorrendo exceções que tem o nÃvel de estresse parecido e as horas de estudo parecidas mas não tem um bom desempenho, com isso concluo que eles devem ter problemas pessoais que não conseguem ter boas notas.