library(dplyr)
library(flextable)
library(readxl)
library(ggplot2)
library(ggthemes)
library(ggridges)
library(geobr)
library(leaflet)
QE <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Questionario_Estresse.xls")
View(QE)
head(QE) %>% flextable() %>% theme_tron_legacy()
Aluno | Turma | Mora_pais | RJ | Namorado_a | Trabalha | Desempenho | Estresse | Créditos | Horas_estudo |
|---|---|---|---|---|---|---|---|---|---|
1 | 1 | 2 | 2 | 2 | 2 | 8.89 | 23 | 27 | 27 |
2 | 1 | 1 | 1 | 2 | 2 | 8.80 | 24 | 28 | 28 |
3 | 1 | 2 | 2 | 2 | 2 | 8.00 | 25 | 25 | 25 |
4 | 1 | 2 | 2 | 1 | 1 | 8.80 | 38 | 21 | 30 |
5 | 1 | 2 | 2 | 2 | 1 | 8.90 | 41 | 18 | 20 |
6 | 1 | 2 | 2 | 1 | 1 | 8.10 | 25 | 29 | 32 |
BasesEstados <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\BasesEstados.xlsx")
View(BasesEstados)
QE$Namorado_a = ifelse(QE$Namorado_a==1, "Namora", "Não namora")
QE$Trabalha = ifelse(QE$Trabalha == 1, "Trabalha", "Não trabalha")
QE$RJ = ifelse(QE$RJ == 1,"Mora no rio", "Não mora no rio")
QE$Turma = as.factor(QE$Turma)
QE$Mora_pais = ifelse(QE$Mora_pais == 1, "Mora com os pais", "Não mora com os pais")
BasesEstados$Codigo = as.numeric(BasesEstados$Codigo)
BasesEstados = BasesEstados %>% rename(code_state = Codigo)
Variáveis resposta: nota (medida pelo desempenho), horas de estudo e estresse. Variáveis explicativa: trabalha e namora (qualitativas)
Trabalho é uma variável qualitativa e desempenho é uma variável quantitativa.
QE %>% group_by(Trabalha)%>%
summarise(Mínimo = round(min(Desempenho),1),
Primeiro_quartil = round(quantile(Desempenho, 0.25),1),
Mediana = median(Desempenho),
Terceiro_quartil = round(quantile(Desempenho, 0.75),1),
Máximo = max(Desempenho),
Média = round(mean(Desempenho),2), Desvio_padrão = round(sd(Desempenho),1))%>%
flextable()%>%
theme_tron_legacy()
Trabalha | Mínimo | Primeiro_quartil | Mediana | Terceiro_quartil | Máximo | Média | Desvio_padrão |
|---|---|---|---|---|---|---|---|
Não trabalha | 6.0 | 8.5 | 8.8 | 9.0 | 9.6 | 8.63 | 0.7 |
Trabalha | 5.8 | 8.4 | 8.7 | 9.1 | 9.7 | 8.54 | 0.9 |
boxplot(QE$Desempenho ~ QE$Trabalha, ylab = "Desempenho", xlab = "Trabalha?", main = "Gráfico de comparação do desempenho com trabalho", col = c("darkred", "skyblue"))
A diferença é de aproximadamente um décimo. O desvio padrão é entre 0,7 e 0,9. Logo, trabalhar não tem um impacto significativo no desempenho dos alunos. Recomenda-se a manutenção do status quo.
QE %>% group_by(Trabalha)%>%
summarise(Mínimo = round(min(Horas_estudo),1),
Primeiro_quartil = round(quantile(Horas_estudo, 0.25),1),
Mediana = median(Horas_estudo),
Terceiro_quartil = round(quantile(Horas_estudo, 0.75),1),
Máximo = max(Horas_estudo),
Média = round(mean(Horas_estudo),2), Desvio_padrão = round(sd(Horas_estudo),1))%>%
flextable()%>%
theme_tron_legacy()
Trabalha | Mínimo | Primeiro_quartil | Mediana | Terceiro_quartil | Máximo | Média | Desvio_padrão |
|---|---|---|---|---|---|---|---|
Não trabalha | 20 | 28.0 | 30 | 35.0 | 60 | 31.56 | 6.9 |
Trabalha | 19 | 24.8 | 30 | 33.5 | 59 | 29.36 | 7.7 |
boxplot(QE$Horas_estudo ~ QE$Trabalha, ylab = "Horas de estudo", xlab = "Trabalha?", main = "Gráfico de comparação das horas de estudo com trabalho", col = c("darkgreen", "green"))
A diferença é em média 2 horas de estudo a menos para quem trabalha, com desvio padrão de aproximadamente 1. Podemos concluir que o trabalho afeta pouco as horas de estudo dos alunos. Novamente é recomendado manter o status quo.
QE %>% select(Namorado_a,Horas_estudo) %>%
ggplot(aes(x=Namorado_a, y = Horas_estudo)) +
geom_boxplot(fill = c("darkred", "skyblue")) +
labs (x = "Tem namorado(a)?", y = "Horas de estudo",
title = "Gráfico horas de estudo x Namorar", caption = "Fonte: Questionario estresse, processamento: Pedro Gonçalves da Cunha") +
coord_flip() +
theme_fivethirtyeight()
QE %>% select(Turma, Desempenho)%>%
ggplot(x = Turma, y = Desempenho)+
geom_density_ridges(aes(y = Turma, x = Desempenho, group = Turma, fill = Turma))
mapa = read_state()
##
|
| | 0%
|
|=== | 4%
|
|===== | 7%
|
|======== | 11%
|
|========== | 15%
|
|============= | 19%
|
|================ | 22%
|
|================== | 26%
|
|===================== | 30%
|
|======================= | 33%
|
|========================== | 37%
|
|============================= | 41%
|
|=============================== | 44%
|
|================================== | 48%
|
|==================================== | 52%
|
|======================================= | 56%
|
|========================================= | 59%
|
|============================================ | 63%
|
|=============================================== | 67%
|
|================================================= | 70%
|
|==================================================== | 74%
|
|====================================================== | 78%
|
|========================================================= | 81%
|
|============================================================ | 85%
|
|============================================================== | 89%
|
|================================================================= | 93%
|
|=================================================================== | 96%
|
|======================================================================| 100%
dados_mais_mapas = mapa %>% left_join(BasesEstados)
dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = IDH)) + scale_fill_distiller(palette = "Greens", direction = 1, name = "IDH", limits = c(0.6, 1))
dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = Taxa_analfabetismo)) + scale_fill_distiller(palette = "Oranges", direction = 1, name = "Taxa de analfabetismo", limits = c(4, 31))
dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = Esperancadevida)) + scale_fill_distiller(palette = "Reds", direction = 1, name = "Esperança de vida ao nascer", limits = c(70, 78))
leaflet() %>% addTiles() %>% addMarkers(lng = -43.17351628758103, lat = -22.952349148822705, popup = "UNIRIO") %>% addProviderTiles(providers$Stamen.Watercolor)