Carregando bibliotecas

Carregamos as bibliotecas dplyr, flextable, redaxl, ggplot2, ggthemes, ggridges, geobr e leaflet.

library(dplyr)
library(flextable)
library(readxl)
library(ggplot2)
library(ggthemes)
library(ggridges)
library(geobr)
library(leaflet)

Variável qualitativa x Variável quantitativa

Importando base de dados

QE <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Questionario_Estresse.xls")
View(QE)
head(QE) %>% flextable() %>% theme_tron_legacy()

Aluno

Turma

Mora_pais

RJ

Namorado_a

Trabalha

Desempenho

Estresse

Créditos

Horas_estudo

1

1

2

2

2

2

8.89

23

27

27

2

1

1

1

2

2

8.80

24

28

28

3

1

2

2

2

2

8.00

25

25

25

4

1

2

2

1

1

8.80

38

21

30

5

1

2

2

2

1

8.90

41

18

20

6

1

2

2

1

1

8.10

25

29

32

BasesEstados <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\BasesEstados.xlsx")
View(BasesEstados)

Limpeza de dados

QE$Namorado_a = ifelse(QE$Namorado_a==1, "Namora", "Não namora")
QE$Trabalha = ifelse(QE$Trabalha == 1, "Trabalha", "Não trabalha")
QE$RJ = ifelse(QE$RJ == 1,"Mora no rio", "Não mora no rio")
QE$Turma = as.factor(QE$Turma)
QE$Mora_pais = ifelse(QE$Mora_pais == 1, "Mora com os pais", "Não mora com os pais")

BasesEstados$Codigo = as.numeric(BasesEstados$Codigo)
BasesEstados = BasesEstados %>% rename(code_state = Codigo)

Questões de pesquisa

Variáveis resposta: nota (medida pelo desempenho), horas de estudo e estresse. Variáveis explicativa: trabalha e namora (qualitativas)

O trabalho tem impacto no desempenho?

Trabalho é uma variável qualitativa e desempenho é uma variável quantitativa.

QE %>% group_by(Trabalha)%>%
  summarise(Mínimo = round(min(Desempenho),1),
        Primeiro_quartil = round(quantile(Desempenho, 0.25),1),
        Mediana = median(Desempenho),
        Terceiro_quartil = round(quantile(Desempenho, 0.75),1),
        Máximo = max(Desempenho),
        Média = round(mean(Desempenho),2), Desvio_padrão = round(sd(Desempenho),1))%>% 
  flextable()%>% 
  theme_tron_legacy()

Trabalha

Mínimo

Primeiro_quartil

Mediana

Terceiro_quartil

Máximo

Média

Desvio_padrão

Não trabalha

6.0

8.5

8.8

9.0

9.6

8.63

0.7

Trabalha

5.8

8.4

8.7

9.1

9.7

8.54

0.9

Gráfico

boxplot(QE$Desempenho ~ QE$Trabalha, ylab = "Desempenho", xlab = "Trabalha?", main = "Gráfico de comparação do desempenho com trabalho", col = c("darkred", "skyblue"))

Análise dos dados

A diferença é de aproximadamente um décimo. O desvio padrão é entre 0,7 e 0,9. Logo, trabalhar não tem um impacto significativo no desempenho dos alunos. Recomenda-se a manutenção do status quo.

O trabalho tem impacto nas horas de estudo?

QE %>% group_by(Trabalha)%>%
  summarise(Mínimo = round(min(Horas_estudo),1),
            Primeiro_quartil = round(quantile(Horas_estudo, 0.25),1),
            Mediana = median(Horas_estudo),
            Terceiro_quartil = round(quantile(Horas_estudo, 0.75),1),
            Máximo = max(Horas_estudo),
            Média = round(mean(Horas_estudo),2), Desvio_padrão = round(sd(Horas_estudo),1))%>% 
  flextable()%>% 
  theme_tron_legacy()

Trabalha

Mínimo

Primeiro_quartil

Mediana

Terceiro_quartil

Máximo

Média

Desvio_padrão

Não trabalha

20

28.0

30

35.0

60

31.56

6.9

Trabalha

19

24.8

30

33.5

59

29.36

7.7

Gráfico

boxplot(QE$Horas_estudo ~ QE$Trabalha, ylab = "Horas de estudo", xlab = "Trabalha?", main = "Gráfico de comparação das horas de estudo com trabalho", col = c("darkgreen", "green"))

Análise de dados

A diferença é em média 2 horas de estudo a menos para quem trabalha, com desvio padrão de aproximadamente 1. Podemos concluir que o trabalho afeta pouco as horas de estudo dos alunos. Novamente é recomendado manter o status quo.

“Quem namora tem menos horas de estudo?”/ ggplot

QE %>% select(Namorado_a,Horas_estudo) %>%
  ggplot(aes(x=Namorado_a, y = Horas_estudo)) +
  geom_boxplot(fill = c("darkred", "skyblue")) + 
  labs (x = "Tem namorado(a)?", y = "Horas de estudo",
  title = "Gráfico horas de estudo x Namorar", caption = "Fonte: Questionario estresse, processamento: Pedro Gonçalves da Cunha") +
  coord_flip() +
  theme_fivethirtyeight()

Desempenho por turma

QE %>% select(Turma, Desempenho)%>%
  ggplot(x = Turma, y = Desempenho)+
  geom_density_ridges(aes(y = Turma, x = Desempenho, group = Turma, fill = Turma))

———————————————————-

Mapas de analfabetismo, idh e expectativa de vida

mapa = read_state()
## 
  |                                                                            
  |                                                                      |   0%
  |                                                                            
  |===                                                                   |   4%
  |                                                                            
  |=====                                                                 |   7%
  |                                                                            
  |========                                                              |  11%
  |                                                                            
  |==========                                                            |  15%
  |                                                                            
  |=============                                                         |  19%
  |                                                                            
  |================                                                      |  22%
  |                                                                            
  |==================                                                    |  26%
  |                                                                            
  |=====================                                                 |  30%
  |                                                                            
  |=======================                                               |  33%
  |                                                                            
  |==========================                                            |  37%
  |                                                                            
  |=============================                                         |  41%
  |                                                                            
  |===============================                                       |  44%
  |                                                                            
  |==================================                                    |  48%
  |                                                                            
  |====================================                                  |  52%
  |                                                                            
  |=======================================                               |  56%
  |                                                                            
  |=========================================                             |  59%
  |                                                                            
  |============================================                          |  63%
  |                                                                            
  |===============================================                       |  67%
  |                                                                            
  |=================================================                     |  70%
  |                                                                            
  |====================================================                  |  74%
  |                                                                            
  |======================================================                |  78%
  |                                                                            
  |=========================================================             |  81%
  |                                                                            
  |============================================================          |  85%
  |                                                                            
  |==============================================================        |  89%
  |                                                                            
  |=================================================================     |  93%
  |                                                                            
  |===================================================================   |  96%
  |                                                                            
  |======================================================================| 100%
dados_mais_mapas = mapa %>% left_join(BasesEstados)

Mapa de IDH

dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = IDH)) + scale_fill_distiller(palette = "Greens", direction = 1, name = "IDH", limits = c(0.6, 1)) 

Mapa de analfabetismo

dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = Taxa_analfabetismo)) + scale_fill_distiller(palette = "Oranges", direction = 1, name = "Taxa de analfabetismo", limits = c(4, 31))

Mapa de esperança de vida

dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = Esperancadevida)) + scale_fill_distiller(palette = "Reds", direction = 1, name = "Esperança de vida ao nascer", limits = c(70, 78))

Mapa watercolor

leaflet() %>% addTiles() %>% addMarkers(lng = -43.17351628758103, lat = -22.952349148822705, popup = "UNIRIO") %>% addProviderTiles(providers$Stamen.Watercolor)