Carregando bibliotecas

Carregamos as bibliotecas dplyr, flextable, redaxl, ggplot2, ggthemes, ggridges, geobr e leaflet.

library(dplyr)
library(flextable)
library(readxl)
library(ggplot2)
library(ggthemes)
library(ggridges)
library(geobr)
library(leaflet)

Variável qualitativa x Variável quantitativa

Importando base de dados

QE <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Questionario_Estresse.xls")
View(QE)
head(QE) %>% flextable() %>% theme_tron_legacy()

Aluno	Turma	Mora_pais	RJ	Namorado_a	Trabalha	Desempenho	Estresse	Créditos	Horas_estudo
1	1	2	2	2	2	8.89	23	27	27
2	1	1	1	2	2	8.80	24	28	28
3	1	2	2	2	2	8.00	25	25	25
4	1	2	2	1	1	8.80	38	21	30
5	1	2	2	2	1	8.90	41	18	20
6	1	2	2	1	1	8.10	25	29	32

BasesEstados <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\BasesEstados.xlsx")
View(BasesEstados)

Limpeza de dados

QE$Namorado_a = ifelse(QE$Namorado_a==1, "Namora", "Não namora")
QE$Trabalha = ifelse(QE$Trabalha == 1, "Trabalha", "Não trabalha")
QE$RJ = ifelse(QE$RJ == 1,"Mora no rio", "Não mora no rio")
QE$Turma = as.factor(QE$Turma)
QE$Mora_pais = ifelse(QE$Mora_pais == 1, "Mora com os pais", "Não mora com os pais")

BasesEstados$Codigo = as.numeric(BasesEstados$Codigo)
BasesEstados = BasesEstados %>% rename(code_state = Codigo)

Questões de pesquisa

Variáveis resposta: nota (medida pelo desempenho), horas de estudo e estresse. Variáveis explicativa: trabalha e namora (qualitativas)

O trabalho tem impacto no desempenho?

Trabalho é uma variável qualitativa e desempenho é uma variável quantitativa.

QE %>% group_by(Trabalha)%>%
  summarise(Mínimo = round(min(Desempenho),1),
        Primeiro_quartil = round(quantile(Desempenho, 0.25),1),
        Mediana = median(Desempenho),
        Terceiro_quartil = round(quantile(Desempenho, 0.75),1),
        Máximo = max(Desempenho),
        Média = round(mean(Desempenho),2), Desvio_padrão = round(sd(Desempenho),1))%>% 
  flextable()%>% 
  theme_tron_legacy()

Trabalha	Mínimo	Primeiro_quartil	Mediana	Terceiro_quartil	Máximo	Média	Desvio_padrão
Não trabalha	6.0	8.5	8.8	9.0	9.6	8.63	0.7
Trabalha	5.8	8.4	8.7	9.1	9.7	8.54	0.9

Gráfico

boxplot(QE$Desempenho ~ QE$Trabalha, ylab = "Desempenho", xlab = "Trabalha?", main = "Gráfico de comparação do desempenho com trabalho", col = c("darkred", "skyblue"))

Análise dos dados

A diferença é de aproximadamente um décimo. O desvio padrão é entre 0,7 e 0,9. Logo, trabalhar não tem um impacto significativo no desempenho dos alunos. Recomenda-se a manutenção do status quo.

O trabalho tem impacto nas horas de estudo?

QE %>% group_by(Trabalha)%>%
  summarise(Mínimo = round(min(Horas_estudo),1),
            Primeiro_quartil = round(quantile(Horas_estudo, 0.25),1),
            Mediana = median(Horas_estudo),
            Terceiro_quartil = round(quantile(Horas_estudo, 0.75),1),
            Máximo = max(Horas_estudo),
            Média = round(mean(Horas_estudo),2), Desvio_padrão = round(sd(Horas_estudo),1))%>% 
  flextable()%>% 
  theme_tron_legacy()

Trabalha	Mínimo	Primeiro_quartil	Mediana	Terceiro_quartil	Máximo	Média	Desvio_padrão
Não trabalha	20	28.0	30	35.0	60	31.56	6.9
Trabalha	19	24.8	30	33.5	59	29.36	7.7

Gráfico

boxplot(QE$Horas_estudo ~ QE$Trabalha, ylab = "Horas de estudo", xlab = "Trabalha?", main = "Gráfico de comparação das horas de estudo com trabalho", col = c("darkgreen", "green"))

Análise de dados

A diferença é em média 2 horas de estudo a menos para quem trabalha, com desvio padrão de aproximadamente 1. Podemos concluir que o trabalho afeta pouco as horas de estudo dos alunos. Novamente é recomendado manter o status quo.

“Quem namora tem menos horas de estudo?”/ ggplot

QE %>% select(Namorado_a,Horas_estudo) %>%
  ggplot(aes(x=Namorado_a, y = Horas_estudo)) +
  geom_boxplot(fill = c("darkred", "skyblue")) + 
  labs (x = "Tem namorado(a)?", y = "Horas de estudo",
  title = "Gráfico horas de estudo x Namorar", caption = "Fonte: Questionario estresse, processamento: Pedro Gonçalves da Cunha") +
  coord_flip() +
  theme_fivethirtyeight()

Desempenho por turma

QE %>% select(Turma, Desempenho)%>%
  ggplot(x = Turma, y = Desempenho)+
  geom_density_ridges(aes(y = Turma, x = Desempenho, group = Turma, fill = Turma))

———————————————————-

Mapas de analfabetismo, idh e expectativa de vida

mapa = read_state()

## 
  |                                                                            
  |                                                                      |   0%
  |                                                                            
  |===                                                                   |   4%
  |                                                                            
  |=====                                                                 |   7%
  |                                                                            
  |========                                                              |  11%
  |                                                                            
  |==========                                                            |  15%
  |                                                                            
  |=============                                                         |  19%
  |                                                                            
  |================                                                      |  22%
  |                                                                            
  |==================                                                    |  26%
  |                                                                            
  |=====================                                                 |  30%
  |                                                                            
  |=======================                                               |  33%
  |                                                                            
  |==========================                                            |  37%
  |                                                                            
  |=============================                                         |  41%
  |                                                                            
  |===============================                                       |  44%
  |                                                                            
  |==================================                                    |  48%
  |                                                                            
  |====================================                                  |  52%
  |                                                                            
  |=======================================                               |  56%
  |                                                                            
  |=========================================                             |  59%
  |                                                                            
  |============================================                          |  63%
  |                                                                            
  |===============================================                       |  67%
  |                                                                            
  |=================================================                     |  70%
  |                                                                            
  |====================================================                  |  74%
  |                                                                            
  |======================================================                |  78%
  |                                                                            
  |=========================================================             |  81%
  |                                                                            
  |============================================================          |  85%
  |                                                                            
  |==============================================================        |  89%
  |                                                                            
  |=================================================================     |  93%
  |                                                                            
  |===================================================================   |  96%
  |                                                                            
  |======================================================================| 100%

dados_mais_mapas = mapa %>% left_join(BasesEstados)

Mapa de IDH

dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = IDH)) + scale_fill_distiller(palette = "Greens", direction = 1, name = "IDH", limits = c(0.6, 1))

Mapa de analfabetismo

dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = Taxa_analfabetismo)) + scale_fill_distiller(palette = "Oranges", direction = 1, name = "Taxa de analfabetismo", limits = c(4, 31))

Mapa de esperança de vida

dados_mais_mapas %>% ggplot() + geom_sf(aes(fill = Esperancadevida)) + scale_fill_distiller(palette = "Reds", direction = 1, name = "Esperança de vida ao nascer", limits = c(70, 78))

Mapa watercolor

leaflet() %>% addTiles() %>% addMarkers(lng = -43.17351628758103, lat = -22.952349148822705, popup = "UNIRIO") %>% addProviderTiles(providers$Stamen.Watercolor)

Aula 05

Pedro Gonçalves da Cunha

2023-05-03

Carregando bibliotecas

Carregamos as bibliotecas dplyr, flextable, redaxl, ggplot2, ggthemes, ggridges, geobr e leaflet.

Variável qualitativa x Variável quantitativa

Importando base de dados

Limpeza de dados

Questões de pesquisa

O trabalho tem impacto no desempenho?

Gráfico

Análise dos dados

O trabalho tem impacto nas horas de estudo?

Gráfico

Análise de dados

“Quem namora tem menos horas de estudo?”/ ggplot

Desempenho por turma

———————————————————-

Mapas de analfabetismo, idh e expectativa de vida

Mapa de IDH

Mapa de analfabetismo

Mapa de esperança de vida

Mapa watercolor