Carregar a base de dados:
library(readxl)
## Warning: pacote 'readxl' foi compilado no R versão 4.4.1
Questionario_Estresse <- read_excel("C:/Users/furta/OneDrive/Base_de_dados-master/Questionario_Estresse.xls")
Inspecionar:
head(Questionario_Estresse)
## # A tibble: 6 × 10
## Aluno Turma Mora_pais RJ Namorado_a Trabalha Desempenho Estresse Créditos
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 1 2 2 2 2 8.89 23 27
## 2 2 1 1 1 2 2 8.8 24 28
## 3 3 1 2 2 2 2 8 25 25
## 4 4 1 2 2 1 1 8.8 38 21
## 5 5 1 2 2 2 1 8.9 41 18
## 6 6 1 2 2 1 1 8.1 25 29
## # ℹ 1 more variable: Horas_estudo <dbl>
Limpar a base de dados:
Questionario_Estresse$Mora_pais = ifelse(Questionario_Estresse$Mora_pais==1, "Sim", "Não")
Questionario_Estresse$RJ = ifelse(Questionario_Estresse$RJ==1, "Sim", "Não")
Questionario_Estresse$Namorado_a = ifelse(Questionario_Estresse$Namorado_a==1, "Sim", "Não")
Questionario_Estresse$Trabalha = ifelse(Questionario_Estresse$Trabalha==1, "Sim", "Não")
table(Questionario_Estresse$Turma)
##
## 1 2 3
## 28 32 35
Questionario_Estresse$Turma = ifelse(Questionario_Estresse$Turma==1, "Turma 1", ifelse(Questionario_Estresse$Turma==2, "Turma 2", "Turma 3"))
Análise de dados:
summary(Questionario_Estresse)
## Aluno Turma Mora_pais RJ
## Min. : 1.0 Length:95 Length:95 Length:95
## 1st Qu.:24.5 Class :character Class :character Class :character
## Median :48.0 Mode :character Mode :character Mode :character
## Mean :48.0
## 3rd Qu.:71.5
## Max. :95.0
##
## Namorado_a Trabalha Desempenho Estresse
## Length:95 Length:95 Min. :5.820 Min. :12.00
## Class :character Class :character 1st Qu.:8.500 1st Qu.:22.50
## Mode :character Mode :character Median :8.700 Median :27.00
## Mean :8.594 Mean :27.82
## 3rd Qu.:9.050 3rd Qu.:33.00
## Max. :9.700 Max. :44.00
##
## Créditos Horas_estudo
## Min. :15.00 Min. :19.00
## 1st Qu.:23.00 1st Qu.:25.00
## Median :24.00 Median :30.00
## Mean :24.95 Mean :30.73
## 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :49.00 Max. :60.00
## NA's :1
Análise com duas variáveis (Quanti vs Quali)
library(dplyr)
## Warning: pacote 'dplyr' foi compilado no R versão 4.4.1
##
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
##
## filter, lag
## Os seguintes objetos são mascarados por 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
## Warning: pacote 'flextable' foi compilado no R versão 4.4.1
Questionario_Estresse %>% group_by(Turma) %>% summarise(média=mean(Desempenho), desvio_padrao=sd(Desempenho))
## # A tibble: 3 × 3
## Turma média desvio_padrao
## <chr> <dbl> <dbl>
## 1 Turma 1 8.61 0.441
## 2 Turma 2 8.71 0.663
## 3 Turma 3 8.47 1.04
Questionario_Estresse %>% group_by(Turma) %>% summarise(minimo=min(Desempenho),
quartil1 = quantile(Desempenho, probs = 0.25),
mediana=median(Desempenho),
quartil3 = quantile(Desempenho, probs = 0.75),
máximo=max(Desempenho)) %>%
flextable() %>% theme_vader()
Turma | minimo | quartil1 | mediana | quartil3 | máximo |
|---|---|---|---|---|---|
Turma 1 | 7.50 | 8.50 | 8.515 | 8.8925 | 9.4 |
Turma 2 | 5.90 | 8.50 | 8.845 | 9.0750 | 9.5 |
Turma 3 | 5.82 | 8.25 | 8.700 | 9.3000 | 9.7 |
Podemos gerar uma visualização dessas estatísticas?
BLOXPLOT
boxplot(Desempenho ~ Turma, data = Questionario_Estresse)
boxplot(Desempenho ~ Turma, data = Questionario_Estresse, col= "tomato2",main= "Gráfico 1 - boxplot do desempenho por turmas")
library(ggplot2)
## Warning: pacote 'ggplot2' foi compilado no R versão 4.4.1
library(ggthemes)
## Warning: pacote 'ggthemes' foi compilado no R versão 4.4.1
Questionario_Estresse %>% ggplot() + aes(x=Turma,y=Desempenho)+
geom_boxplot(fill="tomato2") + theme_solarized()
Devemos impedir os alunos de trabalhar? Devemos impedir o namoro na escola?
Varíavel resposta Horas de estudo e desempenho
Variáveis explicativas Trabalha e Namora
table(Questionario_Estresse$Trabalha)
##
## Não Sim
## 59 36
table(Questionario_Estresse$Namorado_a)
##
## Não Sim
## 48 47
Questionario_Estresse %>% ggplot() + aes(x=Trabalha,y=Desempenho)+
geom_boxplot(fill="tomato2") + theme_solarized()
Questionario_Estresse %>% ggplot() + aes(x=Namorado_a,y=Desempenho)+
geom_boxplot(fill="tomato2") + theme_solarized()
Questionario_Estresse %>% ggplot() + aes(x=Horas_estudo,y=Desempenho)+
geom_boxplot(fill="tomato2") + theme_solarized()
## Warning: Continuous x aesthetic
## ℹ did you forget `aes(group = ...)`?
Recomendação de politica pública Não fazer nada. Deixar o pessoal trabalhar, se quiser! # ———————————————————————————
library(reactable)
## Warning: pacote 'reactable' foi compilado no R versão 4.4.1
Questionario_Estresse %>% select(Namorado_a, Horas_estudo, Desempenho) %>%
group_by(Namorado_a) %>%
summarise(média_horas = round(mean(Horas_estudo),1),
dp_horas=round(sd(Horas_estudo),1),
media_nota=round(mean(Desempenho),1)) %>% reactable()
Questionario_Estresse %>% ggplot()+ aes(x=Namorado_a,y=Desempenho)+
geom_boxplot(fill="skyblue")+
theme_solarized()+coord_flip()+
labs(tittle="BoxPlot",
subtitle = "do desempenho do aluno por namora",
x= "Namora", "Nota do aluno",
caption = "fonte dos dados: base de questionario")
# ———————————————————————————
library(dplyr)
library(readxl)
library(geobr)
## Warning: pacote 'geobr' foi compilado no R versão 4.4.1
## Carregando namespace exigido: sf
library(ggplot2)
BasesEstados <- read_excel("C:/Users/furta/OneDrive/Base_de_dados-master/BasesEstados.xlsx")
mapa_estados = read_state()
## Using year/date 2010
class(BasesEstados)
## [1] "tbl_df" "tbl" "data.frame"
class(mapa_estados)
## [1] "sf" "data.frame"
plot(mapa_estados)
BasesEstados$code_state = BasesEstados$Codigo
class(BasesEstados$code_state)
## [1] "character"
class(mapa_estados$code_state)
## [1] "numeric"
BasesEstados$code_state = as.numeric(BasesEstados$code_state)
dados_para_mapa = mapa_estados %>% left_join(BasesEstados)
## Joining with `by = join_by(code_state)`
ggplot()+
geom_sf(data=dados_para_mapa, aes(fill=IDH)) +
scale_fill_distiller(palette = "Reds",
direction = 1, name = "IDH",
limits= c(0.6,1))
summary(dados_para_mapa$Renda_per_capita)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 360.3 509.4 599.0 697.0 813.2 1715.1
ggplot()+
geom_sf(data=dados_para_mapa, aes(fill=Renda_per_capita)) +
scale_fill_distiller(palette = "Purples",
direction = 1, name = "Renda Per Carpita",
limits= c(359,1716))
library(leaflet)
## Warning: pacote 'leaflet' foi compilado no R versão 4.4.1
dados_para_mapa %>%
leaflet() %>% addTiles() %>%
addPolygons(
fillColor = ~colorQuantile("Blues", IDH)(IDH))
## Warning: sf layer has inconsistent datum (+proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs).
## Need '+proj=longlat +datum=WGS84'