Carregar a base de dados:

library(readxl)
## Warning: pacote 'readxl' foi compilado no R versão 4.4.1
Questionario_Estresse <- read_excel("C:/Users/furta/OneDrive/Base_de_dados-master/Questionario_Estresse.xls")

Inspecionar:

head(Questionario_Estresse)
## # A tibble: 6 × 10
##   Aluno Turma Mora_pais    RJ Namorado_a Trabalha Desempenho Estresse Créditos
##   <dbl> <dbl>     <dbl> <dbl>      <dbl>    <dbl>      <dbl>    <dbl>    <dbl>
## 1     1     1         2     2          2        2       8.89       23       27
## 2     2     1         1     1          2        2       8.8        24       28
## 3     3     1         2     2          2        2       8          25       25
## 4     4     1         2     2          1        1       8.8        38       21
## 5     5     1         2     2          2        1       8.9        41       18
## 6     6     1         2     2          1        1       8.1        25       29
## # ℹ 1 more variable: Horas_estudo <dbl>

Limpar a base de dados:

Questionario_Estresse$Mora_pais = ifelse(Questionario_Estresse$Mora_pais==1, "Sim", "Não")
Questionario_Estresse$RJ = ifelse(Questionario_Estresse$RJ==1, "Sim", "Não")
Questionario_Estresse$Namorado_a = ifelse(Questionario_Estresse$Namorado_a==1, "Sim", "Não")
Questionario_Estresse$Trabalha = ifelse(Questionario_Estresse$Trabalha==1, "Sim", "Não")
table(Questionario_Estresse$Turma)
## 
##  1  2  3 
## 28 32 35
Questionario_Estresse$Turma = ifelse(Questionario_Estresse$Turma==1, "Turma 1", ifelse(Questionario_Estresse$Turma==2, "Turma 2", "Turma 3"))

Análise de dados:

summary(Questionario_Estresse)
##      Aluno         Turma            Mora_pais              RJ           
##  Min.   : 1.0   Length:95          Length:95          Length:95         
##  1st Qu.:24.5   Class :character   Class :character   Class :character  
##  Median :48.0   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :48.0                                                           
##  3rd Qu.:71.5                                                           
##  Max.   :95.0                                                           
##                                                                         
##   Namorado_a          Trabalha           Desempenho       Estresse    
##  Length:95          Length:95          Min.   :5.820   Min.   :12.00  
##  Class :character   Class :character   1st Qu.:8.500   1st Qu.:22.50  
##  Mode  :character   Mode  :character   Median :8.700   Median :27.00  
##                                        Mean   :8.594   Mean   :27.82  
##                                        3rd Qu.:9.050   3rd Qu.:33.00  
##                                        Max.   :9.700   Max.   :44.00  
##                                                                       
##     Créditos      Horas_estudo  
##  Min.   :15.00   Min.   :19.00  
##  1st Qu.:23.00   1st Qu.:25.00  
##  Median :24.00   Median :30.00  
##  Mean   :24.95   Mean   :30.73  
##  3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :49.00   Max.   :60.00  
##  NA's   :1

Análise com duas variáveis (Quanti vs Quali)

library(dplyr)
## Warning: pacote 'dplyr' foi compilado no R versão 4.4.1
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
## Warning: pacote 'flextable' foi compilado no R versão 4.4.1
Questionario_Estresse %>% group_by(Turma) %>% summarise(média=mean(Desempenho), desvio_padrao=sd(Desempenho))
## # A tibble: 3 × 3
##   Turma   média desvio_padrao
##   <chr>   <dbl>         <dbl>
## 1 Turma 1  8.61         0.441
## 2 Turma 2  8.71         0.663
## 3 Turma 3  8.47         1.04
Questionario_Estresse %>% group_by(Turma) %>% summarise(minimo=min(Desempenho),
                                                        quartil1 = quantile(Desempenho, probs = 0.25), 
                                                        mediana=median(Desempenho),
                                                        quartil3 = quantile(Desempenho, probs = 0.75),
                                                        máximo=max(Desempenho)) %>%
flextable() %>% theme_vader()

Turma

minimo

quartil1

mediana

quartil3

máximo

Turma 1

7.50

8.50

8.515

8.8925

9.4

Turma 2

5.90

8.50

8.845

9.0750

9.5

Turma 3

5.82

8.25

8.700

9.3000

9.7

Podemos gerar uma visualização dessas estatísticas?

BLOXPLOT

boxplot(Desempenho ~ Turma, data = Questionario_Estresse)

boxplot(Desempenho ~ Turma, data = Questionario_Estresse, col= "tomato2",main= "Gráfico 1 - boxplot do desempenho por turmas")

library(ggplot2)
## Warning: pacote 'ggplot2' foi compilado no R versão 4.4.1
library(ggthemes)
## Warning: pacote 'ggthemes' foi compilado no R versão 4.4.1
Questionario_Estresse %>% ggplot() + aes(x=Turma,y=Desempenho)+
  geom_boxplot(fill="tomato2") + theme_solarized()

Devemos impedir os alunos de trabalhar? Devemos impedir o namoro na escola?

Varíavel resposta Horas de estudo e desempenho

Variáveis explicativas Trabalha e Namora

table(Questionario_Estresse$Trabalha)
## 
## Não Sim 
##  59  36
table(Questionario_Estresse$Namorado_a)
## 
## Não Sim 
##  48  47
Questionario_Estresse %>% ggplot() + aes(x=Trabalha,y=Desempenho)+
  geom_boxplot(fill="tomato2") + theme_solarized()

Questionario_Estresse %>% ggplot() + aes(x=Namorado_a,y=Desempenho)+
  geom_boxplot(fill="tomato2") + theme_solarized()

Questionario_Estresse %>% ggplot() + aes(x=Horas_estudo,y=Desempenho)+
  geom_boxplot(fill="tomato2") + theme_solarized()
## Warning: Continuous x aesthetic
## ℹ did you forget `aes(group = ...)`?

Recomendação de politica pública Não fazer nada. Deixar o pessoal trabalhar, se quiser! # ———————————————————————————

library(reactable)
## Warning: pacote 'reactable' foi compilado no R versão 4.4.1
Questionario_Estresse %>% select(Namorado_a, Horas_estudo, Desempenho) %>%
  group_by(Namorado_a) %>%
  summarise(média_horas = round(mean(Horas_estudo),1),
            dp_horas=round(sd(Horas_estudo),1),
            media_nota=round(mean(Desempenho),1)) %>% reactable()
Questionario_Estresse %>% ggplot()+ aes(x=Namorado_a,y=Desempenho)+
  geom_boxplot(fill="skyblue")+
  theme_solarized()+coord_flip()+
  labs(tittle="BoxPlot",
       subtitle = "do desempenho do aluno por namora",
       x= "Namora", "Nota do aluno",
       caption = "fonte dos dados: base de questionario")

# ———————————————————————————

library(dplyr)
library(readxl)
library(geobr)
## Warning: pacote 'geobr' foi compilado no R versão 4.4.1
## Carregando namespace exigido: sf
library(ggplot2)
BasesEstados <- read_excel("C:/Users/furta/OneDrive/Base_de_dados-master/BasesEstados.xlsx")

mapa_estados = read_state()
## Using year/date 2010
class(BasesEstados)
## [1] "tbl_df"     "tbl"        "data.frame"
class(mapa_estados)
## [1] "sf"         "data.frame"
plot(mapa_estados)

BasesEstados$code_state = BasesEstados$Codigo

class(BasesEstados$code_state)
## [1] "character"
class(mapa_estados$code_state)
## [1] "numeric"
BasesEstados$code_state = as.numeric(BasesEstados$code_state)


dados_para_mapa = mapa_estados %>% left_join(BasesEstados)
## Joining with `by = join_by(code_state)`
ggplot()+
  geom_sf(data=dados_para_mapa, aes(fill=IDH)) +
  scale_fill_distiller(palette = "Reds",
                       direction = 1, name = "IDH",
                       limits= c(0.6,1))

summary(dados_para_mapa$Renda_per_capita)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   360.3   509.4   599.0   697.0   813.2  1715.1
ggplot()+
  geom_sf(data=dados_para_mapa, aes(fill=Renda_per_capita)) +
  scale_fill_distiller(palette = "Purples",
                       direction = 1, name = "Renda Per Carpita",
                       limits= c(359,1716))

library(leaflet)
## Warning: pacote 'leaflet' foi compilado no R versão 4.4.1
dados_para_mapa %>%
  leaflet() %>% addTiles() %>%
  addPolygons(
    fillColor = ~colorQuantile("Blues", IDH)(IDH))
## Warning: sf layer has inconsistent datum (+proj=longlat +ellps=GRS80 +towgs84=0,0,0,0,0,0,0 +no_defs).
## Need '+proj=longlat +datum=WGS84'