# Bibliotecas
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3
library(flextable)
## Warning: package 'flextable' was built under R version 4.2.3
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readxl)
Bussab <- read_excel("C:/Users/10552356123/Desktop/Base_de_dados-master/Bussab.xlsx")
View(Bussab)

Questão de pesquisa

A procedencia tem impacto na renda?

A procedencia tem impacto nos filhos?

A Procedencia tem impacto na idade?

Tem mais casados na capital ou no interior?

Variáveis resposta: renda, filhos e idade (quantitativa)

Variáveis explicativas: Procedencia, casado (qualitativas)

Bussab %>% group_by(Proced) %>% 
  summarise(média=round(mean(Renda),2), 
            desvio_padrão=round(sd(Renda),2)) %>%
  flextable() %>% theme_tron_legacy()

Proced

média

desvio_padrão

Capital

11.46

5.48

Interior

11.55

5.30

Outro

10.45

3.15

Bussab %>% group_by(Proced) %>% 
  summarise(mínimo=min(Renda),
            Quartil_1=quantile(Renda,0.25),
            mediana =median(Renda),
            Quartil_3 = quantile(Renda,0.75),
            máximo = max(Renda)) %>%
  flextable() %>% theme_tron_legacy()

Proced

mínimo

Quartil_1

mediana

Quartil_3

máximo

Capital

4.56

7.490

9.770

16.625

19.40

Interior

4.00

7.805

10.645

14.695

23.30

Outro

5.73

8.740

9.800

12.790

16.22

A diferença de renda de quem mora no interior e quem mora na capital é de aproximadamente 5,6 e o desvio padrão está entre 5.48 e 5.30, uma diferença não considerável.

A distribuição de renda é mais ou menos equitativa sem grandes diferenças no salario entre diferentes regiões.

Bussab %>% group_by(Proced) %>% 
  summarise(
    média_Idade=round(mean(Idade),2), 
    desvio_padrão_Idade=round(sd(Idade),2),
    média_he=round(mean(Filhos),2), 
    desvio_padrão_he=round(sd(Filhos),2)) %>%
  flextable() %>% theme_tron_legacy()

Proced

média_Idade

desvio_padrão_Idade

média_he

desvio_padrão_he

Capital

36.55

6.22

Interior

33.58

5.82

Outro

35.15

8.02

A média de idade dos que moram na capital é 36.55 e a média dos que moram no interior é 33.58, o desvião padrão está entre 6.22 e 5.82, uma diferença de idade de quarenta centésimos.

Bussab %>% group_by(Proced) %>% 
  summarise(
    média_Casado=round(mean(Casado),2), 
    desvio_padrão_Casado=round(sd(Casado),2)) %>%
  flextable() %>% bg(bg = "skyblue", part = "all") %>%
  set_caption("Dados: trabalho, processamento: @juan ")
Dados: trabalho, processamento: @juan

Proced

média_Casado

desvio_padrão_Casado

Capital

0.64

0.50

Interior

0.67

0.49

Outro

0.38

0.51

boxplot(Bussab$Casado ~  Bussab$Proced,
        col=c("#00FF00","#8A2BE2"),
        main='Gráfico 1 - Boxplot de casado',
        ylab = "Casado",
        xlab = "Procedencia?")

Com base no gráfico diriamos que existe mais ou menos a mesma quantidade de pessoas casadas no interior e na capital, a diferença é muito pequena entre essas duas regiões em relação ao número de casados, uma diferençã que quase não se reflete no gráfico.