1ª ETAPA: IMPORTAÇÃO DE UM BANDO DE DADOS

library(readxl)
Bussab <- read_excel("C:/Users/rioch/Desktop/Base_de_dados-master/Bussab.xlsx")
View(Bussab)

ESTUDO ALFA

2ª ETAPA: DEFINIÇÃO DA HIPÓTESE DE *** Estudo Alfa***: O número de filhos tem relação com o estado civil dos pesquisados?

ifelse(Bussab$Casado==0,"Não","Sim")
##  [1] "Não" "Sim" "Sim" "Não" "Não" "Sim" "Não" "Não" "Sim" "Não" "Sim" "Não"
## [13] "Não" "Sim" "Sim" "Não" "Sim" "Sim" "Não" "Não" "Sim" "Não" "Não" "Sim"
## [25] "Sim" "Sim" "Não" "Sim" "Sim" "Sim" "Não" "Sim" "Sim" "Não" "Sim" "Sim"

3ª ETAPA: ANÁLISE DOS DADOS

Usando o comando tabela, relaciona-se as variáveis “Casados”(estado civil) e “Filhos” Foram usados os comandos de arredondamento (“round”), formação de tabela (“table”), proporcionalidade (“prop”) nas linhas e colunas.
tabela_1_estadocivilxfilhos = table(Bussab$Casado,Bussab$Filhos)
tabela_1_estadocivilxfilhos
##    
##     0 1 2 3 5
##   0 0 0 0 0 0
##   1 4 5 7 3 1
round(prop.table(tabela_1_estadocivilxfilhos,1)* 100,2)
##    
##       0   1   2   3   5
##   0                    
##   1  20  25  35  15   5
round(prop.table(tabela_1_estadocivilxfilhos,2)* 100,2)
##    
##       0   1   2   3   5
##   0   0   0   0   0   0
##   1 100 100 100 100 100

Nessa etapa, utilizou-se o comando (“pipe”)

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)

Tabela2 = Bussab %>% select(Casado,Filhos)%>%
  table ()%>% prop.table(1)*100 

Tabela2%>%data.frame() %>% flextable()

Casado

Filhos

Freq

0

0

1

0

20

0

1

1

1

25

0

2

1

2

35

0

3

1

3

15

0

5

1

5

5

Agora serão gerados os gráficos requeridos nesta atividade com os respectivos comandos.

barplot(Tabela2)

barplot(Tabela2,beside = TRUE)

barplot(Tabela2,beside = TRUE, col = c("pink","yellow"))

barplot(Tabela2,beside = TRUE, col = c("pink","yellow"),
        legend.text = rownames(Tabela2),
        args.legend = list(x = "top"),
        main="Proporção de Quantidade de Filhos em 
        Relação ao Estado Civil dos Entrevistados (%)",
        ylim=c(0,100))

Os dados foram resumidos, com posterior geração da média aritmética e desvio padrão das variáveis.

Bussab %>% select (Casado, Filhos) %>%
  group_by(Casado)%>% summarise(nota_media = mean(Filhos),desvio_padrao=sd(Filhos)) %>% flextable()%>% theme_tron()

Casado

nota_media

desvio_padrao

0

1

1.65

1.268028

ESTUDO BRAVO

1ª ETAPA: DEFINIÇÃO DA HIPÓTESE DO Estudo Bravo: O número de filhos tem relação com a renda dos pesquisados?

TRANSFORMAÇÃO DE VARIÁVEL QUANTITATIVA EM VARIÁVEL QUALITATIVA.

ifelse(Bussab$Casado==0,"Não","Sim")
##  [1] "Não" "Sim" "Sim" "Não" "Não" "Sim" "Não" "Não" "Sim" "Não" "Sim" "Não"
## [13] "Não" "Sim" "Sim" "Não" "Sim" "Sim" "Não" "Não" "Sim" "Não" "Não" "Sim"
## [25] "Sim" "Sim" "Não" "Sim" "Sim" "Sim" "Não" "Sim" "Sim" "Não" "Sim" "Sim"

2ª ETAPA: ANÁLISE DOS DADOS

Usando o comando tabela, relaciona-se as variáveis “Casados”(estado civil) e “Filhos”

Foram usados os comandos de arredondamento (“round”), formação de tabela (“table”), proporcionalidade (“prop”) nas linhas e colunas.

tabela_2_rendaxfilhos = table(Bussab$Casado,Bussab$Filhos)
tabela_2_rendaxfilhos
##    
##     0 1 2 3 5
##   0 0 0 0 0 0
##   1 4 5 7 3 1
round(prop.table(tabela_2_rendaxfilhos,1)* 100,2)
##    
##       0   1   2   3   5
##   0                    
##   1  20  25  35  15   5
round(prop.table(tabela_2_rendaxfilhos,2)* 100,2)
##    
##       0   1   2   3   5
##   0   0   0   0   0   0
##   1 100 100 100 100 100

Nessa etapa, utilizou-se o comando (“pipe”).

library(dplyr)
library(flextable)

Tabela3 = Bussab %>% select(Renda,Filhos)%>%
  table ()%>% prop.table(1)*100 

Tabela3%>%data.frame() %>% flextable()

Renda

Filhos

Freq

4

0

4.56

0

0

5.25

0

0

5.73

0

6.26

0

6.66

0

100

6.86

0

7.39

0

7.44

0

7.59

0

0

8.12

0

0

8.46

0

8.74

0

8.95

0

0

9.13

0

100

9.35

0

9.77

0

0

9.8

0

0

10.53

0

10.76

0

11.06

0

0

11.59

0

12

0

12.79

0

100

13.23

0

0

13.6

0

0

13.85

0

14.69

0

100

14.71

0

0

15.99

0

0

16.22

0

16.61

0

0

17.26

0

0

18.75

0

19.4

0

0

23.3

0

0

4

1

4.56

1

100

5.25

1

0

5.73

1

6.26

1

6.66

1

0

6.86

1

7.39

1

7.44

1

7.59

1

100

8.12

1

0

8.46

1

8.74

1

8.95

1

0

9.13

1

0

9.35

1

9.77

1

100

9.8

1

0

10.53

1

10.76

1

11.06

1

100

11.59

1

12

1

12.79

1

0

13.23

1

0

13.6

1

0

13.85

1

14.69

1

0

14.71

1

0

15.99

1

0

16.22

1

16.61

1

100

17.26

1

0

18.75

1

19.4

1

0

23.3

1

0

4

2

4.56

2

0

5.25

2

100

5.73

2

6.26

2

6.66

2

0

6.86

2

7.39

2

7.44

2

7.59

2

0

8.12

2

100

8.46

2

8.74

2

8.95

2

0

9.13

2

0

9.35

2

9.77

2

0

9.8

2

100

10.53

2

10.76

2

11.06

2

0

11.59

2

12

2

12.79

2

0

13.23

2

100

13.6

2

100

13.85

2

14.69

2

0

14.71

2

0

15.99

2

100

16.22

2

16.61

2

0

17.26

2

0

18.75

2

19.4

2

100

23.3

2

0

4

3

4.56

3

0

5.25

3

0

5.73

3

6.26

3

6.66

3

0

6.86

3

7.39

3

7.44

3

7.59

3

0

8.12

3

0

8.46

3

8.74

3

8.95

3

100

9.13

3

0

9.35

3

9.77

3

0

9.8

3

0

10.53

3

10.76

3

11.06

3

0

11.59

3

12

3

12.79

3

0

13.23

3

0

13.6

3

0

13.85

3

14.69

3

0

14.71

3

0

15.99

3

0

16.22

3

16.61

3

0

17.26

3

100

18.75

3

19.4

3

0

23.3

3

100

4

5

4.56

5

0

5.25

5

0

5.73

5

6.26

5

6.66

5

0

6.86

5

7.39

5

7.44

5

7.59

5

0

8.12

5

0

8.46

5

8.74

5

8.95

5

0

9.13

5

0

9.35

5

9.77

5

0

9.8

5

0

10.53

5

10.76

5

11.06

5

0

11.59

5

12

5

12.79

5

0

13.23

5

0

13.6

5

0

13.85

5

14.69

5

0

14.71

5

100

15.99

5

0

16.22

5

16.61

5

0

17.26

5

0

18.75

5

19.4

5

0

23.3

5

0

Agora serão gerados os gráficos requeridos neste atividade com os respectivos comandos.

barplot(Tabela3)

barplot(Tabela3,beside = TRUE)

barplot(Tabela3,beside = TRUE, col = c("grey","green"))

barplot(Tabela2,beside = TRUE, col = c("grey","green"),
        legend.text = rownames(Tabela3),
        args.legend = list(x = "top"),
        main="Proporção de Quantidade de Filhos em 
        Relação à Renda dos Entrevistados (%)",
        ylim=c(0,100))

Os dados foram resumidos, com posterior geração da média aritmética e desvio padrão das variáveis.

Bussab %>% select (Renda, Filhos) %>%
  group_by(Renda)%>% summarise(nota_media = mean(Filhos),desvio_padrao=sd(Filhos)) %>% flextable()%>% theme_vader()

Renda

nota_media

desvio_padrao

4.00

4.56

1

5.25

2

5.73

6.26

6.66

0

6.86

7.39

7.44

7.59

1

8.12

2

8.46

8.74

8.95

3

9.13

0

9.35

9.77

1

9.80

2

10.53

10.76

11.06

1

11.59

12.00

12.79

0

13.23

2

13.60

2

13.85

14.69

0

14.71

5

15.99

2

16.22

16.61

1

17.26

3

18.75

19.40

2

23.30

3

CONCLUSÃO

É POSSÍVEL CONCLUIR APÓS TRATAMENTO E ANÁLISE DOS DADOS OBTIDOS QUE O NÚMERO DE FILHOS POR ENTREVISTADO ESTÁ DIRETAMENTE PROPORCIAL AO ESTADO CIVIL, MAS NÃO EM RELAÇÃO A REMUNERAÇÃO DOS MESMOS.