Introdução

A base de dados Chile.RData tem os dados de um survey respondido por homens e mulheres que votariam no Plesbicito Nacional do Chile de 1988, no qual estava em pauta o futuro de Augusto Pinochet e da Ditadura Militar chilena. A população tinha que votar a favor da continuação de Pinochet no governo ou contra. Também havia a opção de se abster.

Carregamento da base de dados

load("C:/Users/Maria Clara Queiroz/Downloads/Base_de_dados-master/chile/Chile.RData")

Carregamento das bibliotecas

# Bibliotecas:

library(readxl)
library(flextable)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)

Limpeza de dados

# Limpeza de dados

### Região
Chile$region = ifelse(Chile$region == "C", "Central", ifelse(Chile$region == "M", "Reg.Metropolitana Santiago", ifelse(Chile$region == "N", "Norte", ifelse(Chile$region == "S", "Sul", "Cidade de Santiago"))))

### Educação
Chile$education = ifelse(Chile$education == "P", "Primária", ifelse(Chile$education=="PS", "Pós-Secundária", "Secundária"))

### Sexo
Chile$sex = ifelse(Chile$sex == "M", "Masculino", "Feminino")

# Voto
Chile$vote = ifelse(Chile$vote == "N", "Não", ifelse(Chile$vote == "U", "Não decidiu", ifelse(Chile$vote == "A", "Abtstenção", "Sim")))

tab_Chile = na.omit(Chile)
Criação de tabelas de cada variável que será utilizada
# Criação de tabelas

#### Educação

tabelaedu = table(Chile$education)

#### Sexo

tabelasex = table(Chile$sex)

#### Região

tabelareg = table(Chile$region)

#### Income (Salário)

tabelasal = table(Chile$income)

#### Voto
tabelavoto = table(Chile$vote)
#### Idade
tabelaidade = table(Chile$age)

Tabelas para análise:

De variáveis qualitativas:

Sexo x Voto

Tabela para analisar se houve uma grande diferença de votos a partir do sexo do eleitor.

tabelasexvoto = table(Chile$sex, Chile$vote)
tabelasexvoto
##            
##             Abtstenção Não Não decidiu Sim
##   Feminino         104 363         362 480
##   Masculino         83 526         226 388

Educação x Voto

Tabela para analisar se há relação entre o voto e a escolaridade dos eleitores.

tabelaeduvoto = table(Chile$education, Chile$vote)
tabelaeduvoto
##                 
##                  Abtstenção Não Não decidiu Sim
##   Pós-Secundária         32 224          52 130
##   Primária               52 266         296 422
##   Secundária            103 397         237 311

De variáveis qualitativas e quantitativas

Sexo x Salário

Chile %>% group_by(sex) %>%
  summarise(média=round(mean(income, na.rm = T),2),
            desvio_padrão=round(sd(income, na.rm = T),2),
            mínimo=min(income, na.rm = T),
            Quartil_1=quantile(income,0.25, na.rm = T),
            mediana=median(income, na.rm = T),
            Quartil_3=quantile(income,0.75, na.rm = T),
            máximo=max(income, na.rm = T)) %>%
  flextable() %>% theme_vanilla()

sex

média

desvio_padrão

mínimo

Quartil_1

mediana

Quartil_3

máximo

Feminino

32,041.01

39,695.12

2,500

7,500

15,000

35,000

200,000

Masculino

35,791.44

39,225.21

2,500

15,000

15,000

35,000

200,000

Salário x Voto

Tabela para analisar se há relação entre o salário e o voto dos eleitores

Chile %>% group_by(vote) %>%
  summarise(média=round(mean(income, na.rm = T),2),
            desvio_padrão=round(sd(income, na.rm = T),2),
            mínimo=min(income, na.rm = T),
            Quartil_1=quantile(income,0.25, na.rm = T),
            mediana=median(income, na.rm = T),
            Quartil_3=quantile(income,0.75, na.rm = T),
            máximo=max(income, na.rm = T)) %>%
  flextable() %>% theme_vanilla()

vote

média

desvio_padrão

mínimo

Quartil_1

mediana

Quartil_3

máximo

Abtstenção

33,184.36

34,087.00

2,500

15,000

15,000

35,000

200,000

Não

37,031.07

41,658.14

2,500

15,000

15,000

35,000

200,000

Não decidiu

25,683.04

28,740.56

2,500

7,500

15,000

35,000

200,000

Sim

36,495.24

43,974.95

2,500

7,500

15,000

35,000

200,000

32,352.94

36,908.98

2,500

15,000

15,000

35,000

200,000

Idade x Voto

Chile %>% group_by(vote) %>%
  summarise(média=round(mean(age, na.rm = T),2),
            desvio_padrão=round(sd(age, na.rm = T),2),
            mínimo=min(age, na.rm = T),
            Quartil_1=quantile(age,0.25, na.rm = T),
            mediana=median(age, na.rm = T),
            Quartil_3=quantile(age,0.75, na.rm = T),
            máximo=max(age, na.rm = T)) %>%
  flextable() %>% theme_vanilla()

vote

média

desvio_padrão

mínimo

Quartil_1

mediana

Quartil_3

máximo

Abtstenção

34.37

12.98

18

24

30

42.00

70

Não

35.80

14.32

18

23

33

45.00

70

Não decidiu

40.36

14.41

18

29

38

51.00

70

Sim

40.37

15.24

18

27

38

53.00

70

41.99

14.30

18

30

42

52.25

70

Conclusão parcial

A partir dos dados obtidos acima, foi perceptível que a idade não exerce muito impacto em relação ao voto, devido ao baixo desvio-padrão e devido ao fato de a diferença de idade dentro de um mesmo quartil não mudar tão consideravelmente ao ponto de mudar a faixa etária ou uma geração (que normalmente muda de 15 a 20 anos).

Em relação à análise dos dados qualitativos, pudemos ver que o sexo com maior pretensão de votar a favor da permanência do Pinochet no poder, com 108 votos a mais. Os outros números do eleitorado feminino também foi expressivo, com a maioria nas categorias “Não decidiu” e “Abstenção”. Por outro lado, a única maioria que o eleitorado masculino teve foi por pretender votar contra a continuação do governo de Pinochet.

Em relação ao grau de educação e o voto, o número mais expressivo foi o de votos de eleitores que tem até a escolaridade primária, com 422 votos a favor do Pinochet continuar no poder. Em contrapartida, dos eleitores com maior grau de escolaridade, apenas 130 votaram “Sim”.

Gráfico

Agora, para conseguir observar a relação entre as variáveis qualitativas e quantitativas, será utilizado um gráfico para melhor ilustração dos dados.

Sexo x Salário

tab_Chile %>% select(sex, income) %>%
  ggplot(aes(x=sex, y=income)) +
  geom_boxplot(fill=c("pink", "skyblue")) +
  labs(x="Sexo", y="Salário", title = "Boxplot - Sexo X Salário",
       subtitle = "Relação entre o salário e o sexo, quali x quanti.",
       caption = "Chile.RData") + coord_flip() + theme_dark()

A partir da análise do gráfico acima, percebemos que não há muita diferença entre a renda dos eleitores e das eleitoras, apenas que 25% das mulheres recebem menos do que os homens.

Conclusão

Com a análise dos dados foi notável que uma grande parcela das mulheres escolheu votar para que o Pinochet continuasse no poder, apesar de 25% delas receberem menos que os homens, portanto, vivem num ambiente desigual durante o Governo do Pinochet.

Também foi visível que não houve muita disperção na variável idade.

Além disso, na variável Salário X Voto há uma contradição - como houve com o eleitorado feminino - na qual 25% do eleitorado que votou a favor da continuação do Pinochet no poder ou estava indeciso, ganha no máximo 7500 pesos. Por outro lado, os primeiros 25% do eleitorado que votou contra o Pinochet ou se absteve recebe até 15mil pesos.