A base de dados Chile.RData tem os dados de um survey respondido por homens e mulheres que votariam no Plesbicito Nacional do Chile de 1988, no qual estava em pauta o futuro de Augusto Pinochet e da Ditadura Militar chilena. A população tinha que votar a favor da continuação de Pinochet no governo ou contra. Também havia a opção de se abster.
load("C:/Users/Maria Clara Queiroz/Downloads/Base_de_dados-master/chile/Chile.RData")
# Bibliotecas:
library(readxl)
library(flextable)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
# Limpeza de dados
### Região
Chile$region = ifelse(Chile$region == "C", "Central", ifelse(Chile$region == "M", "Reg.Metropolitana Santiago", ifelse(Chile$region == "N", "Norte", ifelse(Chile$region == "S", "Sul", "Cidade de Santiago"))))
### Educação
Chile$education = ifelse(Chile$education == "P", "Primária", ifelse(Chile$education=="PS", "Pós-Secundária", "Secundária"))
### Sexo
Chile$sex = ifelse(Chile$sex == "M", "Masculino", "Feminino")
# Voto
Chile$vote = ifelse(Chile$vote == "N", "Não", ifelse(Chile$vote == "U", "Não decidiu", ifelse(Chile$vote == "A", "Abtstenção", "Sim")))
tab_Chile = na.omit(Chile)
# Criação de tabelas
#### Educação
tabelaedu = table(Chile$education)
#### Sexo
tabelasex = table(Chile$sex)
#### Região
tabelareg = table(Chile$region)
#### Income (Salário)
tabelasal = table(Chile$income)
#### Voto
tabelavoto = table(Chile$vote)
#### Idade
tabelaidade = table(Chile$age)
Tabela para analisar se houve uma grande diferença de votos a partir do sexo do eleitor.
tabelasexvoto = table(Chile$sex, Chile$vote)
tabelasexvoto
##
## Abtstenção Não Não decidiu Sim
## Feminino 104 363 362 480
## Masculino 83 526 226 388
Tabela para analisar se há relação entre o voto e a escolaridade dos eleitores.
tabelaeduvoto = table(Chile$education, Chile$vote)
tabelaeduvoto
##
## Abtstenção Não Não decidiu Sim
## Pós-Secundária 32 224 52 130
## Primária 52 266 296 422
## Secundária 103 397 237 311
Chile %>% group_by(sex) %>%
summarise(média=round(mean(income, na.rm = T),2),
desvio_padrão=round(sd(income, na.rm = T),2),
mínimo=min(income, na.rm = T),
Quartil_1=quantile(income,0.25, na.rm = T),
mediana=median(income, na.rm = T),
Quartil_3=quantile(income,0.75, na.rm = T),
máximo=max(income, na.rm = T)) %>%
flextable() %>% theme_vanilla()
sex | média | desvio_padrão | mínimo | Quartil_1 | mediana | Quartil_3 | máximo |
|---|---|---|---|---|---|---|---|
Feminino | 32,041.01 | 39,695.12 | 2,500 | 7,500 | 15,000 | 35,000 | 200,000 |
Masculino | 35,791.44 | 39,225.21 | 2,500 | 15,000 | 15,000 | 35,000 | 200,000 |
Tabela para analisar se há relação entre o salário e o voto dos eleitores
Chile %>% group_by(vote) %>%
summarise(média=round(mean(income, na.rm = T),2),
desvio_padrão=round(sd(income, na.rm = T),2),
mínimo=min(income, na.rm = T),
Quartil_1=quantile(income,0.25, na.rm = T),
mediana=median(income, na.rm = T),
Quartil_3=quantile(income,0.75, na.rm = T),
máximo=max(income, na.rm = T)) %>%
flextable() %>% theme_vanilla()
vote | média | desvio_padrão | mínimo | Quartil_1 | mediana | Quartil_3 | máximo |
|---|---|---|---|---|---|---|---|
Abtstenção | 33,184.36 | 34,087.00 | 2,500 | 15,000 | 15,000 | 35,000 | 200,000 |
Não | 37,031.07 | 41,658.14 | 2,500 | 15,000 | 15,000 | 35,000 | 200,000 |
Não decidiu | 25,683.04 | 28,740.56 | 2,500 | 7,500 | 15,000 | 35,000 | 200,000 |
Sim | 36,495.24 | 43,974.95 | 2,500 | 7,500 | 15,000 | 35,000 | 200,000 |
32,352.94 | 36,908.98 | 2,500 | 15,000 | 15,000 | 35,000 | 200,000 |
Chile %>% group_by(vote) %>%
summarise(média=round(mean(age, na.rm = T),2),
desvio_padrão=round(sd(age, na.rm = T),2),
mínimo=min(age, na.rm = T),
Quartil_1=quantile(age,0.25, na.rm = T),
mediana=median(age, na.rm = T),
Quartil_3=quantile(age,0.75, na.rm = T),
máximo=max(age, na.rm = T)) %>%
flextable() %>% theme_vanilla()
vote | média | desvio_padrão | mínimo | Quartil_1 | mediana | Quartil_3 | máximo |
|---|---|---|---|---|---|---|---|
Abtstenção | 34.37 | 12.98 | 18 | 24 | 30 | 42.00 | 70 |
Não | 35.80 | 14.32 | 18 | 23 | 33 | 45.00 | 70 |
Não decidiu | 40.36 | 14.41 | 18 | 29 | 38 | 51.00 | 70 |
Sim | 40.37 | 15.24 | 18 | 27 | 38 | 53.00 | 70 |
41.99 | 14.30 | 18 | 30 | 42 | 52.25 | 70 |
A partir dos dados obtidos acima, foi perceptível que a idade não exerce muito impacto em relação ao voto, devido ao baixo desvio-padrão e devido ao fato de a diferença de idade dentro de um mesmo quartil não mudar tão consideravelmente ao ponto de mudar a faixa etária ou uma geração (que normalmente muda de 15 a 20 anos).
Em relação à análise dos dados qualitativos, pudemos ver que o sexo com maior pretensão de votar a favor da permanência do Pinochet no poder, com 108 votos a mais. Os outros números do eleitorado feminino também foi expressivo, com a maioria nas categorias “Não decidiu” e “Abstenção”. Por outro lado, a única maioria que o eleitorado masculino teve foi por pretender votar contra a continuação do governo de Pinochet.
Em relação ao grau de educação e o voto, o número mais expressivo foi o de votos de eleitores que tem até a escolaridade primária, com 422 votos a favor do Pinochet continuar no poder. Em contrapartida, dos eleitores com maior grau de escolaridade, apenas 130 votaram “Sim”.
Agora, para conseguir observar a relação entre as variáveis qualitativas e quantitativas, será utilizado um gráfico para melhor ilustração dos dados.
tab_Chile %>% select(sex, income) %>%
ggplot(aes(x=sex, y=income)) +
geom_boxplot(fill=c("pink", "skyblue")) +
labs(x="Sexo", y="Salário", title = "Boxplot - Sexo X Salário",
subtitle = "Relação entre o salário e o sexo, quali x quanti.",
caption = "Chile.RData") + coord_flip() + theme_dark()
A partir da análise do gráfico acima, percebemos que não há muita diferença entre a renda dos eleitores e das eleitoras, apenas que 25% das mulheres recebem menos do que os homens.
Com a análise dos dados foi notável que uma grande parcela das mulheres escolheu votar para que o Pinochet continuasse no poder, apesar de 25% delas receberem menos que os homens, portanto, vivem num ambiente desigual durante o Governo do Pinochet.
Também foi visível que não houve muita disperção na variável idade.
Além disso, na variável Salário X Voto há uma contradição - como houve com o eleitorado feminino - na qual 25% do eleitorado que votou a favor da continuação do Pinochet no poder ou estava indeciso, ganha no máximo 7500 pesos. Por outro lado, os primeiros 25% do eleitorado que votou contra o Pinochet ou se absteve recebe até 15mil pesos.