Segunda Atividade
Projeto de Pesquisa
1º - Banco de dados
O Banco de Dados que será utilizado para este projeto consistirá em um banco do CESOP-UNICAMP (Centro de Estudos de Opinião Publica da Universidade de Campinas), desenvolvido pelo DATAFOLHA (Istituto de Pesquisas da Folha de São Paulo). A pesquisa foi realizada por Amostragem, coletada em Outubro de 1998, acerca do tema “Intenção de Voto para Presidência da República”.
2º - Detalhamento dos Bancos
Como pode-se observar, o tamanho da amostra (número de casos) é de 20.228. A pesquisa possue variáveis quantitativas e qualitativas, com perguntas espontâneas ou estimuladas.
As perguntas que serão manuseadas por nós serão - INICIALMENTE, pois isto pode mudar no decorrer da pesquisa - as variáveis sócio econômicas(Sexo, Idade, Renda), com as variáveis de Ideologia e Intenção de Voto (tanto espontânea quanto estimulada)
Obs: Não incluímos o banco de dados ainda pelo fato de que para obtenção do mesmo é necessário enviar um requerimento ao Institituto para se ter acesso aos dados em formato de SPSS. Ressaltamos que estamos em contato com os professores do Grupo de Análise em Comportamento Eleitoral: Luciana Veiga e Márcia.
3º Hipóteses e Objetivos
Nosso objetivo é, em última instância, verificar se as variáveis analisadas serão explicativas para o fenômeno do voto.
Temos algumas excpectativas de resultado:
1 - Há uma correlação entre Renda e intenção de voto em um determinado candidato
2 - Há uma correlação entre Idade e intenção de voto em um determinado candidato
3 - Há uma correlação entre Escolaridade e intenção de voto em um determinado candidato
4 - Há uma correlação entre a boa avaliação do Plano Real e a intenção de voto de um determinado candidato
1º Passo - Carregar o Banco de dados
library(haven)
Eleicao1998 <- read_sav("C:/Users/17971566751/Downloads/00863.SAV")
2º Passo - Legenda do banco de Dados
Intenção de voto Estimulada
1 “Brigadeiro Ivan Frota”
2 “Ciro Gomes”
3 “Enéas”
4 “Fernando Henrique”
5 “Zé Maria”
7 “Lula”
8 “Eymael”
10 “João de Deus Barbosa”
11 “Sirkis”
12 “Vasco Neto”
21 “Thereza Ruiz”
15 “Sérgio Bueno”
98 “Outro nome”
96 “Outras referências”
16 “Em branco/nulo/nenhum”
17 “Não sabe”.
Sexo
1- Masculino
2- Feminino
Intenção de voto Espontânea
1 “Brigadeiro Ivan Frota”
2 “Ciro Gomes”
3 “Enéas”
4 “Fernando Henrique”
5 “Zé Maria”
7 “Lula”
8 “Eymael”
10 “João de Deus Barbosa”
11 “Sirkis”
12 “Vasco Neto”
21 “Thereza Ruiz”
15 “Sérgio Bueno”
16 “Em branco/nulo/nenhum”
17 “Não sabe”
80 “Citou dois nomes”
81 “Citou um nome que não está no cartão”
97 “Não respondeu”
Avaliação do Plano Real
1 “Ótimo”
2 “Bom”
3 “Regular”
4 “Ruim”
5 “Péssimo”
6 “Não sabe”
97 “Não respondeu”
Escolaridade
1 “Analfabeto/primário incompleto”
2 “Primário completo/ginasial incompleto”
3 “Ginasial completo”
4 “Colegial incompleto”
5 “Colegial completo”
6 “Superior incompleto”
47 “Superior completo”
8 “Pós Graduação”
97 “Não respondeu”
Renda
1 “até R$260,00”
2 “De R$261,00 até R$390,00”
3 “De R$391,00 até R$650,00”
4 “De R$651,00 até R$1.300,00”
5 “De R$1.301,00 até R$2.600,00”
6 “De R$2.601,00 até R$6.500,00”
7 “R$6.501,00 ou mais”
8 “Não sabe”
9 “Recusa”
97 “Não respondeu”.
Preferência Partidária
1 “PMDB”
2 “PT”
3 “PPB(PDS/PPR)”
4 “PSDB”
5 “PTB”
6 “PRN”
7 “PDT”
8 “PSB”
9 “PFL”
10 “PL”
11 “Outro partido”
12 “Nomes e referências”
13 “Nenhum/não tem”.
3º Passo - Corrigir o tipo de variável e o nome
Eleicao1998$SEXO <- as.factor(Eleicao1998$SEXO)
Eleicao1998$ESCOLA <- as.factor(Eleicao1998$ESCOLA)
Eleicao1998$p15 <- as.factor(Eleicao1998$p15)
Eleicao1998$p1 <- as.factor(Eleicao1998$p1)
Eleicao1998$p4 <- as.factor(Eleicao1998$p4)
Eleicao1998$PARTIDO <- as.factor(Eleicao1998$PARTIDO)
Eleicao1998$RENDAF <- as.factor(Eleicao1998$RENDAF)
Sexo <- Eleicao1998$SEXO
Idade <- Eleicao1998$IDADE1
FaixaIdade <- Eleicao1998$IDADE
Escolaridade <- Eleicao1998$ESCOLA
Aprovacao_Plano_Real <- Eleicao1998$p15
VotoEspontaneo <- Eleicao1998$p1
VotoEstimulado <- Eleicao1998$p4
Partido <- Eleicao1998$PARTIDO
Renda <- Eleicao1998$RENDAF
4º Passo - Manipular as variáveis e gerar gráficos
Boxplot Voto Espontâneo por Idade
library(ggplot2)
ggplot(Eleicao1998) +
aes(x = p1, y = IDADE1) +
geom_boxplot(fill = "#d175b8") +
labs(x = "Voto", y = "Idade", title = "Boxplot Idade por Voto Espontâneo") +
theme_minimal()

Boxplot Voto Estimulado por Idade
ggplot(Eleicao1998) +
aes(x = p4, y = IDADE1) +
geom_boxplot(fill = "#ffff33") +
labs(x = "Voto Estimulado", y = "Idade", title = "Boxplot Idade por Voto Estimulado") +
theme_minimal()

Barplot Voto Espontâneo por Sexo
library(ggplot2)
ggplot(Eleicao1998) +
aes(x = p1, fill = SEXO) +
geom_bar() +
scale_fill_hue() +
labs(x = "Candidato", y = "Número de Votos Espontâneo", title = "Barplot Voto por Sexo", subtitle = "1 - Masculino; 2- Feminino", fill = "Sexo") +
theme_minimal()

Barplot Voto Estimulado por Sexo
ggplot(Eleicao1998) +
aes(x = p4, fill = SEXO) +
geom_bar() +
scale_fill_brewer(palette = "Set3") +
labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Estimulado por Sexo", subtitle = "1 - Masculino; 2- Feminino", fill = "Sexo") +
theme_minimal()

Barplot por Voto Espontâneo por Avaliação Plano Real
library(ggplot2)
ggplot(Eleicao1998) +
aes(x = p1, fill = p15) +
geom_bar() +
scale_fill_hue() +
labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Espontâneo por Avaliação do Plano Real", subtitle = "1 - ótimo; 2 - Bom; 3 - Regular; 4 - Ruim; 5 - Péssimo; 6 - Não sabe; 97 - Não Respondeu", fill = "Plano Real") +
theme_minimal()

Barplot Voto Estimulado por Avaliação Plano Real
ggplot(Eleicao1998) +
aes(x = p4, fill = p15) +
geom_bar() +
scale_fill_hue() +
labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Estimulado por Avaliação do Plano Real", subtitle = "1 - ótimo; 2 - Bom; 3 - Regular; 4 - Ruim; 5 - Péssimo; 6 - Não sabe; 97 - Não Respondeu", fill = "Plano Real") +
theme_minimal()

Barplot Voto Espontâneo por Renda
library(ggplot2)
ggplot(Eleicao1998) +
aes(x = p1, fill = RENDAF) +
geom_bar() +
scale_fill_brewer(palette = "Set1") +
labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Espontanêo por Renda", subtitle = "1-Até R$260,00; 2-R$261,00 até R$390,00; 3-R$391,00 até R$650,00; 4-R$651,00 até R$1.300,00; 5-R$1.301,00 até R$2.600,00; 6-R$2.601,00 até R$6.500,00; 7-R$6.501,00 ou mais; 8-Não sabe; 9-Recusa; 97-Não respondeu", fill = "Renda") +
theme_minimal()

Barplot Voto Estimulado por Renda
ggplot(Eleicao1998) +
aes(x = p15, fill = RENDAF) +
geom_bar() +
scale_fill_brewer(palette = "Set1") +
labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Estimulado por Renda", subtitle = "1-Até R$260,00; 2-R$261,00 até R$390,00; 3-R$391,00 até R$650,00; 4-R$651,00 até R$1.300,00; 5-R$1.301,00 até R$2.600,00; 6-R$2.601,00 até R$6.500,00; 7-R$6.501,00 ou mais; 8-Não sabe; 9-Recusa; 97-Não respondeu", fill = "Renda") +
theme_minimal()

Barplot Voto Espontâneo por Identificação Partidária
library(ggplot2)
ggplot(Eleicao1998) +
aes(x = p1, fill = PARTIDO) +
geom_bar() +
scale_fill_hue() +
labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Espontâneo por Preferência Partidária", subtitle = "1 PMDB, 2 - PT, 3 - PPB(PDS/PPR), 4 - PSDB, 5 - PTB, 6 - PRN, 7 - PDT, 8 - PSB, 9 - PFL, 10 - PL, 11 - Outro partido, 12 - Nomes e referências, 13 - Nenhum/não tem", fill = "Partido") +
theme_minimal()

Barplot Voto Estimulado por Identificação Partidária
ggplot(Eleicao1998) +
aes(x = p4, fill = PARTIDO) +
geom_bar() +
scale_fill_hue() +
labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Estimulado por Preferência Partidária", subtitle = "1 PMDB, 2 - PT, 3 - PPB(PDS/PPR), 4 - PSDB, 5 - PTB, 6 - PRN, 7 - PDT, 8 - PSB, 9 - PFL, 10 - PL, 11 - Outro partido, 12 - Nomes e referências, 13 - Nenhum/não tem", fill = "Partido") +
theme_minimal()

Passo 2 - Verificar correlações
options(scipen=99999)
Tabela_Sexo <- table(Eleicao1998$SEXO, Eleicao1998$p1)
Tabela_Sexo
##
## 1 2 3 4 5 7 8 10 11 12 16 17 21 96
## 1 15 682 206 3675 1 2331 1 7 2 1 471 2461 4 20
## 2 12 573 98 2986 3 1508 4 1 1 2 563 4223 5 21
##
## 98
## 1 160
## 2 191
Teste_Qui_SEXO <- chisq.test(Tabela_Sexo)
Teste_Qui_SEXO
##
## Pearson's Chi-squared test
##
## data: Tabela_Sexo
## X-squared = 778.26, df = 14, p-value < 0.00000000000000022
Tabela_Sexo2<- table(Eleicao1998$SEXO, Eleicao1998$p4)
Tabela_Sexo2
##
## 1 2 3 4 5 7 8 10 11 12 15 16 17 21
## 1 41 1015 363 4479 20 2912 15 48 13 4 26 438 573 28
## 2 27 1062 274 4381 28 2384 23 61 7 12 35 590 1199 30
##
## 80 81 97
## 1 28 32 2
## 2 40 38 0
Teste_Qui_SEXO2<- chisq.test(Tabela_Sexo2)
Teste_Qui_SEXO2
##
## Pearson's Chi-squared test
##
## data: Tabela_Sexo2
## X-squared = 328.97, df = 16, p-value < 0.00000000000000022
options(scipen=99999)
Tabela_Avaliacao <- table(Eleicao1998$p1, Eleicao1998$p15)
Tabela_Avaliacao
##
## 1 2 3 4 5 6 97
## 1 3 15 5 2 2 0 0
## 2 69 471 511 101 91 12 0
## 3 17 102 125 25 33 2 0
## 4 1496 3782 1231 60 59 29 4
## 5 1 2 1 0 0 0 0
## 7 157 1022 1621 509 506 23 1
## 8 0 0 4 1 0 0 0
## 10 1 2 4 0 1 0 0
## 11 1 1 1 0 0 0 0
## 12 0 1 0 1 1 0 0
## 16 58 300 407 99 159 11 0
## 17 654 2841 2195 367 434 193 0
## 21 1 4 2 1 1 0 0
## 96 4 18 14 1 3 1 0
## 98 52 163 87 18 27 4 0
Teste_Qui_Avaliacao <- chisq.test(Tabela_Avaliacao)
Teste_Qui_Avaliacao
##
## Pearson's Chi-squared test
##
## data: Tabela_Avaliacao
## X-squared = 3677.8, df = 84, p-value < 0.00000000000000022
Modelo_Espontanea_Idade <- aov(IDADE1 ~ VotoEspontaneo,data=Eleicao1998)
Residuo_Modelo_Espontanea_Idade <- residuals(Modelo_Espontanea_Idade)
library(nortest)
ad.test(Residuo_Modelo_Espontanea_Idade)
##
## Anderson-Darling normality test
##
## data: Residuo_Modelo_Espontanea_Idade
## A = 256.03, p-value < 0.00000000000000022
bartlett.test(IDADE1 ~ VotoEspontaneo,data=Eleicao1998)
##
## Bartlett test of homogeneity of variances
##
## data: IDADE1 by VotoEspontaneo
## Bartlett's K-squared = 89.4, df = 14, p-value = 0.0000000000004926
kruskal.test(IDADE1 ~ VotoEspontaneo,data=Eleicao1998)
##
## Kruskal-Wallis rank sum test
##
## data: IDADE1 by VotoEspontaneo
## Kruskal-Wallis chi-squared = 177.7, df = 14, p-value <
## 0.00000000000000022