Segunda Atividade

Projeto de Pesquisa

1º - Banco de dados

O Banco de Dados que será utilizado para este projeto consistirá em um banco do CESOP-UNICAMP (Centro de Estudos de Opinião Publica da Universidade de Campinas), desenvolvido pelo DATAFOLHA (Istituto de Pesquisas da Folha de São Paulo). A pesquisa foi realizada por Amostragem, coletada em Outubro de 1998, acerca do tema “Intenção de Voto para Presidência da República”.

2º - Detalhamento dos Bancos

Como pode-se observar, o tamanho da amostra (número de casos) é de 20.228. A pesquisa possue variáveis quantitativas e qualitativas, com perguntas espontâneas ou estimuladas.
As perguntas que serão manuseadas por nós serão - INICIALMENTE, pois isto pode mudar no decorrer da pesquisa - as variáveis sócio econômicas(Sexo, Idade, Renda), com as variáveis de Ideologia e Intenção de Voto (tanto espontânea quanto estimulada)
Obs: Não incluímos o banco de dados ainda pelo fato de que para obtenção do mesmo é necessário enviar um requerimento ao Institituto para se ter acesso aos dados em formato de SPSS. Ressaltamos que estamos em contato com os professores do Grupo de Análise em Comportamento Eleitoral: Luciana Veiga e Márcia.

3º Hipóteses e Objetivos

Nosso objetivo é, em última instância, verificar se as variáveis analisadas serão explicativas para o fenômeno do voto.
Temos algumas excpectativas de resultado:
1 - Há uma correlação entre Renda e intenção de voto em um determinado candidato
2 - Há uma correlação entre Idade e intenção de voto em um determinado candidato
3 - Há uma correlação entre Escolaridade e intenção de voto em um determinado candidato
4 - Há uma correlação entre a boa avaliação do Plano Real e a intenção de voto de um determinado candidato

1º Passo - Carregar o Banco de dados

library(haven)
Eleicao1998 <- read_sav("C:/Users/17971566751/Downloads/00863.SAV")

2º Passo - Legenda do banco de Dados

Intenção de voto Estimulada

1 “Brigadeiro Ivan Frota”

2 “Ciro Gomes”

3 “Enéas”

4 “Fernando Henrique”

5 “Zé Maria”

7 “Lula”

8 “Eymael”

10 “João de Deus Barbosa”

11 “Sirkis”

12 “Vasco Neto”

21 “Thereza Ruiz”

15 “Sérgio Bueno”

98 “Outro nome”

96 “Outras referências”

16 “Em branco/nulo/nenhum”

17 “Não sabe”.

Sexo

1- Masculino

2- Feminino

Intenção de voto Espontânea

1 “Brigadeiro Ivan Frota”

2 “Ciro Gomes”

3 “Enéas”

4 “Fernando Henrique”

5 “Zé Maria”

7 “Lula”

8 “Eymael”

10 “João de Deus Barbosa”

11 “Sirkis”

12 “Vasco Neto”

21 “Thereza Ruiz”

15 “Sérgio Bueno”

16 “Em branco/nulo/nenhum”

17 “Não sabe”

80 “Citou dois nomes”

81 “Citou um nome que não está no cartão”

97 “Não respondeu”

Avaliação do Plano Real

1 “Ótimo”

2 “Bom”

3 “Regular”

4 “Ruim”

5 “Péssimo”

6 “Não sabe”

97 “Não respondeu”

Escolaridade

1 “Analfabeto/primário incompleto”

2 “Primário completo/ginasial incompleto”

3 “Ginasial completo”

4 “Colegial incompleto”

5 “Colegial completo”

6 “Superior incompleto”

47 “Superior completo”

8 “Pós Graduação”

97 “Não respondeu”

Renda

1 “até R$260,00”

2 “De R$261,00 até R$390,00”

3 “De R$391,00 até R$650,00”

4 “De R$651,00 até R$1.300,00”

5 “De R$1.301,00 até R$2.600,00”

6 “De R$2.601,00 até R$6.500,00”

7 “R$6.501,00 ou mais”

8 “Não sabe”

9 “Recusa”

97 “Não respondeu”.

Preferência Partidária

1 “PMDB”

2 “PT”

3 “PPB(PDS/PPR)”

4 “PSDB”

5 “PTB”

6 “PRN”

7 “PDT”

8 “PSB”

9 “PFL”

10 “PL”

11 “Outro partido”

12 “Nomes e referências”

13 “Nenhum/não tem”.

3º Passo - Corrigir o tipo de variável e o nome

Eleicao1998$SEXO <- as.factor(Eleicao1998$SEXO)

Eleicao1998$ESCOLA <- as.factor(Eleicao1998$ESCOLA)

Eleicao1998$p15 <- as.factor(Eleicao1998$p15)

Eleicao1998$p1 <- as.factor(Eleicao1998$p1)

Eleicao1998$p4 <- as.factor(Eleicao1998$p4)

Eleicao1998$PARTIDO <- as.factor(Eleicao1998$PARTIDO)

Eleicao1998$RENDAF <- as.factor(Eleicao1998$RENDAF)


Sexo <- Eleicao1998$SEXO
Idade <- Eleicao1998$IDADE1
FaixaIdade <- Eleicao1998$IDADE
Escolaridade <- Eleicao1998$ESCOLA
Aprovacao_Plano_Real <- Eleicao1998$p15
VotoEspontaneo <- Eleicao1998$p1
VotoEstimulado <- Eleicao1998$p4
Partido <- Eleicao1998$PARTIDO
Renda <- Eleicao1998$RENDAF

4º Passo - Manipular as variáveis e gerar gráficos

Boxplot Voto Espontâneo por Idade

library(ggplot2)

ggplot(Eleicao1998) +
 aes(x = p1, y = IDADE1) +
 geom_boxplot(fill = "#d175b8") +
 labs(x = "Voto", y = "Idade", title = "Boxplot Idade por Voto Espontâneo") +
 theme_minimal()

Boxplot Voto Estimulado por Idade

ggplot(Eleicao1998) +
 aes(x = p4, y = IDADE1) +
 geom_boxplot(fill = "#ffff33") +
 labs(x = "Voto Estimulado", y = "Idade", title = "Boxplot Idade por Voto Estimulado") +
 theme_minimal()

Barplot Voto Espontâneo por Sexo

library(ggplot2)

ggplot(Eleicao1998) +
 aes(x = p1, fill = SEXO) +
 geom_bar() +
 scale_fill_hue() +
 labs(x = "Candidato", y = "Número de Votos Espontâneo", title = "Barplot Voto por Sexo", subtitle = "1 - Masculino; 2- Feminino", fill = "Sexo") +
 theme_minimal()

Barplot Voto Estimulado por Sexo

ggplot(Eleicao1998) +
 aes(x = p4, fill = SEXO) +
 geom_bar() +
 scale_fill_brewer(palette = "Set3") +
 labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Estimulado por Sexo", subtitle = "1 - Masculino; 2- Feminino", fill = "Sexo") +
 theme_minimal()

Barplot por Voto Espontâneo por Avaliação Plano Real

library(ggplot2)

ggplot(Eleicao1998) +
 aes(x = p1, fill = p15) +
 geom_bar() +
 scale_fill_hue() +
 labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Espontâneo por Avaliação do Plano Real", subtitle = "1 - ótimo; 2 - Bom; 3 - Regular; 4 - Ruim; 5 - Péssimo;  6 - Não sabe; 97 - Não Respondeu", fill = "Plano Real") +
 theme_minimal()

Barplot Voto Estimulado por Avaliação Plano Real

ggplot(Eleicao1998) +
 aes(x = p4, fill = p15) +
 geom_bar() +
 scale_fill_hue() +
 labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Estimulado por Avaliação do Plano Real", subtitle = "1 - ótimo; 2 - Bom; 3 - Regular; 4 - Ruim; 5 - Péssimo;  6 - Não sabe; 97 - Não Respondeu", fill = "Plano Real") +
 theme_minimal()

Barplot Voto Espontâneo por Renda

library(ggplot2)

ggplot(Eleicao1998) +
 aes(x = p1, fill = RENDAF) +
 geom_bar() +
 scale_fill_brewer(palette = "Set1") +
 labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Espontanêo por Renda", subtitle = "1-Até R$260,00; 2-R$261,00 até R$390,00; 3-R$391,00 até R$650,00; 4-R$651,00 até R$1.300,00; 5-R$1.301,00 até R$2.600,00; 6-R$2.601,00 até R$6.500,00; 7-R$6.501,00 ou mais; 8-Não sabe; 9-Recusa; 97-Não respondeu", fill = "Renda") +
 theme_minimal()

Barplot Voto Estimulado por Renda

ggplot(Eleicao1998) +
 aes(x = p15, fill = RENDAF) +
 geom_bar() +
 scale_fill_brewer(palette = "Set1") +
 labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Estimulado por Renda", subtitle = "1-Até R$260,00; 2-R$261,00 até R$390,00; 3-R$391,00 até R$650,00; 4-R$651,00 até R$1.300,00; 5-R$1.301,00 até R$2.600,00; 6-R$2.601,00 até R$6.500,00; 7-R$6.501,00 ou mais; 8-Não sabe; 9-Recusa; 97-Não respondeu", fill = "Renda") +
 theme_minimal()

Barplot Voto Espontâneo por Identificação Partidária

library(ggplot2)

ggplot(Eleicao1998) +
 aes(x = p1, fill = PARTIDO) +
 geom_bar() +
 scale_fill_hue() +
 labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Espontâneo por Preferência Partidária", subtitle = "1 PMDB, 2 - PT, 3 - PPB(PDS/PPR), 4 - PSDB, 5 - PTB, 6 - PRN, 7 - PDT, 8 - PSB, 9 - PFL, 10 - PL, 11 - Outro partido, 12 - Nomes e referências, 13 - Nenhum/não tem", fill = "Partido") +
 theme_minimal()

Barplot Voto Estimulado por Identificação Partidária

ggplot(Eleicao1998) +
 aes(x = p4, fill = PARTIDO) +
 geom_bar() +
 scale_fill_hue() +
 labs(x = "Candidato", y = "Número de Votos", title = "Barplot Voto Estimulado por Preferência Partidária", subtitle = "1 PMDB, 2 - PT, 3 - PPB(PDS/PPR), 4 - PSDB, 5 - PTB, 6 - PRN, 7 - PDT, 8 - PSB, 9 - PFL, 10 - PL, 11 - Outro partido, 12 - Nomes e referências, 13 - Nenhum/não tem", fill = "Partido") +
 theme_minimal()

Passo 2 - Verificar correlações

options(scipen=99999)

Tabela_Sexo <- table(Eleicao1998$SEXO, Eleicao1998$p1)
Tabela_Sexo
##    
##        1    2    3    4    5    7    8   10   11   12   16   17   21   96
##   1   15  682  206 3675    1 2331    1    7    2    1  471 2461    4   20
##   2   12  573   98 2986    3 1508    4    1    1    2  563 4223    5   21
##    
##       98
##   1  160
##   2  191
Teste_Qui_SEXO <- chisq.test(Tabela_Sexo)
Teste_Qui_SEXO
## 
##  Pearson's Chi-squared test
## 
## data:  Tabela_Sexo
## X-squared = 778.26, df = 14, p-value < 0.00000000000000022
Tabela_Sexo2<- table(Eleicao1998$SEXO, Eleicao1998$p4)
Tabela_Sexo2
##    
##        1    2    3    4    5    7    8   10   11   12   15   16   17   21
##   1   41 1015  363 4479   20 2912   15   48   13    4   26  438  573   28
##   2   27 1062  274 4381   28 2384   23   61    7   12   35  590 1199   30
##    
##       80   81   97
##   1   28   32    2
##   2   40   38    0
Teste_Qui_SEXO2<- chisq.test(Tabela_Sexo2)
Teste_Qui_SEXO2
## 
##  Pearson's Chi-squared test
## 
## data:  Tabela_Sexo2
## X-squared = 328.97, df = 16, p-value < 0.00000000000000022
options(scipen=99999)

Tabela_Avaliacao <- table(Eleicao1998$p1, Eleicao1998$p15)
Tabela_Avaliacao
##     
##         1    2    3    4    5    6   97
##   1     3   15    5    2    2    0    0
##   2    69  471  511  101   91   12    0
##   3    17  102  125   25   33    2    0
##   4  1496 3782 1231   60   59   29    4
##   5     1    2    1    0    0    0    0
##   7   157 1022 1621  509  506   23    1
##   8     0    0    4    1    0    0    0
##   10    1    2    4    0    1    0    0
##   11    1    1    1    0    0    0    0
##   12    0    1    0    1    1    0    0
##   16   58  300  407   99  159   11    0
##   17  654 2841 2195  367  434  193    0
##   21    1    4    2    1    1    0    0
##   96    4   18   14    1    3    1    0
##   98   52  163   87   18   27    4    0
Teste_Qui_Avaliacao <- chisq.test(Tabela_Avaliacao)
Teste_Qui_Avaliacao
## 
##  Pearson's Chi-squared test
## 
## data:  Tabela_Avaliacao
## X-squared = 3677.8, df = 84, p-value < 0.00000000000000022
Modelo_Espontanea_Idade <- aov(IDADE1 ~ VotoEspontaneo,data=Eleicao1998)

Residuo_Modelo_Espontanea_Idade <- residuals(Modelo_Espontanea_Idade)

library(nortest)

ad.test(Residuo_Modelo_Espontanea_Idade)
## 
##  Anderson-Darling normality test
## 
## data:  Residuo_Modelo_Espontanea_Idade
## A = 256.03, p-value < 0.00000000000000022
bartlett.test(IDADE1 ~ VotoEspontaneo,data=Eleicao1998)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  IDADE1 by VotoEspontaneo
## Bartlett's K-squared = 89.4, df = 14, p-value = 0.0000000000004926
kruskal.test(IDADE1 ~ VotoEspontaneo,data=Eleicao1998)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  IDADE1 by VotoEspontaneo
## Kruskal-Wallis chi-squared = 177.7, df = 14, p-value <
## 0.00000000000000022