library(dplyr)
library(ggplot2)
library(reshape2)
library(car)
library(leaps)
library(corrplot)
dados_eleicoes <- read.csv("../eleicoes2014.csv")
dados_eleicoes$cargo <- NULL
modelo <- lm(formula = votos ~ .
-nome
-sequencial_candidato
-numero_cadidato,
data = dados_eleicoes, na.action = na.omit)
summary(modelo)
##
## Call:
## lm(formula = votos ~ . - nome - sequencial_candidato - numero_cadidato,
## data = dados_eleicoes, na.action = na.omit)
##
## Residuals:
## Min 1Q Median 3Q Max
## -252066 -23182 -1713 24709 885401
##
## Coefficients:
## Estimate
## (Intercept) -1.741e+04
## UFAL 4.403e+04
## UFAM 5.116e+03
## UFAP 1.519e+04
## UFBA 3.954e+04
## UFCE -8.960e+03
## UFDF -1.272e+03
## UFES 2.072e+04
## UFGO 1.373e+04
## UFMA 2.906e+04
## UFMG 3.143e+04
## UFMS -2.199e+04
## UFMT 1.973e+04
## UFPA 3.703e+04
## UFPB 4.337e+03
## UFPE 1.211e+05
## UFPI 4.986e+04
## UFPR 2.181e+04
## UFRJ -1.743e+04
## UFRN -3.707e+03
## UFRO -3.105e+03
## UFRR -6.162e+04
## UFRS 2.062e+04
## UFSC 1.534e+04
## UFSE 1.560e+04
## UFSP 4.205e+04
## UFTO -1.502e+04
## partidoPC do B -2.261e+04
## partidoPDT -2.576e+04
## partidoPHS -4.436e+04
## partidoPMDB -3.392e+04
## partidoPMN -6.591e+04
## partidoPP -2.374e+04
## partidoPPL -1.096e+05
## partidoPPS 1.673e+03
## partidoPR -8.750e+03
## partidoPRB 1.053e+05
## partidoPROS -2.371e+04
## partidoPRP -4.426e+04
## partidoPSB -1.260e+04
## partidoPSC -1.619e+04
## partidoPSD -2.158e+02
## partidoPSDB -6.702e+03
## partidoPSDC -7.202e+04
## partidoPSL -5.884e+04
## partidoPSOL 1.158e+04
## partidoPT -2.173e+04
## partidoPT do B -6.992e+04
## partidoPTB -8.392e+03
## partidoPTC -1.573e+04
## partidoPTN -8.379e+03
## partidoPV -3.717e+04
## partidoSD -3.763e+03
## setor_economico_receitaAtividades de organizações políticas -5.605e+03
## setor_economico_receitaEdição integrada à impressão de cadastros, listas e outros produtos gráficos 6.650e+04
## setor_economico_receitaFabricação de águas envasadas -1.571e+05
## setor_economico_receitaFabricação de azulejos e pisos -1.018e+04
## setor_economico_receitaImpressão de material para outros usos 4.055e+04
## quantidade_doacoes -2.247e+02
## quantidade_doadores 3.877e+02
## total_receita 1.309e+00
## media_receita 1.698e-01
## recursos_de_outros_candidatos.comites -1.116e+00
## recursos_de_partidos -1.317e+00
## recursos_de_pessoas_físicas -1.339e+00
## recursos_de_pessoas_juridicas -1.319e+00
## recursos_proprios -1.327e+00
## quantidade_despesas 7.921e+01
## quantidade_fornecedores -5.020e+01
## total_despesa -5.282e-03
## media_despesa 1.036e+01
## setor_economico_despesaAgenciamento de espaços para publicidade, exceto em veículos de comunicação 1.595e+05
## setor_economico_despesaAtividades de organizações políticas 2.754e+04
## setor_economico_despesaAtividades de franqueadas e permissionárias do Correio Nacional -5.019e+04
## setor_economico_despesaAtividades do Correio Nacional -1.449e+04
## setor_economico_despesaComércio varejista de artigos de papelaria -1.929e+04
## setor_economico_despesaComércio varejista de combustíveis para veículos automotores -3.040e+03
## setor_economico_despesaComércio varejista de cosméticos, produtos de perfumaria e de higiene pessoal -3.649e+04
## setor_economico_despesaComércio varejista de mercadorias em geral, com predominância de produtos alimentícios - supermercados -4.836e+04
## setor_economico_despesaConcessionárias de rodovias, pontes, túneis e serviços relacionados 9.856e+04
## setor_economico_despesaFabricação de letras, letreiros e placas de qualquer material, exceto luminosos -1.136e+04
## setor_economico_despesaFabricação de produtos de limpeza e polimento -1.526e+04
## setor_economico_despesaImpressão de livros, revistas e outras publicações periódicas -2.430e+04
## setor_economico_despesaImpressão de material para outros usos -2.316e+04
## setor_economico_despesaImpressão de material para uso publicitário -2.517e+02
## setor_economico_despesaInstalação de painéis publicitários -2.479e+04
## idade 2.139e+02
## sexoMASCULINO 1.190e+04
## grauENSINO FUNDAMENTAL INCOMPLETO -1.064e+04
## grauENSINO MÉDIO COMPLETO 1.079e+04
## grauSUPERIOR COMPLETO 1.284e+04
## grauSUPERIOR INCOMPLETO -1.753e+04
## estado_civilDIVORCIADO(A) -5.846e+03
## estado_civilSEPARADO(A) JUDICIALMENTE -1.516e+04
## estado_civilSOLTEIRO(A) -2.619e+04
## estado_civilVIÚVO(A) -5.040e+04
## Std. Error
## (Intercept) 7.224e+04
## UFAL 7.169e+04
## UFAM 6.483e+04
## UFAP 1.003e+05
## UFBA 5.997e+04
## UFCE 6.662e+04
## UFDF 6.346e+04
## UFES 6.158e+04
## UFGO 6.174e+04
## UFMA 6.742e+04
## UFMG 5.768e+04
## UFMS 6.279e+04
## UFMT 6.958e+04
## UFPA 6.176e+04
## UFPB 6.412e+04
## UFPE 7.943e+04
## UFPI 6.484e+04
## UFPR 5.849e+04
## UFRJ 5.869e+04
## UFRN 7.065e+04
## UFRO 6.575e+04
## UFRR 8.172e+04
## UFRS 5.970e+04
## UFSC 6.296e+04
## UFSE 6.872e+04
## UFSP 5.724e+04
## UFTO 6.764e+04
## partidoPC do B 3.223e+04
## partidoPDT 3.017e+04
## partidoPHS 4.626e+04
## partidoPMDB 2.615e+04
## partidoPMN 4.727e+04
## partidoPP 2.982e+04
## partidoPPL 8.640e+04
## partidoPPS 3.465e+04
## partidoPR 3.042e+04
## partidoPRB 3.613e+04
## partidoPROS 3.559e+04
## partidoPRP 5.076e+04
## partidoPSB 2.818e+04
## partidoPSC 4.245e+04
## partidoPSD 2.836e+04
## partidoPSDB 2.674e+04
## partidoPSDC 8.664e+04
## partidoPSL 5.361e+04
## partidoPSOL 6.205e+04
## partidoPT 2.567e+04
## partidoPT do B 3.605e+04
## partidoPTB 3.092e+04
## partidoPTC 6.485e+04
## partidoPTN 4.231e+04
## partidoPV 3.474e+04
## partidoSD 3.345e+04
## setor_economico_receitaAtividades de organizações políticas 1.103e+04
## setor_economico_receitaEdição integrada à impressão de cadastros, listas e outros produtos gráficos 6.127e+04
## setor_economico_receitaFabricação de águas envasadas 9.776e+04
## setor_economico_receitaFabricação de azulejos e pisos 8.024e+04
## setor_economico_receitaImpressão de material para outros usos 8.833e+04
## quantidade_doacoes 1.376e+02
## quantidade_doadores 1.922e+02
## total_receita 8.366e-01
## media_receita 3.871e-01
## recursos_de_outros_candidatos.comites 8.350e-01
## recursos_de_partidos 8.401e-01
## recursos_de_pessoas_físicas 8.415e-01
## recursos_de_pessoas_juridicas 8.402e-01
## recursos_proprios 8.378e-01
## quantidade_despesas 1.604e+01
## quantidade_fornecedores 2.138e+01
## total_despesa 2.203e-02
## media_despesa 4.545e+00
## setor_economico_despesaAgenciamento de espaços para publicidade, exceto em veículos de comunicação 9.488e+04
## setor_economico_despesaAtividades de organizações políticas 2.603e+04
## setor_economico_despesaAtividades de franqueadas e permissionárias do Correio Nacional 8.181e+04
## setor_economico_despesaAtividades do Correio Nacional 8.012e+04
## setor_economico_despesaComércio varejista de artigos de papelaria 9.539e+04
## setor_economico_despesaComércio varejista de combustíveis para veículos automotores 3.916e+04
## setor_economico_despesaComércio varejista de cosméticos, produtos de perfumaria e de higiene pessoal 8.108e+04
## setor_economico_despesaComércio varejista de mercadorias em geral, com predominância de produtos alimentícios - supermercados 5.229e+04
## setor_economico_despesaConcessionárias de rodovias, pontes, túneis e serviços relacionados 8.513e+04
## setor_economico_despesaFabricação de letras, letreiros e placas de qualquer material, exceto luminosos 9.889e+04
## setor_economico_despesaFabricação de produtos de limpeza e polimento 8.357e+04
## setor_economico_despesaImpressão de livros, revistas e outras publicações periódicas 4.264e+04
## setor_economico_despesaImpressão de material para outros usos 3.398e+04
## setor_economico_despesaImpressão de material para uso publicitário 3.690e+04
## setor_economico_despesaInstalação de painéis publicitários 8.240e+04
## idade 4.108e+02
## sexoMASCULINO 1.359e+04
## grauENSINO FUNDAMENTAL INCOMPLETO 4.992e+04
## grauENSINO MÉDIO COMPLETO 3.352e+04
## grauSUPERIOR COMPLETO 3.045e+04
## grauSUPERIOR INCOMPLETO 3.356e+04
## estado_civilDIVORCIADO(A) 1.480e+04
## estado_civilSEPARADO(A) JUDICIALMENTE 3.624e+04
## estado_civilSOLTEIRO(A) 1.265e+04
## estado_civilVIÚVO(A) 3.606e+04
## t value
## (Intercept) -0.241
## UFAL 0.614
## UFAM 0.079
## UFAP 0.151
## UFBA 0.659
## UFCE -0.134
## UFDF -0.020
## UFES 0.336
## UFGO 0.222
## UFMA 0.431
## UFMG 0.545
## UFMS -0.350
## UFMT 0.284
## UFPA 0.600
## UFPB 0.068
## UFPE 1.525
## UFPI 0.769
## UFPR 0.373
## UFRJ -0.297
## UFRN -0.052
## UFRO -0.047
## UFRR -0.754
## UFRS 0.345
## UFSC 0.244
## UFSE 0.227
## UFSP 0.735
## UFTO -0.222
## partidoPC do B -0.701
## partidoPDT -0.854
## partidoPHS -0.959
## partidoPMDB -1.297
## partidoPMN -1.395
## partidoPP -0.796
## partidoPPL -1.268
## partidoPPS 0.048
## partidoPR -0.288
## partidoPRB 2.915
## partidoPROS -0.666
## partidoPRP -0.872
## partidoPSB -0.447
## partidoPSC -0.381
## partidoPSD -0.008
## partidoPSDB -0.251
## partidoPSDC -0.831
## partidoPSL -1.097
## partidoPSOL 0.187
## partidoPT -0.846
## partidoPT do B -1.939
## partidoPTB -0.271
## partidoPTC -0.243
## partidoPTN -0.198
## partidoPV -1.070
## partidoSD -0.112
## setor_economico_receitaAtividades de organizações políticas -0.508
## setor_economico_receitaEdição integrada à impressão de cadastros, listas e outros produtos gráficos 1.085
## setor_economico_receitaFabricação de águas envasadas -1.607
## setor_economico_receitaFabricação de azulejos e pisos -0.127
## setor_economico_receitaImpressão de material para outros usos 0.459
## quantidade_doacoes -1.633
## quantidade_doadores 2.018
## total_receita 1.564
## media_receita 0.439
## recursos_de_outros_candidatos.comites -1.337
## recursos_de_partidos -1.568
## recursos_de_pessoas_físicas -1.591
## recursos_de_pessoas_juridicas -1.570
## recursos_proprios -1.584
## quantidade_despesas 4.938
## quantidade_fornecedores -2.348
## total_despesa -0.240
## media_despesa 2.279
## setor_economico_despesaAgenciamento de espaços para publicidade, exceto em veículos de comunicação 1.681
## setor_economico_despesaAtividades de organizações políticas 1.058
## setor_economico_despesaAtividades de franqueadas e permissionárias do Correio Nacional -0.614
## setor_economico_despesaAtividades do Correio Nacional -0.181
## setor_economico_despesaComércio varejista de artigos de papelaria -0.202
## setor_economico_despesaComércio varejista de combustíveis para veículos automotores -0.078
## setor_economico_despesaComércio varejista de cosméticos, produtos de perfumaria e de higiene pessoal -0.450
## setor_economico_despesaComércio varejista de mercadorias em geral, com predominância de produtos alimentícios - supermercados -0.925
## setor_economico_despesaConcessionárias de rodovias, pontes, túneis e serviços relacionados 1.158
## setor_economico_despesaFabricação de letras, letreiros e placas de qualquer material, exceto luminosos -0.115
## setor_economico_despesaFabricação de produtos de limpeza e polimento -0.183
## setor_economico_despesaImpressão de livros, revistas e outras publicações periódicas -0.570
## setor_economico_despesaImpressão de material para outros usos -0.682
## setor_economico_despesaImpressão de material para uso publicitário -0.007
## setor_economico_despesaInstalação de painéis publicitários -0.301
## idade 0.521
## sexoMASCULINO 0.876
## grauENSINO FUNDAMENTAL INCOMPLETO -0.213
## grauENSINO MÉDIO COMPLETO 0.322
## grauSUPERIOR COMPLETO 0.422
## grauSUPERIOR INCOMPLETO -0.522
## estado_civilDIVORCIADO(A) -0.395
## estado_civilSEPARADO(A) JUDICIALMENTE -0.418
## estado_civilSOLTEIRO(A) -2.071
## estado_civilVIÚVO(A) -1.398
## Pr(>|t|)
## (Intercept) 0.80973
## UFAL 0.53959
## UFAM 0.93715
## UFAP 0.87973
## UFBA 0.51020
## UFCE 0.89310
## UFDF 0.98401
## UFES 0.73680
## UFGO 0.82409
## UFMA 0.66679
## UFMG 0.58614
## UFMS 0.72644
## UFMT 0.77689
## UFPA 0.54922
## UFPB 0.94612
## UFPE 0.12840
## UFPI 0.44249
## UFPR 0.70952
## UFRJ 0.76665
## UFRN 0.95819
## UFRO 0.96237
## UFRR 0.45143
## UFRS 0.72999
## UFSC 0.80774
## UFSE 0.82062
## UFSP 0.46314
## UFTO 0.82441
## partidoPC do B 0.48356
## partidoPDT 0.39380
## partidoPHS 0.33833
## partidoPMDB 0.19549
## partidoPMN 0.16417
## partidoPP 0.42659
## partidoPPL 0.20564
## partidoPPS 0.96152
## partidoPR 0.77377
## partidoPRB 0.00381
## partidoPROS 0.50573
## partidoPRP 0.38394
## partidoPSB 0.65518
## partidoPSC 0.70322
## partidoPSD 0.99393
## partidoPSDB 0.80227
## partidoPSDC 0.40648
## partidoPSL 0.27329
## partidoPSOL 0.85207
## partidoPT 0.39794
## partidoPT do B 0.05336
## partidoPTB 0.78622
## partidoPTC 0.80845
## partidoPTN 0.84315
## partidoPV 0.28544
## partidoSD 0.91051
## setor_economico_receitaAtividades de organizações políticas 0.61168
## setor_economico_receitaEdição integrada à impressão de cadastros, listas e outros produtos gráficos 0.27859
## setor_economico_receitaFabricação de águas envasadas 0.10903
## setor_economico_receitaFabricação de azulejos e pisos 0.89918
## setor_economico_receitaImpressão de material para outros usos 0.64648
## quantidade_doacoes 0.10340
## quantidade_doadores 0.04448
## total_receita 0.11874
## media_receita 0.66121
## recursos_de_outros_candidatos.comites 0.18225
## recursos_de_partidos 0.11793
## recursos_de_pessoas_físicas 0.11263
## recursos_de_pessoas_juridicas 0.11747
## recursos_proprios 0.11428
## quantidade_despesas 1.29e-06
## quantidade_fornecedores 0.01952
## total_despesa 0.81068
## media_despesa 0.02337
## setor_economico_despesaAgenciamento de espaços para publicidade, exceto em veículos de comunicação 0.09380
## setor_economico_despesaAtividades de organizações políticas 0.29099
## setor_economico_despesaAtividades de franqueadas e permissionárias do Correio Nacional 0.53999
## setor_economico_despesaAtividades do Correio Nacional 0.85665
## setor_economico_despesaComércio varejista de artigos de papelaria 0.83987
## setor_economico_despesaComércio varejista de combustíveis para veículos automotores 0.93818
## setor_economico_despesaComércio varejista de cosméticos, produtos de perfumaria e de higiene pessoal 0.65298
## setor_economico_despesaComércio varejista de mercadorias em geral, com predominância de produtos alimentícios - supermercados 0.35575
## setor_economico_despesaConcessionárias de rodovias, pontes, túneis e serviços relacionados 0.24789
## setor_economico_despesaFabricação de letras, letreiros e placas de qualquer material, exceto luminosos 0.90864
## setor_economico_despesaFabricação de produtos de limpeza e polimento 0.85519
## setor_economico_despesaImpressão de livros, revistas e outras publicações periódicas 0.56916
## setor_economico_despesaImpressão de material para outros usos 0.49603
## setor_economico_despesaImpressão de material para uso publicitário 0.99456
## setor_economico_despesaInstalação de painéis publicitários 0.76371
## idade 0.60301
## sexoMASCULINO 0.38194
## grauENSINO FUNDAMENTAL INCOMPLETO 0.83144
## grauENSINO MÉDIO COMPLETO 0.74771
## grauSUPERIOR COMPLETO 0.67346
## grauSUPERIOR INCOMPLETO 0.60179
## estado_civilDIVORCIADO(A) 0.69319
## estado_civilSEPARADO(A) JUDICIALMENTE 0.67595
## estado_civilSOLTEIRO(A) 0.03923
## estado_civilVIÚVO(A) 0.16324
##
## (Intercept)
## UFAL
## UFAM
## UFAP
## UFBA
## UFCE
## UFDF
## UFES
## UFGO
## UFMA
## UFMG
## UFMS
## UFMT
## UFPA
## UFPB
## UFPE
## UFPI
## UFPR
## UFRJ
## UFRN
## UFRO
## UFRR
## UFRS
## UFSC
## UFSE
## UFSP
## UFTO
## partidoPC do B
## partidoPDT
## partidoPHS
## partidoPMDB
## partidoPMN
## partidoPP
## partidoPPL
## partidoPPS
## partidoPR
## partidoPRB **
## partidoPROS
## partidoPRP
## partidoPSB
## partidoPSC
## partidoPSD
## partidoPSDB
## partidoPSDC
## partidoPSL
## partidoPSOL
## partidoPT
## partidoPT do B .
## partidoPTB
## partidoPTC
## partidoPTN
## partidoPV
## partidoSD
## setor_economico_receitaAtividades de organizações políticas
## setor_economico_receitaEdição integrada à impressão de cadastros, listas e outros produtos gráficos
## setor_economico_receitaFabricação de águas envasadas
## setor_economico_receitaFabricação de azulejos e pisos
## setor_economico_receitaImpressão de material para outros usos
## quantidade_doacoes
## quantidade_doadores *
## total_receita
## media_receita
## recursos_de_outros_candidatos.comites
## recursos_de_partidos
## recursos_de_pessoas_físicas
## recursos_de_pessoas_juridicas
## recursos_proprios
## quantidade_despesas ***
## quantidade_fornecedores *
## total_despesa
## media_despesa *
## setor_economico_despesaAgenciamento de espaços para publicidade, exceto em veículos de comunicação .
## setor_economico_despesaAtividades de organizações políticas
## setor_economico_despesaAtividades de franqueadas e permissionárias do Correio Nacional
## setor_economico_despesaAtividades do Correio Nacional
## setor_economico_despesaComércio varejista de artigos de papelaria
## setor_economico_despesaComércio varejista de combustíveis para veículos automotores
## setor_economico_despesaComércio varejista de cosméticos, produtos de perfumaria e de higiene pessoal
## setor_economico_despesaComércio varejista de mercadorias em geral, com predominância de produtos alimentícios - supermercados
## setor_economico_despesaConcessionárias de rodovias, pontes, túneis e serviços relacionados
## setor_economico_despesaFabricação de letras, letreiros e placas de qualquer material, exceto luminosos
## setor_economico_despesaFabricação de produtos de limpeza e polimento
## setor_economico_despesaImpressão de livros, revistas e outras publicações periódicas
## setor_economico_despesaImpressão de material para outros usos
## setor_economico_despesaImpressão de material para uso publicitário
## setor_economico_despesaInstalação de painéis publicitários
## idade
## sexoMASCULINO
## grauENSINO FUNDAMENTAL INCOMPLETO
## grauENSINO MÉDIO COMPLETO
## grauSUPERIOR COMPLETO
## grauSUPERIOR INCOMPLETO
## estado_civilDIVORCIADO(A)
## estado_civilSEPARADO(A) JUDICIALMENTE
## estado_civilSOLTEIRO(A) *
## estado_civilVIÚVO(A)
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 77660 on 308 degrees of freedom
## (3748 observations deleted due to missingness)
## Multiple R-squared: 0.4605, Adjusted R-squared: 0.2941
## F-statistic: 2.767 on 95 and 308 DF, p-value: 1.725e-11
regsubsets.out <-
regsubsets(votos ~ .
-nome
-sequencial_candidato
-numero_cadidato,
data = dados_eleicoes,
nbest = 1, # 1 único modelo para cada cojunto de preditores
nvmax = NULL, # NULL para não haver limite no número de variáveis preditoras
force.in = NULL, force.out = NULL,
method = "forward")
## Reordering variables and trying again:
summary.out <- summary(regsubsets.out)
which.max(summary.out$adjr2)
## [1] 32
which(summary.out$which[32,])
## (Intercept)
## 1
## UFBA
## 5
## UFCE
## 6
## UFMS
## 12
## UFPE
## 16
## UFRJ
## 19
## UFRR
## 22
## UFSP
## 26
## UFTO
## 27
## partidoPMDB
## 34
## partidoPPL
## 37
## partidoPRB
## 40
## partidoPSD
## 46
## partidoPT do B
## 53
## partidoPV
## 57
## partidoSD
## 58
## setor_economico_receitaEdição integrada à impressão de cadastros, listas e outros produtos gráficos
## 80
## setor_economico_receitaFabricação de águas envasadas
## 83
## quantidade_doacoes
## 111
## quantidade_doadores
## 112
## media_receita
## 114
## recursos_de_outros_candidatos.comites
## 115
## recursos_proprios
## 119
## quantidade_despesas
## 120
## quantidade_fornecedores
## 121
## total_despesa
## 122
## media_despesa
## 123
## setor_economico_despesaAgenciamento de espaços para publicidade, exceto em veículos de comunicação
## 124
## setor_economico_despesaConcessionárias de rodovias, pontes, túneis e serviços relacionados
## 161
## sexoMASCULINO
## 215
## grauSUPERIOR INCOMPLETO
## 221
## estado_civilSOLTEIRO(A)
## 224
## estado_civilVIÚVO(A)
## 225
estados_relevantes <- c("BA", "CE", "MS","PE","RJ","RR","SP","TO")
partidos_relevantes <- c("PMDB", "PPL", "PRB", "PSD", "PT do B","PV", "SD")
grau_relevante <- c("SUPERIOR INCOMPLETO")
sexo_relevante <- c("MASCULINO")
estados_civis_relevantes <- c("SOLTEIRO(A)", "VIÚVO(A)")
setores_economicos_despesa_relevantes <- c("Agenciamento de espaços para publicidade, exceto em veículos de comunicação",
"Concessionárias de rodovias, pontes, túneis e serviços relacionados")
setores_economicos_receita_relevantes <- c("Edição integrada à impressão de cadastros, listas e outros produtos gráficos",
"Fabricação de águas envasadas")
dados_relevantes <- dados_eleicoes %>%
mutate (estado_relevante = ifelse(UF %in% estados_relevantes, TRUE, FALSE)) %>%
mutate (partido_relevante = ifelse(partido %in% partidos_relevantes, TRUE, FALSE)) %>%
mutate (grau_relevante = ifelse(grau %in% grau_relevante, TRUE, FALSE)) %>%
mutate (sexo_relevante = ifelse(sexo %in% sexo_relevante, TRUE, FALSE)) %>%
mutate (setor_economico_despesa_relevante = ifelse(setor_economico_despesa %in% setores_economicos_despesa_relevantes, TRUE, FALSE)) %>%
mutate (setor_economico_receita_relevante = ifelse(setor_economico_receita %in% setores_economicos_receita_relevantes, TRUE, FALSE)) %>%
mutate (estado_civil_relevante = ifelse(estado_civil %in% estados_civis_relevantes, TRUE, FALSE)) %>%
select(estado_relevante, partido_relevante,grau_relevante,sexo_relevante,estado_civil_relevante,votos, quantidade_doacoes, quantidade_doadores, media_receita
, quantidade_despesas, quantidade_fornecedores, total_despesa, media_despesa,
-recursos_de_outros_candidatos.comites, -recursos_proprios)
newdatacor <- cor(dados_relevantes)
corrplot(newdatacor)
#####Podemos notar a correlação entre as variáveis “quantidade_fornecedores” e “quantidade_despesas”, “quantidade_doadores” e “quantidade_doacoes” e ainda “total_despesa” e “quantidade_despesas”. Podemos retirar um lado dessas variáveis para tentar melhorar nosso modelo já que a correlação indica que não são úteis.
modelo_melhorado <- lm(formula = votos ~ .
-quantidade_fornecedores
-quantidade_doadores
-total_despesa,
data = dados_relevantes, na.action = na.omit)
summary(modelo_melhorado)
##
## Call:
## lm(formula = votos ~ . - quantidade_fornecedores - quantidade_doadores -
## total_despesa, data = dados_relevantes, na.action = na.omit)
##
## Residuals:
## Min 1Q Median 3Q Max
## -173235 -6414 -2547 1175 1388817
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -3.226e+03 1.370e+03 -2.355 0.01856 *
## estado_relevanteTRUE -1.399e+02 1.071e+03 -0.131 0.89606
## partido_relevanteTRUE 1.508e+03 1.248e+03 1.209 0.22676
## grau_relevanteTRUE -3.638e+03 1.709e+03 -2.128 0.03338 *
## sexo_relevanteTRUE 3.756e+03 1.232e+03 3.049 0.00231 **
## estado_civil_relevanteTRUE -1.458e+03 1.199e+03 -1.215 0.22425
## quantidade_doacoes 2.439e+02 1.439e+01 16.953 < 2e-16 ***
## media_receita 6.373e-01 4.761e-02 13.387 < 2e-16 ***
## quantidade_despesas 3.268e+01 1.740e+00 18.779 < 2e-16 ***
## media_despesa 3.256e+00 3.981e-01 8.179 3.76e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 34330 on 4142 degrees of freedom
## Multiple R-squared: 0.4266, Adjusted R-squared: 0.4254
## F-statistic: 342.4 on 9 and 4142 DF, p-value: < 2.2e-16
residuos <- residuals(modelo_melhorado)
predicao <- predict(modelo_melhorado)
plot(predicao, residuos)