Este trabalho buscar estabelecer a relação entre investimento financeiro e quantidade de votos nas campanhas eleitorais de deputado estadual do Rio de Janeiro do ano de 2018 para entender a diferença de prosperidade eleitoral baseado em capital financeiro.
A partir de dados retirados, principalmente do site do TSE, busca-se entender o quanto foi gasto e superfaturado na campanha de cada candidato a deputado estadual apto e eleito na eleição de 2018. Temos como objetivo testar a relação entre os gastos e o voto, para entedimento de valor de voto e de importância de financiamento em campanhas, utilizando a métrica do marketing CAC (Custo de Aquisição de Clientes). Procuramos entender se a quantidade de votos e investimento são diretamente proporcionais, ou seja, quanto mais capital o candidato aplicou à sua campanha, melhor resultado obteve considerando votantes.
Temos os questionamentos a serem respondidos nessa pesquisa: 1. Existe uma realação entre a o número de votos e os gastos de campanha? 2. Há uma grande diferença nos gastos e votos dos candidatos eleitos por QP e por Média? 3.Qual é a estimativa de gastos dos candidatos eleitos?
Utilizamos a base de dados fornecidos pelo tribunal superior eleitoral, na pagina de eleições federais gerais, baixamos o arquivo “Lista-Candidatos-Deputado Estadual-RIO DE JANEIRO-2018.csv” Onde tivemos acesso aos candidatos .
Utilizando R e Microsoft Excel filtramos os dados para que pudesse ser utilizado com mais facilidade no R, resolvendo alguns problemas na formatação do arquivo como retirar os R$ e virgulas, que poderiam atrapalhar nas operações com o R. Dessa forma também filtramos para apenas os candidatos eleitos para facilitar o manejo da base de dados.
## Rows: 70 Columns: 10
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Nome Completo, Nome Urna, Cargo, Partido, Coligação, Situação, Situ...
## dbl (3): Número, Total d dspsas, quantidade de votos
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## # A tibble: 70 × 10
## `Nome Completo` `Nome Urna` Cargo Número Partido Coligação Situação
## <chr> <chr> <chr> <dbl> <chr> <chr> <chr>
## 1 ALANA DE OLIVEIRA PASSOS… ALANA PASS… Depu… 17120 PSL PSL Deferido
## 2 ALEXANDRE TEIXEIRA DE FR… ALEXANDRE … Depu… 30007 NOVO NOVO Deferido
## 3 ALEXANDRE GOMES KNOPLOCH… ALEXANDRE … Depu… 17890 PSL PSL Deferido
## 4 WANDERSON GIMENES ALEXAN… ANDERSON A… Depu… 77888 SOLIDA… TRABALHA… Deferido
## 5 ANDERSON LUIS DE MORAES ANDERSON M… Depu… 17017 PSL PSL Deferido
## 6 ANDRÉ LUIZ CECILIANO ANDRÉ CECI… Depu… 13567 PT PT Deferido
## 7 ANDRÉ GUSTAVO PEREIRA CO… ANDRÉ CORR… Depu… 25123 DEM DEM Deferido
## 8 JOSÉ ROBERTO GAMA DE OLI… BEBETO TET… Depu… 19777 PODE O POVO N… Deferido
## 9 BRUNO FELGUEIRA DAUAIRE BRUNO DAUA… Depu… 44888 PRP PRP Deferido
## 10 WALCYSNEU CARLOS MACEDO … CARLOS MAC… Depu… 10100 PRB PRB Deferido
## # ℹ 60 more rows
## # ℹ 3 more variables: `Situação Pós-Pleito` <chr>, `Total d dspsas` <dbl>,
## # `quantidade de votos` <dbl>
Para vizualizar a correlação entre os valores das variáveis de quantidade de votos e valor de despezas utilizamos um diagrama de dispersão.Em seguida utilizando as variàvel sistuação pós-eleito, que nos indica se o candidato foi eleito por quociente partidario ou por média, elabaramos dois box plots, um relaionando esta variável com a variável de gastos, e outra com a variável de votos, para analisarmos com estão distribuidos os valores dessas variaveis quantitativas em razão dos dois tipos de objeto da variàvel qualitativa. Para descobrir a estimativa de gastos dos candidatos eleitos utilizamos um histograma. ## Teste de Hipótese Por ultimo utilizamos o teste de hipotéses, para determinar se os dados seguem a distribuição normal e se as variáveis de gastos e votos de fato tem relação entre elas. Adotous-se alpha = 0,05 para todos os testes realizados. Assim, como regra de ánilese temos:
Se p-valor≤alpha, rejeita H0 Se p-valor > alpha, não rejeita H0
O primeiro teste foi o de Shapiro, onde tivemos consideram o seguinte H0: os segeum uma distribuição normal H1: Os dados não segeum uma distribuição normal
Após isso utilizamos o spearman, para detectar se as variáveis possuem associação. Logo assumimos que: H0: Não há associação [monotônica] entre as duas variáveis. H1: Hà associação [monotônica] entre as duas variáveis.
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Baixa associação, que tende a zero,
A amplitude média dos eleitos por média é próxima à dos eleitos por quociente partidario, o vale de ambos tende a zero, porém se diferenciam no pico, o onde os eleitos por QP apresentam maior valor. Não há outliers nesses gráficos.
O histograma apresenta maior frequencia entre os valores 0 ,200.000
##
## Shapiro-Wilk normality test
##
## data: candidatos$`Total d dspsas`
## W = 0.88976, p-value = 1.564e-05
##
## Shapiro-Wilk normality test
##
## data: candidatos$`quantidade de votos`
## W = 0.10019, p-value < 2.2e-16
alpha>pvalor = rejeita a hipótese nula
##
## Spearman's rank correlation rho
##
## data: candidatos$`Total d dspsas` and candidatos$`quantidade de votos`
## S = 47820, p-value = 0.1763
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.1633278
alpha<p-valor logo não rejeita a hipótese nula.
A baixa relação no diagrama indica que não necessáriamente os candidatos mais votados tiveram mais gatos com a campanha.
Ao analisar o gráfico boxplot há de se perceber que a média de gastos, entre elitos por média e elitos por QP, possuem equivalencia. Entretanto o gráfico apresenta um Pico descrepante. Isso se dá por dois fatores, priemiramente o baixo valor amostral da base e a inrregulradide de gastos dos valores acima da média. No entanto a mesma análise não se mostrou verídca nos valores de vale. Concluimos então que há um valor mínimo de investimento para se tornar um candidato eleito, e tal valor tende a se aproximar da média. o fato do vale dos eleitos por QP ser menor do que o dos eleitos por Media, revela que o candidato eleito com a menor quantidade de votos assim como o eleito com a maior quantidade de votos foram eleitos por quosceinte eleitoral.
O histograma revela que a parte mais significativa dos Eleitos gastaram até 200 mil reais em sua campanha,a partir daí o gráfico apresenta uma queda, Ou seja, existe um mínimo para ser eleito mas não existe um máximo.
Ambas as nossas variáveis rejeitam a hipótese nula no teste de Shapiro, logo não possuem uma distribuição normal. Logo para avaliarmos se elas de fato possuem associação [monotônica] fizemos o teste de Speraman, em que a hipotese nula não foi rejeitada, logo concluimos que não hà associação entre total de gastos e número de votos.