Introdução

Este trabalho buscar estabelecer a relação entre investimento financeiro e quantidade de votos nas campanhas eleitorais de deputado estadual do Rio de Janeiro do ano de 2018 para entender a diferença de prosperidade eleitoral baseado em capital financeiro.

Objetivos

A partir de dados retirados, principalmente do site do TSE, busca-se entender o quanto foi gasto e superfaturado na campanha de cada candidato a deputado estadual apto e eleito na eleição de 2018. Temos como objetivo testar a relação entre os gastos e o voto. Procuramos entender se a quantidade de votos e investimento são diretamente proporcionais, ou seja, quanto mais capital o candidato aplicou à sua campanha, melhor resultado obteve considerando votantes.

Temos os questionamentos a serem respondidos nessa pesquisa: 1. Existe uma realação entre a o número de votos e os gastos de campanha? 2. Há uma grande diferença nos gastos e votos dos candidatos eleitos por QP e por Média? 3.Qual é a estimativa de gastos dos candidatos eleitos?

Metodologia

Material

Utilizamos a base de dados fornecidos pelo tribunal superior eleitoral, na pagina de eleições federais gerais, baixamos o arquivo “Lista-Candidatos-Deputado Estadual-RIO DE JANEIRO-2018.csv” Onde tivemos acesso aos candidatos .

Operacionalização das Variáveis

Utilizando R e Microsoft Excel filtramos os dados para que pudesse ser utilizado com mais facilidade no R, resolvendo alguns problemas na formatação do arquivo como retirar os R$ e virgulas, que poderiam atrapalhar nas operações com o R. Dessa forma também filtramos para apenas os candidatos eleitos para facilitar o manejo da base de dados.

## Rows: 70 Columns: 10
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Nome Completo, Nome Urna, Cargo, Partido, Coligação, Situação, Situ...
## dbl (3): Número, Total d dspsas, quantidade de votos
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Metodologia

Método

Para vizualizar a correlação entre os valores das variáveis de quantidade de votos e valor de despezas utilizamos um diagrama de dispersão.Em seguida utilizando as variàvel sistuação pós-eleito, que nos indica se o candidato foi eleito por quociente partidario ou por média, elabaramos dois box plots, um relaionando esta variável com a variável de gastos, e outra com a variável de votos, para analisarmos com estão distribuidos os valores dessas variaveis quantitativas em razão dos dois tipos de objeto da variàvel qualitativa. Para descobrir a estimativa de gastos dos candidatos eleitos utilizamos um histograma.

Codebook

Nome Completo - Consiste no nome completo do candidato Nome Urna - Como o nome do candidato aparece na urna

Cargo - Cargo ao qual concorreu

Número - Numero do candidato na votação

Partido - Partido ao qual o candidato pertencia enquanto concorreu

Coligação - Coligação da qual o candidato fazia parte, caso não fizesse parte de uma coligação, repetiria o nome do seu partido

Situação - Se a candiadtura foi deferida ou indeferida Situação Pós-Pleito - Se o candidato foi eleito, e se foi por Quociente Partidario ou por média

Total d dspsas - Quanto foi o total de gastos do candidato nas eleições

quantidade de votos - Total de votos que o candidato obteve

Teste de Hipótese

Por ultimo utilizamos o teste de hipotéses, para determinar se os dados seguem a distribuição normal e se as variáveis de gastos e votos de fato tem relação entre elas. Adotous-se alpha = 0,05 para todos os testes realizados. Assim, como regra de análese temos:

Se p-valor≤alpha, rejeita H0 Se p-valor > alpha, não rejeita H0

O primeiro teste foi o de Shapiro, onde tivemos consideram o seguinte H0: os segeum uma distribuição normal H1: Os dados não seguem uma distribuição normal

Após isso utilizamos o spearman, para detectar se as variáveis possuem associação. Logo assumimos que: H0: Não há associação [monotônica] entre as duas variáveis. H1: Hà associação [monotônica] entre as duas variáveis.

Análise de resultados e Discussão

Matriz de correlação

## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Poodemos ver pela Matriz de correlação que há pouca relaçào entre as variáveis de voto e de total de despesas. A baixa relação no diagrama indica que não necessáriamente os candidatos mais votados tiveram mais gatos com a campanha.

Boxplot

A amplitude média dos eleitos por média é próxima à dos eleitos por quociente partidario, o vale de ambos tende a zero, porém se diferenciam no pico, o onde os eleitos por QP apresentam maior valor. Não há outliers nesses gráficos. Ao analisar o gráfico boxplot há de se perceber que a média de gastos, entre elitos por média e elitos por QP, possuem equivalencia.

Entretanto o gráfico apresenta um Pico descrepante. Isso se dá por dois fatores, priemiramente o baixo valor amostral da base e a inrregulradide de gastos dos valores acima da média. No entanto a mesma análise não se mostrou verídca nos valores de vale. Concluimos então que há um valor mínimo de investimento para se tornar um candidato eleito, e tal valor tende a se aproximar da média. o fato do vale dos eleitos por QP ser menor do que o dos eleitos por Media, revela que o candidato eleito com a menor quantidade de votos assim como o eleito com a maior quantidade de votos foram eleitos por quosceinte eleitoral.

Histograma

O histograma apresenta maior frequencia entre os valores 0 ,200.000. O histograma revela que a parte mais significativa dos Eleitos gastaram até 200 mil reais em sua campanha,a partir daí o gráfico apresenta uma queda, Ou seja, existe um mínimo para ser eleito mas não existe um máximo.Concluimos também que ambso os eletos por quociente partidário qunato por média possui valores medios de investimentos próximos.

Teste de hipotese

## 
##  Shapiro-Wilk normality test
## 
## data:  candidatos$`Total d dspsas`
## W = 0.88246, p-value = 0.000008412
## 
##  Shapiro-Wilk normality test
## 
## data:  candidatos$`quantidade de votos`
## W = 0.82222, p-value = 0.00000009798

alpha>pvalor = rejeita a hipótese nula, vemos logo que ambas as variáveis

## 
##  Spearman's rank correlation rho
## 
## data:  candidatos$`Total d dspsas` and candidatos$`quantidade de votos`
## S = 48420, p-value = 0.2061
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##     rho 
## 0.15283

alpha<p-valor logo não rejeita a hipótese nula.

Ambas as nossas variáveis rejeitam a hipótese nula no teste de Shapiro, logo não possuem uma distribuição normal. Logo para avaliarmos se elas de fato possuem associação [monotônica] fizemos o teste de Speraman, em que a hipotese nula não foi rejeitada, logo concluimos que não hà associação entre total de gastos e número de votos.

Conclusão

Em relação à hipótese proposta de que a proporção de votos e investimento é diretamente proporcional, os resultados obtidos indicam que essa relação pode ser mais complexa do que o esperado. Embora seja comum pensar que candidatos que gastam mais recursos financeiros em suas campanhas obtêm melhores resultados eleitorais, outros fatores, como o carisma do candidato, suas propostas políticas e a conjuntura política do país, também desempenham um papel significativo na decisão do eleitor. porém em nossas análsies também nos levam a supor que há um valor mínimo para ser eleito. já que nenhum candidato foi eleito sem investir.

.