Este trabalho buscar estabelecer a relação entre investimento financeiro e quantidade de votos nas campanhas eleitorais de deputado estadual do Rio de Janeiro do ano de 2018 para entender a diferença de prosperidade eleitoral baseado em capital financeiro.
A partir de dados retirados, principalmente do site do TSE, busca-se entender o quanto foi gasto e superfaturado na campanha de cada candidato a deputado estadual apto e eleito na eleição de 2018. Temos como objetivo testar a relação entre os gastos e o voto. Procuramos entender se a quantidade de votos e investimento são diretamente proporcionais, ou seja, quanto mais capital o candidato aplicou à sua campanha, melhor resultado obteve considerando votantes.
Temos os questionamentos a serem respondidos nessa pesquisa: 1. Existe uma realação entre a o número de votos e os gastos de campanha? 2. Há uma grande diferença nos gastos e votos dos candidatos eleitos por QP e por Média? 3.Qual é a estimativa de gastos dos candidatos eleitos?
Utilizamos a base de dados fornecidos pelo tribunal superior eleitoral, na pagina de eleições federais gerais, baixamos o arquivo “Lista-Candidatos-Deputado Estadual-RIO DE JANEIRO-2018.csv” Onde tivemos acesso aos candidatos .
Utilizando R e Microsoft Excel filtramos os dados para que pudesse ser utilizado com mais facilidade no R, resolvendo alguns problemas na formatação do arquivo como retirar os R$ e virgulas, que poderiam atrapalhar nas operações com o R. Dessa forma também filtramos para apenas os candidatos eleitos para facilitar o manejo da base de dados.
## Rows: 70 Columns: 10
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Nome Completo, Nome Urna, Cargo, Partido, Coligação, Situação, Situ...
## dbl (3): Número, Total d dspsas, quantidade de votos
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Para vizualizar a correlação entre os valores das variáveis de quantidade de votos e valor de despezas utilizamos um diagrama de dispersão.Em seguida utilizando as variàvel sistuação pós-eleito, que nos indica se o candidato foi eleito por quociente partidario ou por média, elabaramos dois box plots, um relaionando esta variável com a variável de gastos, e outra com a variável de votos, para analisarmos com estão distribuidos os valores dessas variaveis quantitativas em razão dos dois tipos de objeto da variàvel qualitativa. Para descobrir a estimativa de gastos dos candidatos eleitos utilizamos um histograma.
Nome Completo - Consiste no nome completo do candidato Nome Urna - Como o nome do candidato aparece na urna
Cargo - Cargo ao qual concorreu
Número - Numero do candidato na votação
Partido - Partido ao qual o candidato pertencia enquanto concorreu
Coligação - Coligação da qual o candidato fazia parte, caso não fizesse parte de uma coligação, repetiria o nome do seu partido
Situação - Se a candiadtura foi deferida ou indeferida Situação Pós-Pleito - Se o candidato foi eleito, e se foi por Quociente Partidario ou por média
Total d dspsas - Quanto foi o total de gastos do candidato nas eleições
quantidade de votos - Total de votos que o candidato obteve
Por ultimo utilizamos o teste de hipotéses, para determinar se os dados seguem a distribuição normal e se as variáveis de gastos e votos de fato tem relação entre elas. Adotous-se alpha = 0,05 para todos os testes realizados. Assim, como regra de análese temos:
Se p-valor≤alpha, rejeita H0 Se p-valor > alpha, não rejeita H0
O primeiro teste foi o de Shapiro, onde tivemos consideram o seguinte H0: os segeum uma distribuição normal H1: Os dados não seguem uma distribuição normal
Após isso utilizamos o spearman, para detectar se as variáveis possuem associação. Logo assumimos que: H0: Não há associação [monotônica] entre as duas variáveis. H1: Hà associação [monotônica] entre as duas variáveis.
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
Poodemos ver pela Matriz de correlação que há pouca relaçào entre as variáveis de voto e de total de despesas. A baixa relação no diagrama indica que não necessáriamente os candidatos mais votados tiveram mais gatos com a campanha.
A amplitude média dos eleitos por média é próxima à dos eleitos por quociente partidario, o vale de ambos tende a zero, porém se diferenciam no pico, o onde os eleitos por QP apresentam maior valor. Não há outliers nesses gráficos. Ao analisar o gráfico boxplot há de se perceber que a média de gastos, entre elitos por média e elitos por QP, possuem equivalencia.
Entretanto o gráfico apresenta um Pico descrepante. Isso se dá por dois fatores, priemiramente o baixo valor amostral da base e a inrregulradide de gastos dos valores acima da média. No entanto a mesma análise não se mostrou verídca nos valores de vale. Concluimos então que há um valor mínimo de investimento para se tornar um candidato eleito, e tal valor tende a se aproximar da média. o fato do vale dos eleitos por QP ser menor do que o dos eleitos por Media, revela que o candidato eleito com a menor quantidade de votos assim como o eleito com a maior quantidade de votos foram eleitos por quosceinte eleitoral.
O histograma apresenta maior frequencia entre os valores 0 ,200.000. O
histograma revela que a parte mais significativa dos Eleitos gastaram
até 200 mil reais em sua campanha,a partir daí o gráfico apresenta uma
queda, Ou seja, existe um mínimo para ser eleito mas não existe um
máximo.Concluimos também que ambso os eletos por quociente partidário
qunato por média possui valores medios de investimentos próximos.
##
## Shapiro-Wilk normality test
##
## data: candidatos$`Total d dspsas`
## W = 0.88246, p-value = 0.000008412
##
## Shapiro-Wilk normality test
##
## data: candidatos$`quantidade de votos`
## W = 0.82222, p-value = 0.00000009798
alpha>pvalor = rejeita a hipótese nula, vemos logo que ambas as variáveis
##
## Spearman's rank correlation rho
##
## data: candidatos$`Total d dspsas` and candidatos$`quantidade de votos`
## S = 48420, p-value = 0.2061
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.15283
alpha<p-valor logo não rejeita a hipótese nula.
Ambas as nossas variáveis rejeitam a hipótese nula no teste de Shapiro, logo não possuem uma distribuição normal. Logo para avaliarmos se elas de fato possuem associação [monotônica] fizemos o teste de Speraman, em que a hipotese nula não foi rejeitada, logo concluimos que não hà associação entre total de gastos e número de votos.
Em relação à hipótese proposta de que a proporção de votos e investimento é diretamente proporcional, os resultados obtidos indicam que essa relação pode ser mais complexa do que o esperado. Embora seja comum pensar que candidatos que gastam mais recursos financeiros em suas campanhas obtêm melhores resultados eleitorais, outros fatores, como o carisma do candidato, suas propostas políticas e a conjuntura política do país, também desempenham um papel significativo na decisão do eleitor. porém em nossas análsies também nos levam a supor que há um valor mínimo para ser eleito. já que nenhum candidato foi eleito sem investir.
.