Introdução

Este trabalho buscar estabelecer a relação entre investimento financeiro e quantidade de votos nas campanhas eleitorais de deputado estadual do Rio de Janeiro do ano de 2018 para entender a diferença de prosperidade eleitoral baseado em capital financeiro.

Objetivos

A partir de dados retirados, principalmente do site do TSE, busca-se entender o quanto foi gasto e superfaturado na campanha de cada candidato a deputado estadual apto e eleito na eleição de 2018. Temos como objetivo testar a relação entre os gastos e o voto, para entedimento de valor de voto e de importância de financiamento em campanhas, utilizando a métrica do marketing CAC (Custo de Aquisição de Clientes). Procuramos entender se a quantidade de votos e investimento são diretamente proporcionais, ou seja, quanto mais capital o candidato aplicou à sua campanha, melhor resultado obteve considerando votantes.

Temos os questionamentos a serem respondidos nessa pesquisa: 1. Existe uma realação entre a o número de votos e os gastos de campanha? 2. Há uma grande diferença nos gastos e votos dos candidatos eleitos por QP e por Média? 3.Qual é a estimativa de gastos dos candidatos eleitos?

Metodologia

Material

Utilizamos a base de dados fornecidos pelo tribunal superior eleitoral, na pagina de eleições federais gerais, baixamos o arquivo “Lista-Candidatos-Deputado Estadual-RIO DE JANEIRO-2018.csv” Onde tivemos acesso aos candidatos .

Operacionalização das Variáveis

Utilizando R e Microsoft Excel filtramos os dados para que pudesse ser utilizado com mais facilidade no R, resolvendo alguns problemas na formatação do arquivo como retirar os R$ e virgulas, que poderiam atrapalhar nas operações com o R. Dessa forma também filtramos para apenas os candidatos eleitos para facilitar o manejo da base de dados.

## Rows: 70 Columns: 10
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): Nome Completo, Nome Urna, Cargo, Partido, Coligação, Situação, Situ...
## dbl (3): Número, Total d dspsas, quantidade de votos
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## # A tibble: 70 × 10
##    `Nome Completo`           `Nome Urna` Cargo Número Partido Coligação Situação
##    <chr>                     <chr>       <chr>  <dbl> <chr>   <chr>     <chr>   
##  1 ALANA DE OLIVEIRA PASSOS… ALANA PASS… Depu…  17120 PSL     PSL       Deferido
##  2 ALEXANDRE TEIXEIRA DE FR… ALEXANDRE … Depu…  30007 NOVO    NOVO      Deferido
##  3 ALEXANDRE GOMES KNOPLOCH… ALEXANDRE … Depu…  17890 PSL     PSL       Deferido
##  4 WANDERSON GIMENES ALEXAN… ANDERSON A… Depu…  77888 SOLIDA… TRABALHA… Deferido
##  5 ANDERSON LUIS DE MORAES   ANDERSON M… Depu…  17017 PSL     PSL       Deferido
##  6 ANDRÉ LUIZ CECILIANO      ANDRÉ CECI… Depu…  13567 PT      PT        Deferido
##  7 ANDRÉ GUSTAVO PEREIRA CO… ANDRÉ CORR… Depu…  25123 DEM     DEM       Deferido
##  8 JOSÉ ROBERTO GAMA DE OLI… BEBETO TET… Depu…  19777 PODE    O POVO N… Deferido
##  9 BRUNO FELGUEIRA DAUAIRE   BRUNO DAUA… Depu…  44888 PRP     PRP       Deferido
## 10 WALCYSNEU CARLOS MACEDO … CARLOS MAC… Depu…  10100 PRB     PRB       Deferido
## # ℹ 60 more rows
## # ℹ 3 more variables: `Situação Pós-Pleito` <chr>, `Total d dspsas` <dbl>,
## #   `quantidade de votos` <dbl>

Metodologia

Método

Para vizualizar a correlação entre os valores das variáveis de quantidade de votos e valor de despezas utilizamos um diagrama de dispersão.Em seguida utilizando as variàvel sistuação pós-eleito, que nos indica se o candidato foi eleito por quociente partidario ou por média, elabaramos dois box plots, um relaionando esta variável com a variável de gastos, e outra com a variável de votos, para analisarmos com estão distribuidos os valores dessas variaveis quantitativas em razão dos dois tipos de objeto da variàvel qualitativa. Para descobrir a estimativa de gastos dos candidatos eleitos utilizamos um histograma. ## Teste de Hipótese Por ultimo utilizamos o teste de hipotéses, para determinar se os dados seguem a distribuição normal e se as variáveis de gastos e votos de fato tem relação entre elas. Adotous-se alpha = 0,05 para todos os testes realizados. Assim, como regra de ánilese temos:

Se p-valor≤alpha, rejeita H0 Se p-valor > alpha, não rejeita H0

O primeiro teste foi o de Shapiro, onde tivemos consideram o seguinte H0: os segeum uma distribuição normal H1: Os dados não segeum uma distribuição normal

Após isso utilizamos o spearman, para detectar se as variáveis possuem associação. Logo assumimos que: H0: Não há associação [monotônica] entre as duas variáveis. H1: Hà associação [monotônica] entre as duas variáveis.

Análise de resultados

Matriz de correlação

## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Baixa associação, que tende a zero,

Boxplot

A amplitude média dos eleitos por média é próxima à dos eleitos por quociente partidario, o vale de ambos tende a zero, porém se diferenciam no pico, o onde os eleitos por QP apresentam maior valor. Não há outliers nesses gráficos.

Histograma

O histograma apresenta maior frequencia entre os valores 0 ,200.000

Teste de hipotese

## 
##  Shapiro-Wilk normality test
## 
## data:  candidatos$`Total d dspsas`
## W = 0.88976, p-value = 1.564e-05
## 
##  Shapiro-Wilk normality test
## 
## data:  candidatos$`quantidade de votos`
## W = 0.10019, p-value < 2.2e-16

alpha>pvalor = rejeita a hipótese nula

## 
##  Spearman's rank correlation rho
## 
## data:  candidatos$`Total d dspsas` and candidatos$`quantidade de votos`
## S = 47820, p-value = 0.1763
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.1633278

alpha<p-valor logo não rejeita a hipótese nula.

Discussão

A baixa relação no diagrama indica que não necessáriamente os candidatos mais votados tiveram mais gatos com a campanha.

Ao analisar o gráfico boxplot há de se perceber que a média de gastos, entre elitos por média e elitos por QP, possuem equivalencia. Entretanto o gráfico apresenta um Pico descrepante. Isso se dá por dois fatores, priemiramente o baixo valor amostral da base e a inrregulradide de gastos dos valores acima da média. No entanto a mesma análise não se mostrou verídca nos valores de vale. Concluimos então que há um valor mínimo de investimento para se tornar um candidato eleito, e tal valor tende a se aproximar da média. o fato do vale dos eleitos por QP ser menor do que o dos eleitos por Media, revela que o candidato eleito com a menor quantidade de votos assim como o eleito com a maior quantidade de votos foram eleitos por quosceinte eleitoral.

O histograma revela que a parte mais significativa dos Eleitos gastaram até 200 mil reais em sua campanha,a partir daí o gráfico apresenta uma queda, Ou seja, existe um mínimo para ser eleito mas não existe um máximo.

Ambas as nossas variáveis rejeitam a hipótese nula no teste de Shapiro, logo não possuem uma distribuição normal. Logo para avaliarmos se elas de fato possuem associação [monotônica] fizemos o teste de Speraman, em que a hipotese nula não foi rejeitada, logo concluimos que não hà associação entre total de gastos e número de votos.

Conclusão