Importando as bibliotecas

library(readr)
library(dplyr)
library(plyr)
library(ggplot2)
library(ggrepel)
library(gridExtra)
library(plotly)

Importando e padronizando os dados

dadosCEAP <- read_csv("dadosCEAP.csv")
dadosCEAP$valorGlosa <- as.numeric(sub(",", ".", dadosCEAP$valorGlosa, fixed = TRUE))
limiteMensalCEAP <- read_csv("limiteMensalCEAP.csv")

Questão 1: Quais são os deputados que gastaram mais dinheiro da CEAP? Quais são os mais econômicos?

Para responder a primeira pergunta, podemos mostrar um gráfico de barras com todos os gastos de deputados e observar o máximo e o mínimo:

Entretanto, é difícil identificar o maior e menor em meio a tantas entradas, e ainda mais quando estão desordenadas. Podemos então criar um gráfico ordenado para mostrar dois subgrupos contendo 10 deputados cada: os que mais gastaram, e os que menos gastaram:

Questão 2: Quais os estados cujos deputados gastam mais no exterior? Quais os estados cujos deputados gastam menos no exterior?

Para responder essa questão, faremos basicamente o mesmo procedimento da questão anterior, agrupando os valores por estado. Nos nosso dados, temos uma coluna identificando o tipo do Documento, que tem valor 2 quando foi de um gasto no exterior. Assim, é necessário filtrar as entradas que possuem esse valor na coluna, e repetir o procedimento da questão anterior:

Nesse gráfico, já podemos observar mais de perto quais os estados que gastaram no exterior. Entretanto, ainda é justo analisarmos o Top10 estados que mais e menos gastou no exterior:

Questão 3: Quais os partidos cujos parlamentares mais usam CEAP no estado da Paraíba? Quais são os que menos usam? Mesmas perguntas considerando valores em R$.

Para esta pergunta, poderíamos repetir os processos anteriores e plotar dois gráficos de barras. Entretanto, plotando um gráfico de pontos, sendo o eixo x a frequência de gastos, e o eixo y o valor gasto, podemos verificar a pergunta em sua totalidade com apenas um gráfico, além de analisar a correlação de ambas as variáveis:

Ao ver o gráfico, podemos supor que existe correlação entre ambas as variáveis, com valor de 0.9753402.

Questão 4: Quais os deputados que mais ultrapassam o limite de CEAP do seu estado?

Para responder essa pergunta, precisamos agrupar os gastos mensalmente. Em seguida, para cada estado, podemos ver os deputados que mais ultrapassaram a cota mensal, de estado para estado:

No gráfico acima, é possível observar quais os 10 deputados que mais estouraram a cota da CEAP, e também os estados que fazem parte.

Questão 5: Quais estados cujos parlamentares gastam mais com passagens aéreas?

Pelo gráfico acima, podemos observar que São Paulo é o estado que mais frequentemente gastou com passagens aéreas e também o que gastou um maior valor com as mesmas.

Questão 6: Escolha três partidos e responda: Quais são os tipos de despesa mais utilizados no uso da CEAP pelos deputados desses partidos? Mesma pergunta considerando valores em R$

Tendo sido escolhidos PT, PSDB e PMDB, temos:

  1. Para o PT:

  1. Para o PSDB:

  1. Para o PMDB:

Pelos gráficos, podemos observar que os maiores gastos dos três partidos são: Em primeiro lugar, Emissão de Bilhetes Aéreos; em segundo lugar, Divulgação da atividade parlamentar; já em terceiro lugar, o PT e o PSDB ficam com a Manutenção de Escritório de Apoio à atividade Parlamentar, enquanto o PMDB gasta com Locação ou Fretamento de veículos automotores.

Já quanto à frequência, o PT mais frequentemente gasta com Emissão de Bilhetes aéreos, Combustíveis e lubrificantes e Serviços de Taxi, Pedágio e Estacionamento, enquanto o PSDB e o PMDB gastam com Emissão de Bilhetes aéreos, Combustíveis e lubrificantes e Telefonia.