library(readr)
library(dplyr)
library(plyr)
library(ggplot2)
library(ggrepel)
library(gridExtra)
library(plotly)
dadosCEAP <- read_csv("dadosCEAP.csv")
dadosCEAP$valorGlosa <- as.numeric(sub(",", ".", dadosCEAP$valorGlosa, fixed = TRUE))
limiteMensalCEAP <- read_csv("limiteMensalCEAP.csv")
Para responder a primeira pergunta, podemos mostrar um gráfico de barras com todos os gastos de deputados e observar o máximo e o mínimo:
Entretanto, é difícil identificar o maior e menor em meio a tantas entradas, e ainda mais quando estão desordenadas. Podemos então criar um gráfico ordenado para mostrar dois subgrupos contendo 10 deputados cada: os que mais gastaram, e os que menos gastaram:
Para responder essa questão, faremos basicamente o mesmo procedimento da questão anterior, agrupando os valores por estado. Nos nosso dados, temos uma coluna identificando o tipo do Documento, que tem valor 2 quando foi de um gasto no exterior. Assim, é necessário filtrar as entradas que possuem esse valor na coluna, e repetir o procedimento da questão anterior:
Nesse gráfico, já podemos observar mais de perto quais os estados que gastaram no exterior. Entretanto, ainda é justo analisarmos o Top10 estados que mais e menos gastou no exterior:
Para esta pergunta, poderíamos repetir os processos anteriores e plotar dois gráficos de barras. Entretanto, plotando um gráfico de pontos, sendo o eixo x a frequência de gastos, e o eixo y o valor gasto, podemos verificar a pergunta em sua totalidade com apenas um gráfico, além de analisar a correlação de ambas as variáveis:
Ao ver o gráfico, podemos supor que existe correlação entre ambas as variáveis, com valor de 0.9753402.
Para responder essa pergunta, precisamos agrupar os gastos mensalmente. Em seguida, para cada estado, podemos ver os deputados que mais ultrapassaram a cota mensal, de estado para estado:
No gráfico acima, é possível observar quais os 10 deputados que mais estouraram a cota da CEAP, e também os estados que fazem parte.
Pelo gráfico acima, podemos observar que São Paulo é o estado que mais frequentemente gastou com passagens aéreas e também o que gastou um maior valor com as mesmas.
Tendo sido escolhidos PT, PSDB e PMDB, temos:
Pelos gráficos, podemos observar que os maiores gastos dos três partidos são: Em primeiro lugar, Emissão de Bilhetes Aéreos; em segundo lugar, Divulgação da atividade parlamentar; já em terceiro lugar, o PT e o PSDB ficam com a Manutenção de Escritório de Apoio à atividade Parlamentar, enquanto o PMDB gasta com Locação ou Fretamento de veículos automotores.
Já quanto à frequência, o PT mais frequentemente gasta com Emissão de Bilhetes aéreos, Combustíveis e lubrificantes e Serviços de Taxi, Pedágio e Estacionamento, enquanto o PSDB e o PMDB gastam com Emissão de Bilhetes aéreos, Combustíveis e lubrificantes e Telefonia.