library(readr)
library(ggplot2)
library(dplyr)
library(lubridate)
library(scales)
dadosCEAP <- read_csv("dadosCEAP.csv")
dadosCEAP <- filter(dadosCEAP, valorLíquido >= 0)
dadosMes <- dadosCEAP %>% group_by(mes=month(dataEmissao)) %>% filter(!is.na(dataEmissao)) %>% summarize(valor=sum(valorLíquido))
ggplot(dadosMes, aes(mes,valor)) + geom_line(aes(y=valor)) + scale_x_discrete(limits=levels(as.factor(dadosMes$mes))) + scale_y_discrete(limits=dadosMes$valor) + labs(title="Gastos por mês", x="Mes", y="Valor em R$")
É possível observar que entre Março e Agosto há um índice maior de gastos. Enquanto que a partir de Setembro os gastos diminuem com exceção de um pequeno salto em Dezembro, o que talvez se justifique pelo período de Férias.
dadosFerias <- dadosCEAP %>% filter(month(dataEmissao) %in% c(01,02,07,12))
dadosFerias <- dadosFerias %>% select(tipoDespesa, dataEmissao)
dadosFerias <- summarise(group_by(dadosFerias, tipoDespesa), Quantidade = n())
dadosFerias <- arrange(dadosFerias, desc(Quantidade))
dadosFerias$tipoDespesa <- factor(dadosFerias$tipoDespesa, levels = unique(dadosFerias$tipoDespesa)[order(dadosFerias$Quantidade, decreasing = TRUE)])
ggplot(head(dadosFerias, 5), aes(tipoDespesa, Quantidade)) + geom_bar(aes(tipoDespesa), stat = "identity") + labs(title = "Despesas mais frequentes durante as Férias", x = "Tipo de Despesa", y = "Quantidade de lançamentos na CEAP") + theme(axis.text.x = element_text(angle = 45, hjust = 1))
É possível notar que Emissão de Bilhete Aéreo e Despesas com combustíveis são os mais frequentes durante o período de férias. Será que os Deputados esão viajando de férias com o dinheiro público?
dadosBilheteAereo <- dadosCEAP %>% filter(tipoDespesa=="Emissão Bilhete Aéreo") %>% group_by(sgUF) %>% summarize(valorGasto=sum(valorLíquido))
quantidadeDeputados <- dadosCEAP %>% filter(tipoDespesa=="Emissão Bilhete Aéreo") %>% select(nomeParlamentar, sgUF) %>% group_by(nomeParlamentar, sgUF) %>% summarize(n()) %>% group_by(sgUF) %>% summarize(Quantidade=n())
dadosBilheteAereo <- inner_join(dadosBilheteAereo, quantidadeDeputados, by="sgUF")
dadosBilheteAereo$PorParlamentar <- dadosBilheteAereo$valorGasto/dadosBilheteAereo$Quantidade
dadosBilheteAereo <- dadosBilheteAereo %>% select(sgUF, PorParlamentar)
dadosBilheteAereo$sgUF <- factor(dadosBilheteAereo$sgUF, levels = unique(dadosBilheteAereo$sgUF)[order(dadosBilheteAereo$PorParlamentar, decreasing = FALSE)])
ggplot(dadosBilheteAereo, aes(sgUF, format(PorParlamentar, scientific = FALSE))) + geom_jitter() + labs(title="Valores gastos com Bilhete Aéreo por Parlamentar Por Estado", x="Estado", y="Valor em R$")
Como era de se esperar Deputados do Distrito Federal e de Goiás gastam Menos com Bilhete Aéreo, do que Deputados que são de regiões mais distantes e com menos frequência de vôos como Acre, Amazonas, Ceará, Roraima, Pará, Rio Grande do Sul. Curioso notar que os Deputados do Rio de Janeiro estão entre os que mais gastam, entretanto não é tão distance e nem tem baixa frequência em vôos.