library(tidyr)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
gastos <- read.csv("dadosCEAP.csv")
Focando no tipo de despesa com o qual os parlamentares mais gastam com a CEAP (Divulgação de atividade parlamentar), existe algum fornecedor que se destaca, ou seja, que aparece muito em relação aos outros?
RESPOSTA ESPERADA: Espero que existam empresas que apareçam mais que outras, ou seja, que sejam mais consolidadas nesse mercado e que portanto forneçam esse serviço várias vezes.
Na análise, serão levados em conta apenas os deputados paraibanos.
Como existem inúmeros fornecedores, serão mostrados apenas os 15 primeiros que mais aparecem. Pelo gráfico de barras gerado podemos ver que a fornecedora Josely Fernanda do Nascimento se destaca em relação aos demais, com uma distância considerável em relação ao segundo colocado, o PB Agora, conhecido site de notícias do estado.
O CNPJ da fornecedora Josely é de Brasília/DF, apesar de existir uma nomeação de pessoa com o mesmo nome na prefeitura de Santa Rita/PB no ano de 2015.
Oficialmente, os serviços prestados por ela são: atividades de pós-produção cinematográfica, de vídeos e de programas de televisão não especificadas anteriormente.
gastos_pb <- gastos %>% filter (sgUF == "PB")
gastos.atividade <- gastos_pb %>% filter(tipoDespesa == "DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR.")
agrupado.fornecedor <- gastos.atividade %>% group_by(fornecedor) %>% summarise(frequencia = n())
agrupado.fornecedor.top.15 <- agrupado.fornecedor[order(decreasing = TRUE, agrupado.fornecedor$frequencia),] %>% head(15)
ggplot(data = agrupado.fornecedor.top.15, aes(x = reorder(fornecedor, frequencia), y = frequencia)) + geom_bar(stat = "identity", fill="steelblue") +
coord_flip() + ggtitle("Fornecedores - Divulgação") + xlab("Fornecedor") + ylab("Numero de serviços prestados na PB")
Dado que existe uma fornecedora que se destaca em relação aos demais, podemos dizer que ela está fortemente relacionada a algum deputado específico ou algum partido específico?
RESPOSTA: Espera-se que sim, que alguns deputados usem mais o dinheiro da CEAP com essa forncedora, principalmente por causa de sua ideologia partidária.
Pelo gráfico abaixo, podemos ver que praticamente todos os deputados paraibanos já usaram o serviço da fornecedora em questão e o que mais gastou com ela foi Wellington Roberto (PR). O top 5 se destaca em relação aos demais. Aparentemente também não existe relação com a posição partidária. No top 3 temos dois deputados do PMDB, mas também temos dois do mesmo partido nas últimas posições.
fornecedor.josely <- gastos.atividade %>% filter (fornecedor == "JOSELY FERNANDA DO NASCIMENTO")
agrupado.deputado <- fornecedor.josely %>% group_by(nomeParlamentar, sgPartido) %>% summarise(valorGasto = sum(valorLíquido))
ggplot(data = agrupado.deputado, aes(x = reorder(nomeParlamentar, valorGasto), y = valorGasto, fill=sgPartido)) + geom_bar(stat = "identity") +
coord_flip() + ggtitle("Gastos com fornecedora Josely") + xlab("Deputado") + ylab("Valor gasto (Em R$)")
Existe algum periodo do ano no qual os deputados costumam usar mais o dinheiro da CEAP?
RESPOSTA ESPERADA: Acredito que não exista e que os valores gastos estejam equilibrados entre todos os meses observados.
Para responder essa pergunta, vamos desconsiderar os anos de 2014 e 2017, já que nem todos os meses desses anos estão nos dados.
Abaixo, temos um gráfico de pontos ao longo dos meses de 2015 e 2016 para mostrar qual foi o uso total da CEAP. Como podemos ver, o comportamento dos dois anos não difere muito. Os deputados gastam muito menos em janeiro (Devido ao período de recesso, provavelmente) e muito mais em dezembro. Nos outros meses há certo equilíbrio. Outro ponto que chamou a atenção foi o valor gasto em fevereiro de 2016, que foi muito superior ao valor gasto em fevereiro de 2015.
gastos.com.mes <- gastos %>% mutate(mes = substr(dataEmissao, 1, 7)) %>% mutate(ano = substr(dataEmissao, 1,4))
agrupado.mes <- gastos.com.mes %>% group_by(mes, ano) %>% summarise(valorTotal = sum(valorLíquido)) %>% na.omit()
agrupado.mes.2015.2016 <- agrupado.mes %>% filter (substr(mes, 1, 4) == "2016" || substr(mes, 1, 4) == "2015") %>% mutate(mes_gasto = substr(mes, 6, 7))
ggplot(data = agrupado.mes.2015.2016, aes(x = mes_gasto, y = valorTotal, colour = ano, group = ano)) + geom_point() + geom_line() + ggtitle("Gastos totais mês a mês (2015 e 2016)") + xlab("Mês") + ylab("Valor gasto (Em R$)")