library(tidyverse)
library(dplyr)
library(plotly)
dadosCEAP <- read.csv("dadosCEAP.csv") # carregando os dados
dadosCEAP$valorGlosa <- as.numeric(sub(",", ".", dadosCEAP$valorGlosa, fixed = TRUE))
Para isso primeiro carregamos os dados do limite de cada estado e unimos esses dados aos dados que tinhamos até então. Em seguida agrupamos os dados por estado e parlamentar, filtramos os gastadores que ultrapassaram o limite e contamos por estado.
limitesMensais <- read.csv("limiteMensalCEAP.csv")
limitesMensais <- limitesMensais %>% rename(sgUF = UF)
dadosCEAP <- full_join(dadosCEAP, limitesMensais, by = "sgUF")
sobreLimite <- dadosCEAP %>%
group_by(sgUF, nomeParlamentar, limite_mensal) %>%
summarise(gasto = sum(valorLíquido)) %>%
mutate(limite_anual = limite_mensal*12) %>%
filter(gasto > (limite_anual))
usoUFGasto <- sobreLimite %>%
group_by(sgUF) %>%
summarise(uso = n())
plot_ly(usoUFGasto , x = ~reorder(sgUF, -(uso)), y =~(uso), color = ~sgUF, colors = "Set2") %>%
layout(title="O",
xaxis = list(title = "UF", tickangle = -45),
yaxis = list(title ="Uso"))
Os estados que onde os parlamentares mais ultrapassaram o tedo de gasto foram São Paulo, Minas Gerais e Rio de Janeiro. Provavelmente pela maior quantidade de parlamentares.
porTipo <- dadosCEAP %>%
group_by(tipoDespesa) %>%
filter(tipoDespesa == "TELEFONIA", valorLíquido == 0) %>%
summarise(gasto = sum(valorDocumento))
porTipo
## # A tibble: 1 x 2
## tipoDespesa gasto
## <fct> <dbl>
## 1 TELEFONIA 57551.
O gasto com telefonia franquado é de 57 mil 551 reais.