library(tidyverse)
library(dplyr)
library(plotly)
dadosCEAP <- read.csv("dadosCEAP.csv") # carregando os dados
dadosCEAP$valorGlosa <- as.numeric(sub(",", ".", dadosCEAP$valorGlosa, fixed = TRUE))

Quantos depultados ultrapassaram o limite de gasto em cada estado?

Para isso primeiro carregamos os dados do limite de cada estado e unimos esses dados aos dados que tinhamos até então. Em seguida agrupamos os dados por estado e parlamentar, filtramos os gastadores que ultrapassaram o limite e contamos por estado.

limitesMensais <- read.csv("limiteMensalCEAP.csv") 
limitesMensais <- limitesMensais %>% rename(sgUF = UF)
dadosCEAP <- full_join(dadosCEAP, limitesMensais, by = "sgUF")

sobreLimite <- dadosCEAP %>% 
  group_by(sgUF, nomeParlamentar, limite_mensal) %>%
  summarise(gasto = sum(valorLíquido)) %>%
  mutate(limite_anual = limite_mensal*12) %>%
  filter(gasto > (limite_anual))

usoUFGasto <- sobreLimite   %>%
  group_by(sgUF) %>% 
  summarise(uso = n())


plot_ly(usoUFGasto ,  x = ~reorder(sgUF, -(uso)), y =~(uso), color = ~sgUF, colors = "Set2") %>%
  layout(title="O",
         xaxis = list(title = "UF", tickangle = -45), 
         yaxis = list(title ="Uso"))

Os estados que onde os parlamentares mais ultrapassaram o tedo de gasto foram São Paulo, Minas Gerais e Rio de Janeiro. Provavelmente pela maior quantidade de parlamentares.

Qual o gasto total com telefonia franqueado

porTipo <- dadosCEAP %>% 
  group_by(tipoDespesa) %>%
  filter(tipoDespesa == "TELEFONIA", valorLíquido == 0) %>%
  summarise(gasto = sum(valorDocumento)) 

porTipo
## # A tibble: 1 x 2
##   tipoDespesa  gasto
##   <fct>        <dbl>
## 1 TELEFONIA   57551.

O gasto com telefonia franquado é de 57 mil 551 reais.