Introdução


Usando os dados sobre a despesa de deputados federais da legistatura atual com a atividade parlamentar a A CEAP (cota para o exercício da atividade parlamentar), vamos tentar desvendar algumas informações a respeito de como os parlamentares utilizam esses recursos.

Leitura dos dados


Primeiramente vamos realizar a leitura dos dados e fazer o devido tratamento.

ceap <- read.csv("~/Documents/Database/dadosCEAPUTF.csv", encoding = "UTF-8")
ceap$valorGlosa <- as.numeric(sub(",", ".", ceap$valorGlosa, fixed = TRUE)) 

ceap <- ceap %>% select(-CNPJCPF, -especDespesa) 


Perguntas


Quais os partidos que mais fazem uso da CEAP? Quais os partidos que menos fazem uso?


A fim de desvendar quais os partidos que mais gastam e quais os que menos gastam, basta utilizar uma simples forma de visualização de dados como um gráfico de barras. Apesar de simples, é possível extrair dele boas informações.

gastoPartido <- ceap %>% group_by(sgPartido) %>% summarise(gasto = sum(valorLíquido))

gastoPartido$sgPartido <- as.factor(gastoPartido$sgPartido)
gastoPartido <- gastoPartido[complete.cases(gastoPartido), ]

ggplot(gastoPartido, aes(x=reorder(sgPartido, -gasto), y=gasto/1000000, fill = gasto)) + 
  theme_bw() +
  scale_fill_gradient(low = "darkorange", high = "darkorange3", guide = FALSE) +
  geom_bar(width=0.7, stat = "identity") +
  scale_y_continuous(labels=comma, breaks=seq(0, 70, by = 5)) + coord_flip() +
  xlab("Partidos") + ylab("Gastos por partido em milhões")


De acordo com este gráfico de barras que relaciona cada partido à sua quantia total de gastos, é fácil visualizar os partidos que mais e os que menos usam as suas cotas. Entre os que mais gastam estão o PMDB, PT, PSDB etc. E dentre os que menos gastam: PTRB, PMN e PTdoB. Lembrando que estamos considerando os gastos de maneira absoluta, ou seja, utilizando apenas o gasto total de cada partido. Parece razoável pensarmos que quanto mais deputados um partido tem, mais gastos ele terá.


Quais os tipos de despesa mais comuns no uso da CEAP? Mesma pergunta considerando valores em R$.


Agora que sabemos quais os partidos mais gastam e os que menos gastam, podemos tentar entender como, mais precisamente, esse dinheiro é gasto. Para isso, vamos examinar quais os gastos mais comuns dos parlamentares.

expenseNames <- c("CONSULTORIAS, PESQUISAS E TRABALHOS TÉCNICOS."="CONSULTORIAS E PESQUISAS", 
                  "DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR."="DIVULGAÇÃO ATIVIDADE PARLAMENTAR",
                  "Emissão Bilhete Aéreo"="BILHETE AÉREO", 
                  "FORNECIMENTO DE ALIMENTAÇÃO DO PARLAMENTAR"="ALIMENTAÇÃO",
                  "HOSPEDAGEM ,EXCETO DO PARLAMENTAR NO DISTRITO FEDERAL."="HOSPEDAGEM",
                  "LOCAÇÃO OU FRETAMENTO DE AERONAVES"="ALUGUEL DE AERONAVES",
                  "LOCAÇÃO OU FRETAMENTO DE EMBARCAÇÕES"="ALUGUEL DE EMBARCAÇÕES",
                  "LOCAÇÃO OU FRETAMENTO DE VEÍCULOS AUTOMOTORES"="ALUGUEL DE VEÍCULOS",
                  "MANUTENÇÃO DE ESCRITÓRIO DE APOIO À ATIVIDADE PARLAMENTAR"="ESCRITÓRIO PARLAMENTAR",
                  "PARTICIPAÇÃO EM CURSO, PALESTRA OU EVENTO SIMILAR"="CURSOS, PALESTRAS",
                  "PASSAGENS TERRESTRES, MARÍTIMAS OU FLUVIAIS"="PASSAGENS NÃO AERÉAS",
                  "SERVIÇO DE SEGURANÇA PRESTADO POR EMPRESA ESPECIALIZADA."="SERVIÇO DE SEGURANÇA",
                  "SERVIÇO DE TÁXI, PEDÁGIO E ESTACIONAMENTO"="TÁXI, PEDÁGIO E ESTACIONAMENTO",
                  "COMBUSTÍVEIS E LUBRIFICANTES."="COMBUSTÍVEIS E LUBRIFICANTES")

despesaComuns <- ceap %>% 
  group_by(tipoDespesa) %>% 
  summarise(frequencia = n()) %>%
arrange(frequencia)

ggplot(despesaComuns, aes(x = reorder(tipoDespesa, -frequencia), y = frequencia, fill = frequencia)) + 
  theme_bw() +
  scale_fill_gradient(low = "dodgerblue", high = "dodgerblue4", guide = FALSE) +
  geom_bar(width=0.7, stat = "identity") +
  scale_y_continuous(labels=comma, breaks = seq(0, 300000, 50000)) +
  scale_x_discrete(labels=expenseNames) + coord_flip() + xlab("Tipo de despesa") + 
  ylab("Frequencia da despesa")



De acordo com o gráfico, podemos perceber que o gasto mais comum é com transporte aéro de maneira disparada. O que é de se esperar, visto que é papel do deputado viajar pelo estado que representa, conhecer as demandas e volta à Brasília para discutir os problemas e soluções encontradas. Mas será que mesmo sendo a despesa mais comum dos deputados, ela seria a que consome mais recursos da CEAP?

#despesasCara <- ceap %>% group_by(tipoDespesa) %>% summarise(valor = sum(valorLíquido))

despesasCara <- ceap %>% 
  group_by(tipoDespesa) %>% summarise(valor = sum(valorLíquido) / 1000000)

ggplot(despesasCara, aes(x = reorder(tipoDespesa, -valor), y = valor, fill = valor)) + 
  theme_bw() +
  scale_fill_gradient(low = "dodgerblue", high = "dodgerblue4", guide = FALSE) +
  geom_bar(width=0.7, stat = "identity") +
  scale_y_continuous(labels=comma, breaks=seq(0, 150, 10)) +
  scale_x_discrete(labels=expenseNames) + coord_flip() + 
  labs(title="Valores gasto de acordo com cada tipo de despesa", y = "Valor da despesa em milhões", x = "")



Analisando este gráfico que mostra a relação entre os tipos de despesas e seus custos, observamos que os gastos com transporte aéreo continuam no topo, mas em segundo lugar. A divulgação da atividade parlamentar é a campeã. O que pode nos levar a questionar se todos os gastos com viagens são realmente motivados pelo interesse em conhecer as demandas do seu estado ou se usam dessa ferramente apenas como uma maneira cômoda de locomoção em suas jornadas para divulgar as suas atividades.


Levando em conta o estado pelo qual o deputado se elegeu, quais os estados que mais fazem uso da CEAP? Quais os que menos fazem uso?


Levando em consideração o total gasto em reais, o gráfico abaixo nos mostra os estados que mais e menos gastam. Há mais fatores que podem ser levados em conta na hora de interpretá-lo, como quantidade de deputados eleitos pelo estado.

gastoEstado <- ceap %>% group_by(sgUF) %>% summarise(gasto= sum(valorLíquido))
gastoEstado <- gastoEstado[complete.cases(gastoEstado), ]

ggplot(gastoEstado, aes(x = reorder(sgUF, gasto), y = gasto/1000000)) + 
  theme_bw() +
  geom_point(aes(color = gasto)) + 
  scale_color_continuous(low = "green", high = "red", guide = FALSE) +
  scale_y_continuous(labels=comma, breaks = seq(0, 100, 5)) + 
  labs(title="Valores totais gasto por estado", y = "Valor da despesa em milhões", x = "")



Agora, vamos ver quais estados fazem uso da CEAP com maior ou menor frequência. Se nossa intuição estiver correta, poderemos notar que haverá algum tipo de correlação positiva entre o valor total gasto e número de vezes em que a cota foi usada.

freqEstado <- ceap %>% group_by(sgUF) %>% summarise(freq = n())
freqEstado <- freqEstado[complete.cases(freqEstado), ]
gastoEstado$freq = freqEstado$freq

ggplot(freqEstado, aes(x = reorder(sgUF, freq), y = freq)) + 
  theme_bw() +
  scale_y_continuous(breaks = seq(0, 180000, 10000)) +
  geom_point(aes(color = freq)) + 
  scale_color_continuous(low = "green", high = "red", guide = FALSE) +
  labs(title="Quantidade de vezes em que a CEAP foi usada por estado", y = "Número de uso da CEAP", x = "")


Quais os parlamentares que mais gastam com CEAP e quais os que menos gastam?



Como há vários registros de deputados nos dados, não seria nada amigável tentar mostrar todos os deputados e seus gastos totais um gráfico. Então, vamos escolher os 10 que mais gastaram e 10 que menos gastaram para fazer uma simples visualização.

deputadosCaros <- ceap %>%
  mutate(nomeParlamentar = paste0(nomeParlamentar, " (", sgPartido, "-", sgUF,")")) %>%
  filter(!is.na(nomeParlamentar)) %>%
  group_by(nomeParlamentar) %>% 
  summarise(gastos = sum(valorLíquido), quantidade = plyr::count(sgUF)$freq) %>%
  arrange(gastos) %>% 
  top_n(10, gastos)

deputadosCaros %>% 
  ggplot(aes(x = reorder(nomeParlamentar, -gastos), y = gastos/1000000)) +
  theme_bw() +
  geom_point(aes(color = gastos)) + 
  scale_color_continuous(low = "green", high = "red", guide = FALSE) +
  coord_flip() + 
  labs(title = "Parlamentares que mais gastam a cota parlamentar", y = "Valor gasto em milhões de R$", x="")


Agora os que menos gastaram.

deputadosBaratos <- ceap %>%
  mutate(nomeParlamentar = paste0(nomeParlamentar, " (", sgPartido, "-", sgUF,")")) %>%
  filter(!is.na(nomeParlamentar)) %>%
  group_by(nomeParlamentar) %>% 
  summarise(gastos = sum(valorLíquido), quantidade = plyr::count(sgUF)$freq) %>%
  arrange(gastos) %>% 
  top_n(10, -gastos)

deputadosBaratos %>% 
  ggplot(aes(x = reorder(nomeParlamentar, -gastos), y = gastos)) +
  theme_bw() +
  geom_point(aes(color = gastos)) + 
  scale_color_continuous(low = "green", high = "green3", guide = FALSE) +
  coord_flip() + 
  labs(title = "Parlamentares que menos gastaram", y = "Valor gasto", x="")


Podemos notar que existem valores negativos para o gasto dos deputados. Isso ocorre quando os deputados não gastam suas cotas inteiramentes e o valor é restituído. Parabéns aos respectivos deputados por sua consciência com o dinheiro público.

Quais os estados cujos deputados gastam mais no exterior? Quais os estados cujos deputados gastam menos no exterior?

Uma questão interessante que podemos levantar. Quanto do dinheiro público é gasto no exterior através da CEAP? Vamos responder essa questão levando em conta o estado como um todo.

gastoEstadoExterior <- ceap[ceap$tipoDocumento == 2, ] 
gastoEstadoExterior <- gastoEstadoExterior %>% group_by(sgUF) %>% summarise(gasto = sum(valorLíquido))

ggplot(gastoEstado, aes(x = reorder(sgUF, gasto), y = gasto/1000000, fill = gasto)) +
  theme_bw() + 
  geom_bar(width = 0.7, stat='identity') + 
  scale_fill_gradient(low = "yellow3", high = "red", guide = FALSE) + 
  labs(title="Gasto da CEAP no exterior por estado", y = "Gasto em milhões", x = "") + 
  scale_y_continuous(breaks=seq(0, 100, 5))


Como podemos ver pelo gráfico, o padrão se repete por estado. SP, MG e RJ como os recordistas de gastos, continuam com seus títulos quando se trata de gastos no exterior.