As informações utilizadas são referentes aos gastos com a CEAP (cota para o exercício da atividade parlamentar). Esses valores representam uma cota única mensal, destinada a custear os gastos dos deputados federais exclusivamente vinculados ao exercício da atividade parlamentar. Os dados foram coletados do site de transparência da Câmara, tratados, e podem ser baixados neste link.
Outros dados que fazem parte da análise são os valores com os limites de CEAP para cada estado. O valor máximo mensal da cota depende da unidade da federação que o deputado representa. Essa variação ocorre por causa das passagens aéreas e está relacionada ao valor do trecho entre Brasília e o Estado que o deputado representa. Os dados podem ser baixados aqui.
A seguir, fazemos a leitura desses dados e observamos uma pequena amostra.
dados <- read_csv("../data/dadosCEAP.csv", progress = FALSE)
limite_CEAP <- read_csv("../data/limiteMensalCEAP.csv")
dados$valorGlosa <- as.numeric(sub(",", ".", dados$valorGlosa, fixed = TRUE))
glimpse(dados)
## Observations: 963,452
## Variables: 13
## $ nomeParlamentar <chr> "ABEL MESQUITA JR.", "ABEL MESQUITA JR.", "ABE...
## $ idCadastro <int> 178957, 178957, 178957, 178957, 178957, 178957...
## $ sgUF <chr> "RR", "RR", "RR", "RR", "RR", "RR", "RR", "RR"...
## $ sgPartido <chr> "DEM", "DEM", "DEM", "DEM", "DEM", "DEM", "DEM...
## $ tipoDespesa <chr> "MANUTENÇÃO DE ESCRITÓRIO DE APOIO À ATIVIDADE...
## $ especDespesa <chr> NA, NA, NA, NA, NA, "Veículos Automotores", "V...
## $ fornecedor <chr> "COMPANHIA DE AGUAS E ESGOTOS DE RORAIMA", "CO...
## $ CNPJCPF <chr> "05939467000115", "05939467000115", "023414700...
## $ tipoDocumento <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0...
## $ dataEmissao <dttm> 2015-11-14, 2015-12-10, 2015-11-27, 2015-12-3...
## $ valorDocumento <dbl> 165.65, 59.48, 130.95, 196.53, 310.25, 32.00, ...
## $ valorGlosa <dbl> 0, 0, 0, 347, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
## $ valorLíquido <dbl> 165.65, 59.48, 130.95, 193.06, 310.25, 32.00, ...
Provavelmente o principal gasto será relativo a viagens, já que nesse período é muito comum ocorrerem viagens de lazer.
O recesso parlamentar é o período em que os parlamentos não funcionam no Brasil, incluindo a câmara dos deputados. Esse período tem um total de 55 dias, com os trabalhos suspensos entre os dias de 23 de dezembro a 1º de fevereiro e de 18 a 31 de julho. Por conta das atividades parlamentares estarem suspensas, é plausível assumir que os gastos com a cota de exercício da atividade parlamentar não existam (ou sejam reduzidos). Na prática, as coisas não funcionam totalmente dessa maneira. Existe a chamada Comissão Representativa do Congresso, que atua nesses períodos e, possivelmente, também faz uso do CEAP. Não existem muitas informações claras a respeito do que os parlamentares fazem no recesso, muito menos sobre a utilização do CEAP. Mais informações aqui e aqui.
Para responder essa pergunta, vamos primeiro filtrar as informações de gastos relativos as datas de recesso. Os dados correspondem aos recessos de final de ano de 2014 até o do meio do ano de 2017.
dados_recesso <- dados %>%
mutate(tipoDespesa = str_to_upper(tipoDespesa)) %>%
mutate(dataEmissao = lubridate::as_date(dataEmissao)) %>%
mutate(mes_dia = (month(dataEmissao)*100) + day(dataEmissao)) %>%
filter(between(mes_dia,1223,1231) | between(mes_dia,101,102) | between(mes_dia,718,731)) %>%
select(-mes_dia)
#dados_recesso %>%
# filter(valorLíquido > 0) %>%
# summarise(gastoTotal_recesso = sum(valorLíquido))
num_despesas_recesso <- dados_recesso %>%
group_by(tipoDespesa) %>%
summarise(n = n()) %>%
arrange(desc(n))
gasto_despesas_recesso <- dados_recesso %>%
filter(valorLíquido > 0) %>%
group_by(tipoDespesa) %>%
summarise(gasto = sum(valorLíquido)) %>%
arrange(desc(gasto))
g1 <- num_despesas_recesso %>%
ggplot(aes(x=reorder(tipoDespesa, n), y=n, fill=n)) +
geom_bar(stat = "identity") +
scale_y_continuous(labels = scales::number_format(big.mark = ".", decimal.mark = ",")) +
geom_text(aes(label=scales::comma(n, big.mark = ".", decimal.mark = ","), vjust = 0.5, hjust = 0),
size = 3.5, vjust="inward", hjust="inward") +
coord_flip() +
labs(x = "Tipos de Despesas", y = "Quantidade de Despesas") +
ggtitle("Número de ocorrências para cada tipo de despesas") +
guides(fill = FALSE) +
theme(plot.title = element_text(hjust = 0.5))
g2 <- gasto_despesas_recesso %>%
ggplot(aes(x=reorder(tipoDespesa, gasto), y=gasto, fill=gasto)) +
geom_bar(stat = "identity") +
scale_y_continuous(labels = scales::number_format(big.mark = ".", decimal.mark = ",", scale = 1/1000000, prefix = "R$", suffix = "M")) +
geom_text(aes(label=scales::comma(gasto, big.mark = ".", decimal.mark = ","), vjust = 0.5, hjust = 0),
size = 3.5, vjust="inward", hjust="inward") +
coord_flip() +
labs(x = "Tipos de Despesas", y = "Gasto da despesa (em milhões de reais)", fill = "Gasto (em R$)") +
ggtitle("Gasto gerado por cada tipo de despesa") +
guides(fill = FALSE) +
theme(plot.title = element_text(hjust = 0.5))
grid.arrange(g1,g2)
Nesse período o gasto total gerado pelos parlamentares e pelas lideranças dos partidos foi em torno de 30 milhões de reais. Com base nos gráficos gerados, verificamos que, de fato, a emissão de bilhetes aéreos são os tipos de despesas que são mais frequentes durante as férias dos parlamentares. No entanto, essa despesa não gerou o maior gasto para o período: a divulgação de atividade parlamentar destacou-se como a despesa que gerou mais gastos com relação ao uso do CEAP pelos deputados, com cerca de 3 milhões de reais a mais de diferença em relação aos gastos com bilhetes aéreos, o segundo colocado.
Em função disso, muitas perguntas podem surgir a respeito desses gastos: qual o motivo de uma despesa tão alta com divulgação da atividade parlamentar? Qual o motivo do contribuinte arcar com uma despesa tão alta de passagens aéreas em um período de férias? Perguntas como essa evidenciam a importância da clareza com relação às razões que levam a esses gastos.
Os deputados que são de estados distantes de Brasília provavelmente apresentam mais despesas com transporte, já que o deslocamento é mais difícil.
Essa pergunta exige que façamos algumas manipulações com os dados, neste caso iremos acrescentar a informação da região que o estado pertence, além de considerar que o gasto com total com transporte será definido pela soma de COMBUSTÍVEIS E LUBRIFICANTES., PASSAGENS AÉREAS, LOCAÇÃO OU FRETAMENTO DE VEÍCULOS AUTOMOTORES, LOCAÇÃO OU FRETAMENTO DE EMBARCAÇÕES, SERVIÇO DE TÁXI, PEDÁGIO E ESTACIONAMENTO, LOCAÇÃO OU FRETAMENTO DE AERONAVES e PASSAGENS TERRESTRES, MARÍTIMAS OU FLUVIAIS. Feito isso, podemos agrupar os dados para obter o valor gasto mensalmente por cada parlamentar com transporte.
#Qual o parlamentar que mais gasta com transporte (mensalmente)
#combustiveis, passagens, locação, serviço taxi
NORTE <- c("AM", "RO", "RR", "AC", "AP", "PA", "TO")
NORDESTE <- c("PI", "AL", "CE", "MA", "PE", "PB", "BA", "SE", "RN")
CENTRO_OESTE <- c("MS", "MT", "GO", "DF")
SUDESTE <- c("MG", "RJ", "SP", "ES")
SUL <- c("RS", "SC", "PR")
dados_transporte <- dados %>%
mutate(tipoDespesa = str_to_upper(tipoDespesa)) %>%
mutate(regiao = case_when(
sgUF %in% NORTE ~ "NORTE",
sgUF %in% NORDESTE ~ "NORDESTE",
sgUF %in% CENTRO_OESTE ~ "CENTRO_OESTE",
sgUF %in% SUL ~ "SUL",
sgUF %in% SUDESTE ~ "SUDESTE"
)) %>%
filter(str_detect(tipoDespesa, "COMBUSTÍVEIS|PASSAGENS|LOCAÇÃO|TÁXI"))
parlamentar_mensal_transporte <- dados_transporte %>%
filter(valorLíquido > 0) %>%
mutate(mes = lubridate::month(dataEmissao), ano = lubridate::year(dataEmissao)) %>%
group_by(nomeParlamentar, idCadastro, sgUF, regiao, mes, ano) %>%
summarise(gasto_mensal = sum(valorLíquido)) %>%
ungroup()
mediana_gasto_mensal_transporte <- parlamentar_mensal_transporte %>%
group_by(nomeParlamentar, idCadastro, sgUF, regiao) %>%
summarise(mediana_gasto = median(gasto_mensal)) %>%
na.omit(idCadastro) %>%
ungroup() %>%
arrange(desc(mediana_gasto))
gasto_mensal_regiao <- parlamentar_mensal_transporte %>%
filter(!is.na(regiao)) %>%
group_by(regiao) %>%
summarise(soma_gasto = sum(gasto_mensal)) %>%
arrange(desc(soma_gasto)) %>%
ungroup()
Como iremos comparar o gasto dos deputados ao longo de um período de tempo, iremos sumarizar esse gasto como a mediana dos gastos mensais. Além disso, as informações das regiões podem nos ajudar a entender melhor os motivos do gasto, uma vez que todos eles trabalham em Brasília e cada um tem um perfil de despesas com transporte diferente. A seguir geramos os gráficos para entender melhor os dados:
t1 <- gasto_mensal_regiao %>%
ggplot(aes(x=reorder(regiao,soma_gasto), y=soma_gasto, fill="#FF6666")) +
geom_bar(stat = "identity") +
geom_text(aes(label=scales::comma(soma_gasto, big.mark = ".", decimal.mark = ",", prefix = "R$"), vjust = -0.2)) +
scale_y_continuous(labels = scales::number_format(big.mark = ".", decimal.mark = ",", scale = 1/1000000, prefix = "R$", suffix = "M")) +
guides(fill = FALSE) +
labs(x = "Regiões do Brasil", y = "Gastos mensais (em milhões de reais)") +
ggtitle("Gastos mensais dos parlamentares com transporte por região") +
theme(plot.title = element_text(hjust = 0.5))
#selecionando os 25 que mais gastaram c/ transporte
t2 <- mediana_gasto_mensal_transporte %>%
head(25) %>%
ggplot(aes(x=reorder(nomeParlamentar,mediana_gasto), y=mediana_gasto, fill=regiao)) +
geom_bar(stat = "identity") +
scale_y_continuous(labels = scales::number_format(big.mark = ".", decimal.mark = ",", prefix = "R$")) +
coord_flip() +
labs(fill = "Regiões do Brasil", x="Nome dos Parlamentares", y = "Gasto mensal (em R$)") +
ggtitle("Mediana dos gastos mensais dos parlamentares com transporte") +
theme(plot.title = element_text(hjust = 0.5))
grid.arrange(t1,t2)
Os gráficos acima nos permitem visualizar que o maior gasto por região é do Nordeste, que de fato é mais distante de Brasília. Além disso, podemos ver que entre os 25 deputados que mais gastam, muitos deles são da região Nordeste, além de muitos da região Norte.