Este estudo tem como objetivo apresentar alguns dados e responder algumas perguntas em relação ao CEAP (cota para o exercício da atividade parlamentar). A CEAP (cota para o exercício da atividade parlamentar) é uma cota única mensal destinada a custear os gastos dos deputados exclusivamente vinculados ao exercício da atividade parlamentar. Exemplos de despesa desse tipo são: passagens aéreas, telefonia, serviços postais, manutenção de escritórios de apoio à atividade parlamentar, assinatura de publicações, fornecimento de alimentação ao parlamentar, hospedagem, outras despesas com locomoção, contemplando locação ou fretamento de aeronaves, veículos automotores e embarcações, serviços de táxi, pedágio e estacionamento e passagens terrestres. Mais informações neste link . Os dados foram coletados do site de transparência da Câmara, tratados, e podem ser baixados neste link . Uma breve descrição dos dados se encontra abaixo.
df2 <- count(ceapData, c('sgPartido'))
df2 <- na.omit(df2)
p <- ggplot(df2, aes(reorder(sgPartido, freq), freq))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Uso do CEAP por partido") + xlab("Partido") + ylab("Numero de vezes que o CEAP foi utilizado pelos Partidos") + scale_y_continuous(breaks = round(seq(min(df2$freq), max(df2$freq), by = 10000),1))
Como pode se notar no gráfico acima, os 5 partidos que mais utilizaram a CEAP foram, em ordem: [PT, PMDB, PSDB, PP, PR].
Em contrapartida, os 5 partidos que menos utilizaram a CEAP foram, em ordem: [PTdoB, PMN, PRTB, PRP, PSL]
Um sumário dos dados com algumas medidas estatísticas se encontra disposto abaixo:
summary(df2$freq)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 41 7916 18990 32696 50617 124920
dataSum <- aggregate(valorLiquido ~ sgPartido, ceapData, sum)
p <- ggplot(dataSum, aes(reorder(sgPartido, valorLiquido), valorLiquido))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Valor total do CEAP por partido") + xlab("Partido") + ylab("Valor total dos gastos com CEAP por Partidos em Reais") + scale_y_continuous(breaks = round(seq(min(dataSum$valorLiquido), max(dataSum$valorLiquido), by = 10000000),1))
Contudo, quando se trata de valores totais gastos, temos que o PMDB aparece na frente do PT. O ranking dos cinco partidos continua parecido quando se trata do uso considerando valores em R$: [PMDB, PT, PSDB, PP, PR]
Os 5 partidos que menos utilizaram considerando valores em R$ a CEAP foram em ordem: [PTdoB, PMN, PRTB, PRP, PSL]
Um sumário dos dados com algumas medidas estatisticas se encontra disposto abaixo:
summary(dataSum$valorLiquido)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 22505 5537683 12277942 21616216 35755825 74723117
Aqui podemos notar que a média de gastos de cada partido é de 21616216 reais. Contudo, isto se deve aos partidos menores. Já que os maiores partidos, e consequentemente, com mais representantes acabam por gastar muito mais
Um sumário dos dados com algumas medidas estatisticas se encontra disposto abaixo:
summary(despesa$freq)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 65 2570 16375 50984 74736 254464
dataSumTipoDespesa <- aggregate(valorLiquido ~ tipoDespesa, ceapData, sum)
p <- ggplot(dataSumTipoDespesa, aes(reorder(tipoDespesa, valorLiquido), valorLiquido))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Valor total do CEAP por tipo de despesa") + xlab("Tipo de Despesa") + ylab("Valor total dos gastos com CEAP por tipo de Despesa em Reais") + scale_y_continuous(breaks = round(seq(min(dataSumTipoDespesa$valorLiquido), max(dataSumTipoDespesa$valorLiquido), by = 50000000),1))
Um sumário dos dados com algumas medidas estatisticas se encontra disposto abaixo:
summary(dataSumTipoDespesa$valorLiquido)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 143302 2952318 7650903 33716372 55943555 154891282
Aqui, nota-se que emissão de bilhete aéreo foi o tipo despesa mais utilizada. Sendo ao total 300185 usos. Contudo, foi divulgação de atividade parlamentar o maior gasto dos deputados. Olhando para os gráficos, pode-se notar que esta atividade em questão tem um alto gasto a cada vez que é utilizada. O mesmo vale para locação ou fretamento de veículos automotores.
estado <- count(ceapData, c('sgUF'))
estado <- na.omit(estado)
p <- ggplot(estado, aes(reorder(sgUF, freq), freq))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Uso do CEAP por estado") + xlab("Estado") + ylab("Numero de vezes que o CEAP foi utilizado por estado") + scale_y_continuous(breaks = round(seq(min(estado$freq), max(estado$freq), by = 20000),1))
dataSumEstado <- aggregate(valorLiquido ~ sgUF, ceapData, sum)
p <- ggplot(dataSumEstado, aes(reorder(sgUF, valorLiquido), valorLiquido))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("CEAP por estado") + xlab("Estado") + ylab("Valor total dos gastos com CEAP por estados em reais") + scale_y_continuous(breaks = round(seq(min(dataSumEstado$valorLiquido), max(dataSumEstado$valorLiquido), by = 10000000),1))
Analisando os gráficos pode-se notar que:
Os 5 estados que mais fazem uso do CEAP são, em ordem: [SP, MG, RJ, RS, BA] Os 5 estados que menos fazem uso do CEAP são, em ordem: [DF, AP, AM, RR, TO] Os 5 estados que mais fazem uso do CEAP em relação a valores em R$ são, em ordem: [SP, MG, RJ, BA, RS] Os 5 estados que menos fazem uso do CEAP em relação a valores em R$ são, em ordem: [DF, MT, AM, SE, TO]
Ao menos na parte de cima, a lista se assemelha muito com a quantidade atual de deputados por estado (http://www2.camara.leg.br/a-camara/conheca/quantos-sao-e-de-que-forma-e-definido-o-numero-de-deputados). Ou seja, quanto mais deputados o estado tiver, em tese, maior o somatório do CEAP. Outro ponto que acredito que pode influenciar é o custo das atividades em relação a cada estado. Ou da distância em relação a brasília, visto que um dos maiores gastos e usos é com passagens aéreas e aluguel de carros, por exemplo.
parlamentar <- aggregate( valorLiquido ~ nomeParlamentar + sgPartido + sgUF, ceapData, sum)
parlamentar <- na.omit(parlamentar)
parlamentarDadosDecrescente <- parlamentar[order(decreasing = TRUE, parlamentar$valorLiquido),]
parlamentarDadosCrescente<- parlamentar[order(parlamentar$valorLiquido),]
top15MaisGastam <- head(parlamentarDadosDecrescente,15)
top15MenosGastam <- head(parlamentarDadosCrescente,15)
p <- ggplot(top15MaisGastam, aes(reorder(sprintf("%s - %s - %s", nomeParlamentar, sgPartido, sgUF), valorLiquido), valorLiquido, sgPartido), fill=sgPartido) + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Valor total dos gastos CEAP por parlamentar") + xlab("Parlamentar") + ylab("Numero de vezes que o CEAP foi utilizado pelo parlamentar")
p
g <- ggplot(top15MenosGastam, aes(reorder(sprintf("%s - %s - %s", nomeParlamentar, sgPartido, sgUF), valorLiquido), valorLiquido))
g + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Gasto com CEAP por parlamentar") + xlab("Tipo de Despesa") + ylab("Valor total dos gastos com CEAP por parlamentar em Reais") + scale_fill_manual(values = top15MenosGastam$sgPartido)
O top 3 dos parlamentares que mais gastaram foram, em ordem: [Edio Lopes - PR de Roraima; Rocha - PSDB do acre; Abel Mesquita Junior - DEM de Roraima]
O top 3 dos parlamentares que menos gastaram foram, em ordem: [Camilo Cola - PMDB do Espirito Santo; Eliseu Padilha - PMDB do Rio Grande do Sul; Márcio monteiro - PSDB do Mato grosso do Sul]
De forma curiosa, 5 dos 15 deputados que mais gastam estão no estado de Roraima.
summary(parlamentar$valorLiquido)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.6 36603.1 966664.0 729221.8 1213322.1 1648665.8
Outro dado interessante é que a mediana é igual a 966700 reais. Ou seja, mais de 50% dos deputados brasileiros gasta mais do que isso com CEAP.
gastosExterior <- ceapData[ceapData$tipoDocumento == 2,]
gastosExteriorSoma <- aggregate( valorLiquido ~ nomeParlamentar + sgPartido + sgUF, gastosExterior, sum)
gastosExteriorCount <- count(gastosExterior, c('nomeParlamentar'))
correlacao <-merge(gastosExteriorSoma,gastosExteriorCount, all.y=TRUE)
k <- ggplot(correlacao, aes(freq,valorLiquido))
k + geom_point() + ggtitle("Gráfico de relação entre o valor liquido gasto e o numero de vezes que o parlamentar gastou no exterior") + xlab("Numero de vezes") + ylab("Valor Liquido em Reais")
k <- ggplotly(k)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
k
cor(correlacao$valorLiquido, correlacao$freq)
## [1] 0.3312854
A partir do gráfico exposto e do fator de correlação apresentado, podemos notar que há uma correlação fraca entre a quantidade de gastos no exterior e o valor restituído da CEAP.
estadoExterior <- aggregate(valorLiquido ~ sgUF, gastosExterior, sum)
estadoExterior <- na.omit(estadoExterior)
p <- ggplot(estadoExterior, aes(reorder(sgUF, valorLiquido), valorLiquido))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Valor total do CEAP gasto no exterior por estado em reais") + xlab("Estado") + ylab("Valor total dos gastos com CEAP no exterior por estados")
Aqui nota-se que a situação muda um pouco. Apesar de São Paulo e Minas Gerais, os estados que mais usufruem do CEAP, continuarem sendo os maiores gastos no exterior, Roraima aparece em terceiro em gastos no exterior. Uma surpresa. Considerando que Roraima não é um dos estados que mais gastam. Em uma futura analise poderíamos analisar a relação de gastos no Brasil vs gastos no exterior por estado.
parlamentarLimite <- ceapData[ceapData$sgUF == "CE",]
parlamentarLimite$dataEmissao <- substr(parlamentarLimite$dataEmissao, 1, 7)
parlamentarEmiteGrouped <- aggregate( valorLiquido ~ nomeParlamentar + sgPartido + sgUF + dataEmissao, parlamentarLimite, sum)
limite <- transform(parlamentarEmiteGrouped, c=ifelse(parlamentarEmiteGrouped$valorLiquido - 42451.77>0, 1, 0))
parlamentarUltrapassa <- aggregate(c ~ sgUF + nomeParlamentar + sgPartido, limite, sum)
p <- ggplot(parlamentarUltrapassa, aes(reorder(sprintf("%s - %s", nomeParlamentar, sgPartido), c), c))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Número de vezes que parlamentares cearenses estouraram a cota mensal do CEAP") + xlab("Parlamentar") + ylab("Frequência")
O meu estado de origem é o Ceará. Por isso foram analisados dados respectivos a este estado. A partido do gráfico supracitado, temos que o deputado que mais vezes ultrapassou o limite mensal cearense (42451.77 reais) foi o deputado Domingo Neto do PSD. Domingos inclusive está bem a frente do segundo e terceiro colocado.
Em contrapartida, há vários deputados que não ultrapassaram sequer uma vez o limite. Podemos citar os deputados Ariosto Holanda e Vicente Arruda, ambos do PDT.