Introdrução

Este estudo tem como objetivo apresentar alguns dados e responder algumas perguntas em relação ao CEAP (cota para o exercício da atividade parlamentar). A CEAP (cota para o exercício da atividade parlamentar) é uma cota única mensal destinada a custear os gastos dos deputados exclusivamente vinculados ao exercício da atividade parlamentar. Exemplos de despesa desse tipo são: passagens aéreas, telefonia, serviços postais, manutenção de escritórios de apoio à atividade parlamentar, assinatura de publicações, fornecimento de alimentação ao parlamentar, hospedagem, outras despesas com locomoção, contemplando locação ou fretamento de aeronaves, veículos automotores e embarcações, serviços de táxi, pedágio e estacionamento e passagens terrestres. Mais informações neste link . Os dados foram coletados do site de transparência da Câmara, tratados, e podem ser baixados neste link . Uma breve descrição dos dados se encontra abaixo.

1. Quais os partidos que mais fazem uso da CEAP? Quais os partidos que menos fazem uso? Mesmas perguntas considerando valores em R$.

df2 <- count(ceapData, c('sgPartido'))
df2 <- na.omit(df2)

p <- ggplot(df2, aes(reorder(sgPartido, freq), freq))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Uso do CEAP por partido") +  xlab("Partido") + ylab("Numero de vezes que o CEAP foi utilizado pelos Partidos") + scale_y_continuous(breaks = round(seq(min(df2$freq), max(df2$freq), by = 10000),1))

Como pode se notar no gráfico acima, os 5 partidos que mais utilizaram a CEAP foram, em ordem: [PT, PMDB, PSDB, PP, PR].

Em contrapartida, os 5 partidos que menos utilizaram a CEAP foram, em ordem: [PTdoB, PMN, PRTB, PRP, PSL]

Um sumário dos dados com algumas medidas estatísticas se encontra disposto abaixo:

summary(df2$freq)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##      41    7916   18990   32696   50617  124920
dataSum <- aggregate(valorLiquido ~ sgPartido, ceapData, sum)

p <- ggplot(dataSum, aes(reorder(sgPartido, valorLiquido), valorLiquido))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Valor total do CEAP por partido") +  xlab("Partido") + ylab("Valor total dos gastos com CEAP por Partidos em Reais") + scale_y_continuous(breaks = round(seq(min(dataSum$valorLiquido), max(dataSum$valorLiquido), by = 10000000),1))

Contudo, quando se trata de valores totais gastos, temos que o PMDB aparece na frente do PT. O ranking dos cinco partidos continua parecido quando se trata do uso considerando valores em R$: [PMDB, PT, PSDB, PP, PR]

Os 5 partidos que menos utilizaram considerando valores em R$ a CEAP foram em ordem: [PTdoB, PMN, PRTB, PRP, PSL]

Um sumário dos dados com algumas medidas estatisticas se encontra disposto abaixo:

summary(dataSum$valorLiquido)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##    22505  5537683 12277942 21616216 35755825 74723117

Aqui podemos notar que a média de gastos de cada partido é de 21616216 reais. Contudo, isto se deve aos partidos menores. Já que os maiores partidos, e consequentemente, com mais representantes acabam por gastar muito mais

2. Quais os tipos de despesa mais comuns no uso da CEAP? Mesma pergunta considerando valores em R$

Um sumário dos dados com algumas medidas estatisticas se encontra disposto abaixo:

summary(despesa$freq)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##      65    2570   16375   50984   74736  254464
dataSumTipoDespesa <- aggregate(valorLiquido ~ tipoDespesa, ceapData, sum)

p <- ggplot(dataSumTipoDespesa, aes(reorder(tipoDespesa, valorLiquido), valorLiquido))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Valor total do CEAP por tipo de despesa") +  xlab("Tipo de Despesa") + ylab("Valor total dos gastos com CEAP por tipo de Despesa em Reais") + scale_y_continuous(breaks = round(seq(min(dataSumTipoDespesa$valorLiquido), max(dataSumTipoDespesa$valorLiquido), by = 50000000),1))

Um sumário dos dados com algumas medidas estatisticas se encontra disposto abaixo:

summary(dataSumTipoDespesa$valorLiquido)
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
##    143302   2952318   7650903  33716372  55943555 154891282

Aqui, nota-se que emissão de bilhete aéreo foi o tipo despesa mais utilizada. Sendo ao total 300185 usos. Contudo, foi divulgação de atividade parlamentar o maior gasto dos deputados. Olhando para os gráficos, pode-se notar que esta atividade em questão tem um alto gasto a cada vez que é utilizada. O mesmo vale para locação ou fretamento de veículos automotores.

3. Levando em conta o estado pelo qual o deputado se elegeu, quais os estados que mais fazem uso da CEAP? Quais os que menos fazem uso? Mesmas perguntas considerando gastos em R$. Por que voc? acha isso?

estado <- count(ceapData, c('sgUF'))
estado <- na.omit(estado)

p <- ggplot(estado, aes(reorder(sgUF, freq), freq))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Uso do CEAP por estado") +  xlab("Estado") + ylab("Numero de vezes que o CEAP foi utilizado por estado") + scale_y_continuous(breaks = round(seq(min(estado$freq), max(estado$freq), by = 20000),1))

dataSumEstado <- aggregate(valorLiquido ~ sgUF, ceapData, sum)

p <- ggplot(dataSumEstado, aes(reorder(sgUF, valorLiquido), valorLiquido))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("CEAP por estado") +  xlab("Estado") + ylab("Valor total dos gastos com CEAP por estados em reais") + scale_y_continuous(breaks = round(seq(min(dataSumEstado$valorLiquido), max(dataSumEstado$valorLiquido), by = 10000000),1))

Analisando os gráficos pode-se notar que:

Os 5 estados que mais fazem uso do CEAP são, em ordem: [SP, MG, RJ, RS, BA] Os 5 estados que menos fazem uso do CEAP são, em ordem: [DF, AP, AM, RR, TO] Os 5 estados que mais fazem uso do CEAP em relação a valores em R$ são, em ordem: [SP, MG, RJ, BA, RS] Os 5 estados que menos fazem uso do CEAP em relação a valores em R$ são, em ordem: [DF, MT, AM, SE, TO]

Ao menos na parte de cima, a lista se assemelha muito com a quantidade atual de deputados por estado (http://www2.camara.leg.br/a-camara/conheca/quantos-sao-e-de-que-forma-e-definido-o-numero-de-deputados). Ou seja, quanto mais deputados o estado tiver, em tese, maior o somatório do CEAP. Outro ponto que acredito que pode influenciar é o custo das atividades em relação a cada estado. Ou da distância em relação a brasília, visto que um dos maiores gastos e usos é com passagens aéreas e aluguel de carros, por exemplo.

4.Quais os parlamentares que mais gastam com CEAP e quais os que menos gastam?

parlamentar <- aggregate( valorLiquido ~ nomeParlamentar + sgPartido + sgUF, ceapData, sum)
parlamentar <- na.omit(parlamentar)

parlamentarDadosDecrescente <- parlamentar[order(decreasing = TRUE, parlamentar$valorLiquido),]

parlamentarDadosCrescente<- parlamentar[order(parlamentar$valorLiquido),]

top15MaisGastam <- head(parlamentarDadosDecrescente,15)
top15MenosGastam <- head(parlamentarDadosCrescente,15)

p <- ggplot(top15MaisGastam, aes(reorder(sprintf("%s - %s - %s", nomeParlamentar, sgPartido, sgUF), valorLiquido), valorLiquido, sgPartido), fill=sgPartido) + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Valor total dos gastos CEAP por parlamentar") +  xlab("Parlamentar") + ylab("Numero de vezes que o CEAP foi utilizado pelo parlamentar") 

p 

g <- ggplot(top15MenosGastam, aes(reorder(sprintf("%s - %s - %s", nomeParlamentar, sgPartido, sgUF), valorLiquido), valorLiquido))
g + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Gasto com CEAP por parlamentar") +  xlab("Tipo de Despesa") + ylab("Valor total dos gastos com CEAP por parlamentar em Reais") + scale_fill_manual(values = top15MenosGastam$sgPartido)

O top 3 dos parlamentares que mais gastaram foram, em ordem: [Edio Lopes - PR de Roraima; Rocha - PSDB do acre; Abel Mesquita Junior - DEM de Roraima]

O top 3 dos parlamentares que menos gastaram foram, em ordem: [Camilo Cola - PMDB do Espirito Santo; Eliseu Padilha - PMDB do Rio Grande do Sul; Márcio monteiro - PSDB do Mato grosso do Sul]

De forma curiosa, 5 dos 15 deputados que mais gastam estão no estado de Roraima.

summary(parlamentar$valorLiquido)
##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
##       0.6   36603.1  966664.0  729221.8 1213322.1 1648665.8

Outro dado interessante é que a mediana é igual a 966700 reais. Ou seja, mais de 50% dos deputados brasileiros gasta mais do que isso com CEAP.

5. Existe correlação entre a quantidade de gastos no exterior e o valor restituido da CEAP?

gastosExterior <- ceapData[ceapData$tipoDocumento == 2,]
gastosExteriorSoma <- aggregate( valorLiquido ~ nomeParlamentar + sgPartido + sgUF, gastosExterior, sum)
gastosExteriorCount <- count(gastosExterior, c('nomeParlamentar'))
correlacao <-merge(gastosExteriorSoma,gastosExteriorCount, all.y=TRUE)

k <- ggplot(correlacao, aes(freq,valorLiquido))
k +  geom_point() + ggtitle("Gráfico de relação entre o valor liquido gasto e o numero de vezes que o parlamentar gastou no exterior") +  xlab("Numero de vezes") + ylab("Valor Liquido em Reais")

k <- ggplotly(k)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
k
cor(correlacao$valorLiquido, correlacao$freq)
## [1] 0.3312854

A partir do gráfico exposto e do fator de correlação apresentado, podemos notar que há uma correlação fraca entre a quantidade de gastos no exterior e o valor restituído da CEAP.

Opcional

1. Quais os estados cujos deputados gastam mais no exterior? Quais os estados cujos deputados gastam menos no exterior?

estadoExterior <- aggregate(valorLiquido ~ sgUF, gastosExterior, sum)
estadoExterior <- na.omit(estadoExterior)

p <- ggplot(estadoExterior, aes(reorder(sgUF, valorLiquido), valorLiquido))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Valor total do CEAP gasto no exterior por estado em reais") +  xlab("Estado") + ylab("Valor total dos gastos com CEAP no exterior por estados") 

Aqui nota-se que a situação muda um pouco. Apesar de São Paulo e Minas Gerais, os estados que mais usufruem do CEAP, continuarem sendo os maiores gastos no exterior, Roraima aparece em terceiro em gastos no exterior. Uma surpresa. Considerando que Roraima não é um dos estados que mais gastam. Em uma futura analise poderíamos analisar a relação de gastos no Brasil vs gastos no exterior por estado.

2. Quais os deputados que mais ultrapassam o limite de CEAP do seu estado?

parlamentarLimite <- ceapData[ceapData$sgUF == "CE",]
parlamentarLimite$dataEmissao <- substr(parlamentarLimite$dataEmissao, 1, 7)


parlamentarEmiteGrouped <- aggregate( valorLiquido ~ nomeParlamentar + sgPartido + sgUF + dataEmissao, parlamentarLimite, sum)

limite <- transform(parlamentarEmiteGrouped, c=ifelse(parlamentarEmiteGrouped$valorLiquido - 42451.77>0, 1, 0))

parlamentarUltrapassa <- aggregate(c ~ sgUF + nomeParlamentar + sgPartido, limite, sum)

p <- ggplot(parlamentarUltrapassa, aes(reorder(sprintf("%s - %s", nomeParlamentar, sgPartido), c), c))
p + geom_bar(stat = "identity", fill="steelblue") + coord_flip() + ggtitle("Número de vezes que parlamentares cearenses estouraram a cota mensal do CEAP") +  xlab("Parlamentar") + ylab("Frequência") 

O meu estado de origem é o Ceará. Por isso foram analisados dados respectivos a este estado. A partido do gráfico supracitado, temos que o deputado que mais vezes ultrapassou o limite mensal cearense (42451.77 reais) foi o deputado Domingo Neto do PSD. Domingos inclusive está bem a frente do segundo e terceiro colocado.

Em contrapartida, há vários deputados que não ultrapassaram sequer uma vez o limite. Podemos citar os deputados Ariosto Holanda e Vicente Arruda, ambos do PDT.