Introdução

Dando continuidade ao Documento Anterior , este pequeno artigo tenta analisar um pouco mais dos gastos relacionados ao CEAP. Contudo, desta vez, será dado enfoque aos deputados cearenses. Neste documento a analise terá foco mais no onde e como os deputados cearenses gastam suas verbas. Procurando responder assim perguntas mais especificas.

Refatorando os Dados

Tal como foi feito no documento anterior, primeiramente vamos ler os dados relativos ao CEAP. Além disso, filtraremos apenas dados com valores liquidos maiores que zero¹.

ceapData <- read.csv(file="dadosCEAP.csv", header=TRUE, sep=",", encoding="UTF-8", stringsAsFactors=FALSE)
names(ceapData)[13]<-"valorLiquido"
ceapData <- ceapData[ceapData$valorLiquido >= 0,]

¹: Os valores menores que zero são relacionados a bilhetes aéreos de compensação, que compensam um outro bilhete emitido e não utilizado pelo deputado.

Contudo, nem todos as váriaveis presentes no csv do CEAP e explicadas no documento anterior supracitado serão importantes para a nossa analise. Filtraremos as 13 variáveis em apenas 6. Para estas variáveis também serão dados outro nome(para mais fácil compreensão): “Partido”, “Nome”, “UF”, “Descrição”, “Fornecedor” “valorLiquido”. Além disso, queremos apenas os deputados do Ceará:

gastosCeap <- ceapData %>% select (1, 3, 4, 5, 7, 13)

names(gastosCeap) <- c("Nome", "UF", "Partido", "TipoDespesa", "Fornecedor", "valorLiquido")

gastosCeapCeara <- gastosCeap %>% filter( UF == "CE")

Analise dos Fornecedores

A primeira pergunta a ser feita será: Quais os fornecedores que mais lucram com os deputados cearenses? Para esta pergunta tentaremos analisar vários pontos tais quais: Quais empresas lucram mais, há algum ponto fora da curva, quais os tipos de empresas que lucram mais, etc. Porém, primeiramente necessitamos refatorar os dados obtidos. Devido ao grande número de fornecedores, analisaremos apenas os 15 maiores gastos. Acredito que as empresas que mais lucram seriam as empresas áereas, por conta da distância fortaleza - brasilia.

lucroFornecedor <- select(gastosCeapCeara, valorLiquido, Fornecedor)
agruparFornecedor <-  group_by(lucroFornecedor, Fornecedor)
lucroPorFornecedor <- summarise(agruparFornecedor, sum(valorLiquido))
colnames(lucroPorFornecedor) <- c("Fornecedor", "Valor.Total")
lucroPorFornecedor <- lucroPorFornecedor[order(decreasing = TRUE,lucroPorFornecedor$Valor.Total),]
lucroPorFornecedorTop15 <- head(lucroPorFornecedor,15)

fornecedorTipo <- select(gastosCeapCeara, TipoDespesa, Fornecedor, valorLiquido)
agruparFornecedorTipo <- group_by(fornecedorTipo, Fornecedor, TipoDespesa)
agruparFornecedorTipo <-  summarise(agruparFornecedorTipo, sum(valorLiquido))
colnames(agruparFornecedorTipo) <- c("Fornecedor", "TipoDespesa", "Valor.Total")
agruparFornecedorTipo <- agruparFornecedorTipo[order(decreasing = TRUE,agruparFornecedorTipo$Valor.Total),]
agruparFornecedorTipoTop15 <- head(agruparFornecedorTipo,15)

A partir da refatoração podemos obter um gráfico de barras das empresas que mais lucram com os deputados.

ggplot(lucroPorFornecedorTop15, aes(x=reorder(Fornecedor, -Valor.Total), y=Valor.Total)) + geom_bar(stat = "identity", fill="steelblue") +
  labs(x='Fornecedor', y='Dinheiro Recebido') + 
  theme(panel.background=element_blank()) +
  coord_flip()

Para uma visualização mais especifica dos dados, podemos utilizar-se de uma tabela para visualizar estes dados.

pandoc.table(agruparFornecedorTipoTop15, style="grid")
## 
## 
## +-------------------------------+---------------------------+-------------+
## |          Fornecedor           |        TipoDespesa        | Valor.Total |
## +===============================+===========================+=============+
## |       Cia Aérea - TAM        |  Emissão Bilhete Aéreo  |   3228543   |
## +-------------------------------+---------------------------+-------------+
## |       Cia Aérea - GOL        |  Emissão Bilhete Aéreo  |   2425123   |
## +-------------------------------+---------------------------+-------------+
## |     Cia Aérea - AVIANCA      |  Emissão Bilhete Aéreo  |   1533082   |
## +-------------------------------+---------------------------+-------------+
## |    Oliveira de Vasconcelos    | CONSULTORIAS, PESQUISAS E |   458754    |
## |         Advocacia S/S         |   TRABALHOS TÉCNICOS.    |             |
## +-------------------------------+---------------------------+-------------+
## |  Eder Holanda de carvalho ME  | DIVULGAÇÃO DA ATIVIDADE |   414162    |
## |                               |       PARLAMENTAR.        |             |
## +-------------------------------+---------------------------+-------------+
## |     DATASENSUS PESQUISA E     | CONSULTORIAS, PESQUISAS E |   351000    |
## |     CONSULTORIA S/S LTDA      |   TRABALHOS TÉCNICOS.    |             |
## +-------------------------------+---------------------------+-------------+
## | QUALIGRAF - EDITORA E GRAFICA | DIVULGAÇÃO DA ATIVIDADE |   343651    |
## |             LTDA              |       PARLAMENTAR.        |             |
## +-------------------------------+---------------------------+-------------+
## |   Xerez Araripe Advocacia e   | CONSULTORIAS, PESQUISAS E |   329000    |
## |        Consultoria ME         |   TRABALHOS TÉCNICOS.    |             |
## +-------------------------------+---------------------------+-------------+
## |     CASABLANCA RENT A CAR     | LOCAÇÃO OU FRETAMENTO DE |   313131    |
## |                               |   VEÍCULOS AUTOMOTORES   |             |
## +-------------------------------+---------------------------+-------------+
## | LEVITA LOCAÇÃO DE VEÍCULOS | LOCAÇÃO OU FRETAMENTO DE |   274040    |
## |            LTDA-ME            |   VEÍCULOS AUTOMOTORES   |             |
## +-------------------------------+---------------------------+-------------+
## | AMAZONIA RENT A CAR LOCADORA  | LOCAÇÃO OU FRETAMENTO DE |   271327    |
## |                               |   VEÍCULOS AUTOMOTORES   |             |
## +-------------------------------+---------------------------+-------------+
## |       CELULAR FUNCIONAL       |         TELEFONIA         |   266904    |
## +-------------------------------+---------------------------+-------------+
## |       SOLAR TAXI AEREO        | LOCAÇÃO OU FRETAMENTO DE |   265099    |
## |                               |         AERONAVES         |             |
## +-------------------------------+---------------------------+-------------+
## | JOSELY FERNANDA DO NASCIMENTO | DIVULGAÇÃO DA ATIVIDADE |   259500    |
## |                               |       PARLAMENTAR.        |             |
## +-------------------------------+---------------------------+-------------+
## |  GRAFICA E EDITORA POUCHAIN   | DIVULGAÇÃO DA ATIVIDADE |   239595    |
## |          RAMOS LTDA           |       PARLAMENTAR.        |             |
## +-------------------------------+---------------------------+-------------+

A partir do gráfico e da tabela podemos notar que as empresas que mais faturam com os deputados são as empresas aéreas TAM, Avianca e Gol. Isso pode ser explicado pela necessidade dos deputados cearenses viajarem bastante a brasília.

Para a segunda pergunta, tentaremos analisar se há muita variância de gastos nestas 15 empresas. Para melhor visualização faremos um gráfico de dispersão, mostrando todos os gastos individuais que os deputados cearenses tiveram com estas empresas.

Respondendo está pergunta, acredito que possa haver algumas váriancias em certas empresas. Principalmente em empresas de divulgação.

topFornecedores <- subset(agruparFornecedor, Fornecedor %in% lucroPorFornecedorTop15$Fornecedor)

ggplot(topFornecedores, aes(x = Fornecedor, y = topFornecedores$valorLiquido)) + geom_point() + coord_flip()  + ylab("Valor gasto") + xlab("Fornecedor")

Pelo gráfico podemos notar que apesar das empresas de aviação receberem mais recursos dos deputados, elas são as que possuem uma menor dispersão ou valores estranhos. A partir deste gráfico notamos algo estranho. As duas maiores dispersões se encontram na empresa Eder Holanda de Carvalho ME e na GRAFICA E EDITORA POUCHAIN RAMOS LTDA . Em ambos os casos, poucos deputados colocaram dinheiro nestas empresas. Enquanto na empresa “Eder Holanda de Carvalho ME” todos os gastos foram do deputado Macedo(PP), a empresa “GRAFICA E EDITORA POUCHAIN RAMOS LTDA” obtiveram valores monetários dos deputados Danilo Forte(PSB) e do deputado Ronaldo Martions(PRB). Além disso, pode-se notar que as maiores variações geralmente estão ligadas a empresas de divulgações.

Com isso finalizamos nossa analise inicial. Para o futuro, será interessante continuar está analise verificando se há alguma correlação entre doações e gastos dos deputados. Porém, não temos estas dados agrupados no momento. Uma outra pergunta que gostaria de ter feito e respondido seria da relação partidos com fornecedores. Porém, deixo isto para uma próxima analise mais aprofundada sobre o tema.

Analise das viagens dos deputados

Nesta parte do documento tentaremos analisar quais são os partidos que mais gastam com passagens áereas de forma proporcional. Para está pergunta não tenho uma resposta especifica. Porém, poderia prever que quanto maior o partido, mais se gasta com passagens de forma proporcional.

gastosPassagensPart <- select(gastosCeapCeara, valorLiquido, Partido)
agruparGastosPassagensPart <-  group_by(gastosPassagensPart, Partido)
gastosPorPassagensPart <- summarise(agruparGastosPassagensPart, sum(valorLiquido))
colnames(gastosPorPassagensPart) <- c("Partido", "Valor.Total")

freqPart <- select(gastosCeapCeara, Nome, Partido)
freqPart <- unique(freqPart)
freqPart <- table(freqPart$Partido)
freqPart <- as.data.frame(freqPart)
freqPart <- filter(freqPart, Freq > 0)

colnames(freqPart)  <- c("Partido", "Freq")
gastosPorPassagensPart <- merge(freqPart, gastosPorPassagensPart)

Agora, plotaremos um gŕafico de barras:

ggplot(gastosPorPassagensPart, aes(x= reorder(Partido, -Valor.Total/Freq), y = Valor.Total/Freq, fill = Partido)) + geom_bar(stat = "identity") + coord_flip() + ylab("Média do gasto por partido do partido (em reais)") + xlab("Partido")

A partir disso, podemos notar que apesar do PDT e do PMDB(ambos com 5) terem mais representantes, proporcionalmente é no PSDB onde os deputados mais gastam com passagens aereas. Ou seja, dando um indício de que o número de representantes de um partido não está diretamente ligado aos gastos com passagens áereas do mesmo.

A partir dos dados obtidos em: http://www2.camara.leg.br/transparencia/cota-para-exercicio-da-atividade-parlamentar/dados-abertos-cota-parlamentar. Pode se notar que parlamentares também gastam passagens com terceiros. Isto poderia explicar um pouco da não proporcionalidade de gastos com passagens.

Conclusão

Com isso concluímos nosso relatório final sobre os gastos dos deputados cearenses. Desta vez, procuramos ser mais específicos em relação aos gastos, contudo, pela falta de domínio com a linguagem, muito do que se pretendia não foi alcançado. No futuro seria interessante expandir está analise com dados de outras fontes, para assim obter uma analise mais rica e detalhada dos deputados e talvez até achar correlações interessantes entre os gastos dos deputados.