knitr::opts_chunk$set(warning = FALSE)
library(plotly)
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 3.4.4
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(rgdal)
## Warning: package 'rgdal' was built under R version 3.4.4
## Loading required package: sp
## Warning: package 'sp' was built under R version 3.4.4
## rgdal: version: 1.3-4, (SVN revision 766)
##  Geospatial Data Abstraction Library extensions to R successfully loaded
##  Loaded GDAL runtime: GDAL 2.1.3, released 2017/20/01
##  Path to GDAL shared files: /Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgdal/gdal
##  GDAL binary built with GEOS: FALSE 
##  Loaded PROJ.4 runtime: Rel. 4.9.3, 15 August 2016, [PJ_VERSION: 493]
##  Path to PROJ.4 shared files: /Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgdal/proj
##  Linking to sp version: 1.3-1
library(leaflet)
## Warning: package 'leaflet' was built under R version 3.4.4
library(RColorBrewer)
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 3.4.2
## ── Attaching packages ────────────────────────────────────────────────────────────────────────────────────────────────────── tidyverse 1.2.1 ──
## ✔ tibble  1.4.2     ✔ purrr   0.2.5
## ✔ tidyr   0.8.1     ✔ dplyr   0.7.6
## ✔ readr   1.1.1     ✔ stringr 1.2.0
## ✔ tibble  1.4.2     ✔ forcats 0.3.0
## Warning: package 'tibble' was built under R version 3.4.3
## Warning: package 'tidyr' was built under R version 3.4.4
## Warning: package 'purrr' was built under R version 3.4.4
## Warning: package 'dplyr' was built under R version 3.4.4
## Warning: package 'forcats' was built under R version 3.4.3
## ── Conflicts ───────────────────────────────────────────────────────────────────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks plotly::filter(), stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
library(dplyr)
library(ggplot2)

Introdução

Esta análise explanatória será feita utilizando dados sobre as despesas de deputados federais da legisLatura atual com a atividade parlamentar. Logo abaixo será respondido 5 perguntas tomando como base os dados fornecidos.

Antes de tudo, será importado a nossa base de dados.

dadosCEAP <- read.csv("/Users/mattheusbrito/Downloads/AD2/dadosCEAP.csv")
dadosCEAP$valorGlosa <- as.numeric(sub(",", ".", dadosCEAP$valorGlosa, fixed = TRUE))
dadosLimiteCEAP <- read.csv("/Users/mattheusbrito/Downloads/AD2/limiteMensalCEAP.csv")
dadosCEAP %>% full_join(dadosLimiteCEAP, by=c("sgUF" = "UF")) -> dadosCEAP

Perguntas

1 - Quais são os deputados que gastaram mais dinheiro da CEAP? Quais são os mais econômicos?

Para responder a pergunta acima, teremos que somar as despesas de cada deputado segundo a CEAP para assim concluir quais os deputados que mais gastaram e os que menos gastaram dinheiro da CEAP

parlamentaresMais <- dadosCEAP %>%
  group_by(nomeParlamentar) %>%
  filter(valorLíquido >= 0) %>%
  summarise(totalGasto = sum(valorLíquido)) %>%
  na.omit()

parlamentaresMais <- parlamentaresMais[order(parlamentaresMais$totalGasto, decreasing = TRUE),]
parlamentaresMais$indexGasto <- factor(parlamentaresMais$nomeParlamentar, levels = parlamentaresMais$nomeParlamentar)

parlamentaresMais %>%
  plot_ly(x=~indexGasto, y =~totalGasto, type="bar") %>%
  layout(title = "Parlamentares que mais gastaram dinheiro da CEAP",
         xaxis = list(title="Nome do Parlamentar", range= c(0,10)),
         yxaxis = list(title="Valor (em R$) gasto", range = c(0,10)))

O gráfico acima mostra os 10 parlamentares que mais gastaram dinheiro da CEAP, sendo assim, pode-se notar que a variância entre os valores é ínfima. Variando apenas 0.19M aproximadamente e destacando o parlamentar Edio Lopes que 1.64M em reais do dinheiro da CEAP.

parlamentaresMenos <- dadosCEAP %>%
  group_by(nomeParlamentar) %>%
  filter(valorLíquido >= 0) %>%
  summarise(totalGasto = sum(valorLíquido)) %>%
  filter(totalGasto > 0) %>%
  na.omit()

parlamentaresMenos %>%
  plot_ly(x=~reorder(nomeParlamentar, totalGasto), y=~totalGasto, type = "bar") %>%
  layout(title = "Parlamentares que menos gastaram dinheiro da CEAP",
         xaxis = list(title="Nome do Parlamentar", range= c(0,10)),
         yaxis = list(title ="Valor (em R$) gasto", range= c(0,10)))

O parlamentar que menos gastou foi o Camilo Cola, seguido por Eliseu Padilha e Marcio Monteiro. Após a análise desse gráfico podemos afirmar que a diferença entre Camilo e Eliseu é significativa, devido ao fato de que por mais que os valores não sejam tão altos comparados ao gráfico anterior, ainda é uma grande diferença olhando pelo lado porporcional.

2 - Quais os estados cujos deputados gastam mais no exterior? Quais os estados cujos deputados gastam menos no exterior?

Para responder a segunda pergunta, é preciso somar as despesas gastas no exterior agrupando por estado segundo a CEAP. Para assim ser possível responder quais os estados que mais gastam no exterior

mapa <- readOGR("/Users/mattheusbrito/Downloads/AD2/mapa/BRUFE250GC_SIR.shp")
mapa@data$sgUF <- c("AC", "AL", "AP", "BA", "CE", "DF", "ES", "GO", "MA", "MT", "MS", "MG", "PA", "PB", "PE", "PI", "RJ", "RN", "RS", "RR", "SC", "SP", "SE", "TO", "PR", "RO", "AM")

dadosEstados <- dadosCEAP %>%
  group_by(sgUF) %>%
  filter(valorLíquido >= 0) %>%
  summarise(valorGasto = sum(valorLíquido))
  
  

mapa@data <- mapa@data %>%
  left_join(dadosEstados)
## Joining, by = "sgUF"
gastosExterior <- dadosCEAP %>%
  filter(tipoDocumento == 2) %>%
  group_by(sgUF) %>%
  filter(valorLíquido >= 0) %>%
  summarise(exteriorGastos = sum(valorLíquido))

mapa@data <- mapa@data %>%
  left_join(gastosExterior)
## Joining, by = "sgUF"
cores = colorNumeric("Reds", mapa@data$exteriorGastos)

mapa %>%
  leaflet() %>%
  addProviderTiles(providers$Esri.WorldGrayCanvas) %>%
  addPolygons(opacity = 0.5,
              weight = 1,
              fillColor = cores(mapa@data$exteriorGastos),
              fillOpacity = 1,
              color = "black",
              label = paste(mapa@data$NM_ESTADO),
              popup = paste(mapa@data$NM_ESTADO, "</br>",
                            "Total de gastos no exterior: ", ifelse(is.na(mapa@data$exteriorGastos),
                                                                    0, mapa@data$exteriorGastos))) %>%
  addLegend(position = "bottomright", pal = cores, values = mapa@data$exteriorGastos,
            title = "Gastos no exterior",
            opacity = 1, na.label = "0")

O estado que contém os parlamentares que mais gastam no exterior é o estado de São Paulo seguido de Minas Gerais, com um valor de R$ 102366.56 e R$ 79767.77, respectivamente. Por outro lado vemos que 5 estados não foram observados com gasto no exterior, Mato Grosso do Sul, Amapá, Goiás, Distrito Federal e Rio Grande do Norte.

3 - Quais os partidos cujos parlamentares mais usam CEAP no estado da Paraíba? Quais são os que menos usam? Mesmas perguntas considerando valores em R$.

Para responder a pergunta é preciso filtrar os parlamentares apenas da Paraíba e agrupar por partido, para assim fazer a soma dos valores gastos e quantidade de vezes que o partido fez uso do dinheiro da CEAP.

gastosPartidosPB <- dadosCEAP %>%
  filter(sgUF == "PB") %>%
  group_by(sgPartido) %>%
  filter(valorLíquido >= 0) %>%
  summarise(totalGasto = sum(valorLíquido), vezesGasto = n())
gastosPartidosPB %>%
  plot_ly(y= ~reorder(sgPartido, vezesGasto), x= ~vezesGasto, type= "scatter", mode="markers", color = ~sgPartido) %>%
  layout(margin = list(l = 150),
         yaxis = list (title = ""))

No primeiro gráfico, o partido que mais fez uso do dinheiro da CEAP foi o PMDB, que fez uso 3863 vezes. Sendo uma diferença significativa para os outros partidos onde o que mais se aproxima foi o PP que fez uso 1990 vezes que equivale a um pouquinho mais da metade das vezes que o PMDB utilizou.

gastosPartidosPB %>%
  plot_ly(y= ~reorder(sgPartido, totalGasto), x= ~totalGasto, type= "scatter", mode="markers", color = ~sgPartido) %>%
  layout(margin = list(l = 150),
         yaxis = list (title = ""))

No segundo gráfico, o partido que mais gastou dinheiro da CEAP foi também o PMDB, que gastou aproximadamente 4 milhões de reais. Novamente vemos uma boa diferença em relação aos outros partidos que dessa vez o que mais se aproxima é o PR que não fez uso sequer da metade da quantidade que o Partido do Movimento Democrático Brasileiro.

4 - Quais os deputados que mais ultrapassam o limite de CEAP do seu estado?

Para responder a quarta pergunta, teremos que agrupar pelo nome do parlamentar, pelo limite mensal, por ano e por mes que cada parlamentar gastou.

excedemLimite <- dadosCEAP %>%
  mutate(ano = substr(dataEmissao, 1, 4)) %>%
  mutate(mes = substr(dataEmissao, 6, 7)) %>%
  group_by(nomeParlamentar, limite_mensal, ano, mes) %>%
  filter(valorLíquido >= 0) %>%
  summarise(totalGasto = sum(valorLíquido)) %>%
  filter(totalGasto > limite_mensal) %>%
  na.omit()
excedemLimite <- excedemLimite %>%
   group_by(nomeParlamentar) %>%
  summarise(vezesExcedido = n())

excedemLimite <- excedemLimite[order(excedemLimite$vezesExcedido, decreasing = TRUE),]
excedemLimite$indexGasto <- factor(excedemLimite$nomeParlamentar, levels = excedemLimite$nomeParlamentar)

excedemLimite %>%
  plot_ly(x= ~indexGasto, y= ~vezesExcedido,type= "scatter", mode= "lines+markers") %>%
  layout(title="Parlamentares que mais ultrapassam o limite de CEAP do seu estado", 
         xaxis=list(title="Parlamentar", range= c(0,10)), 
         yaxis=list(title="Quantidade de vezes ultrapassada"), barmode="stack")

Observando o gráfico vemos que Felipe Bornier foi o parlamentar que ultrapassou mais vezes o limite mensal do seu estado, seguido por Domingos Neto e Jandira Feghali, sendo 26, 22 e 22 o número de vezes, respectivamente.

excedemLimite <- dadosCEAP %>%
  mutate(ano = substr(dataEmissao, 1, 4)) %>%
  mutate(mes = substr(dataEmissao, 6, 7)) %>%
  group_by(nomeParlamentar, limite_mensal, ano, mes) %>%
  filter(valorLíquido >= 0) %>%
  summarise(totalGasto = sum(valorLíquido)) %>%
  filter(totalGasto > limite_mensal) %>%
  na.omit()
excedemLimite <- excedemLimite %>%
   group_by(nomeParlamentar) %>%
  summarise(totalExcedido = sum(totalGasto))

excedemLimite <- excedemLimite[order(excedemLimite$totalExcedido, decreasing = TRUE),]
excedemLimite$indexGasto <- factor(excedemLimite$nomeParlamentar, levels = excedemLimite$nomeParlamentar)

excedemLimite %>%
  plot_ly(x= ~indexGasto, y= ~totalExcedido,type= "scatter", mode= "lines+markers") %>%
  layout(title="Parlamentares que mais ultrapassam o limite de CEAP do seu estado", 
         xaxis=list(title="Parlamentar", range= c(0,10)), 
         yaxis=list(title="Valores (em R$) ultrapassada"), barmode="stack")

Apesar do primeiro gráfico mostrar o número de vezes que cada deputado ultrapassou o limite mensal do seu estado, muitos dos parlamentares que estão cabeçando o gráfico anterior não aparecem nesse acima, exceção de alguns como Felipe Bornier e Rômulo Gouveia por exemplo. Pelo outro lado, vemos parlamentares que não estão presentes no primeiro gráfico mas ficam numa posição bem colocada no segundo, como por exemplo o deputado Zé Geraldo.

5 - Quais estados cujos parlamentares gastam mais com passagens aéreas?

gastosPassagens <- dadosCEAP %>%
  filter(tipoDespesa == "Emissão Bilhete Aéreo") %>%
  group_by(sgUF) %>%
  filter(valorLíquido > 0) %>%
  summarise(totalPassagens = sum(valorLíquido)) %>%
  na.omit()

gastosPassagens %>%
  plot_ly(y = ~reorder(sgUF,totalPassagens), x = ~totalPassagens, type = "bar", color = ~sgUF) %>%
  layout(title = "Estados cujos parlamentares gastam mais com passagens aéreas",
         yaxis = list(title = "Parlamentar"),
         xaxis = list (title = "Total gasto (em R$) com passagens aéreas"))

O estado que mais gasta com passagens aéreas é São Paulo, resultando em um total de 23 milhões de reais aproximadamente, seguido pelo estado do Rio de Janeiro com um total de 17 milhões de reais aproximadamente

6 - Escolha três partidos e responda: Quais são os tipos de despesa mais utilizados no uso da CEAP pelos deputados desses partidos? Mesma pergunta considerando valores em R$.

Para responder a sexta pergunta teremos que filtrar apenas os parlamentares dos seguintes partidos: PT, PMDB e PSDB e após isso agrupar pelo tipo da despesa também, para assim somar o total dos gastos e as vezes em que foi gasto

partidos <- dadosCEAP %>%
  filter(sgPartido %in% c("PT", "PMDB", "PSDB"))

tipoGastos <- partidos %>%
  group_by(tipoDespesa) %>%
  summarise(vezesGasto = n())

tipoGastos %>%
  plot_ly(labels= ~tipoDespesa, values= ~vezesGasto, type = "pie") %>%
  layout(title = "Tipos de despesa mais utilizados pelos deputados do PT, PSDB e PMDB",
         xaxis = list(showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE),
         yaxis = list(showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE), showlegend = FALSE)

Após analisar o gráfico de pizza acima, pode-se confirmar que o maior tipo de despesa é o de Emissão de Bilhete Aéreo. E o que gera menos despesa é o de Participação em curso, palestra ou evento similar.

partidos <- dadosCEAP %>%
  filter(sgPartido %in% c("PT", "PMDB", "PSDB"))

tipoGastos <- partidos %>%
  group_by(tipoDespesa) %>%
  filter(valorLíquido >= 0) %>%
  summarise(totalGasto = sum(valorLíquido))
tipoGastos %>%
plot_ly(y = ~reorder(tipoDespesa,totalGasto), x = ~totalGasto, type = "bar", color = ~tipoDespesa) %>%
  layout(title = "Tipos de despesa mais utilizados no uso da CEAP pelos deputados dos partidos PT, PMDB e PSDB, considerando valores em R$",
         yaxis = list(title = "Tipo de Despesa"),
         xaxis = list (title = "Total gasto (em R$)"), showlegend = FALSE)

Como esperado o tipo de despesa que gerou mais gasto (em R\() foi o de Emissão de Bilhete Aéreo, dando uma despesa de R\) 53043308 aproximadamente e o que gerou menos gastos foi o de Locação ou fretamento de embarcações gerando apenas uma despesa de R$ 25163 aproximadamente.