knitr::opts_chunk$set(warning = FALSE)
library(plotly)
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 3.4.4
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(rgdal)
## Warning: package 'rgdal' was built under R version 3.4.4
## Loading required package: sp
## Warning: package 'sp' was built under R version 3.4.4
## rgdal: version: 1.3-4, (SVN revision 766)
## Geospatial Data Abstraction Library extensions to R successfully loaded
## Loaded GDAL runtime: GDAL 2.1.3, released 2017/20/01
## Path to GDAL shared files: /Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgdal/gdal
## GDAL binary built with GEOS: FALSE
## Loaded PROJ.4 runtime: Rel. 4.9.3, 15 August 2016, [PJ_VERSION: 493]
## Path to PROJ.4 shared files: /Library/Frameworks/R.framework/Versions/3.4/Resources/library/rgdal/proj
## Linking to sp version: 1.3-1
library(leaflet)
## Warning: package 'leaflet' was built under R version 3.4.4
library(RColorBrewer)
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 3.4.2
## ── Attaching packages ────────────────────────────────────────────────────────────────────────────────────────────────────── tidyverse 1.2.1 ──
## ✔ tibble 1.4.2 ✔ purrr 0.2.5
## ✔ tidyr 0.8.1 ✔ dplyr 0.7.6
## ✔ readr 1.1.1 ✔ stringr 1.2.0
## ✔ tibble 1.4.2 ✔ forcats 0.3.0
## Warning: package 'tibble' was built under R version 3.4.3
## Warning: package 'tidyr' was built under R version 3.4.4
## Warning: package 'purrr' was built under R version 3.4.4
## Warning: package 'dplyr' was built under R version 3.4.4
## Warning: package 'forcats' was built under R version 3.4.3
## ── Conflicts ───────────────────────────────────────────────────────────────────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks plotly::filter(), stats::filter()
## ✖ dplyr::lag() masks stats::lag()
library(dplyr)
library(ggplot2)
Esta análise explanatória será feita utilizando dados sobre as despesas de deputados federais da legisLatura atual com a atividade parlamentar. Logo abaixo será respondido 5 perguntas tomando como base os dados fornecidos.
Antes de tudo, será importado a nossa base de dados.
dadosCEAP <- read.csv("/Users/mattheusbrito/Downloads/AD2/dadosCEAP.csv")
dadosCEAP$valorGlosa <- as.numeric(sub(",", ".", dadosCEAP$valorGlosa, fixed = TRUE))
dadosLimiteCEAP <- read.csv("/Users/mattheusbrito/Downloads/AD2/limiteMensalCEAP.csv")
dadosCEAP %>% full_join(dadosLimiteCEAP, by=c("sgUF" = "UF")) -> dadosCEAP
Para responder a pergunta acima, teremos que somar as despesas de cada deputado segundo a CEAP para assim concluir quais os deputados que mais gastaram e os que menos gastaram dinheiro da CEAP
parlamentaresMais <- dadosCEAP %>%
group_by(nomeParlamentar) %>%
filter(valorLíquido >= 0) %>%
summarise(totalGasto = sum(valorLíquido)) %>%
na.omit()
parlamentaresMais <- parlamentaresMais[order(parlamentaresMais$totalGasto, decreasing = TRUE),]
parlamentaresMais$indexGasto <- factor(parlamentaresMais$nomeParlamentar, levels = parlamentaresMais$nomeParlamentar)
parlamentaresMais %>%
plot_ly(x=~indexGasto, y =~totalGasto, type="bar") %>%
layout(title = "Parlamentares que mais gastaram dinheiro da CEAP",
xaxis = list(title="Nome do Parlamentar", range= c(0,10)),
yxaxis = list(title="Valor (em R$) gasto", range = c(0,10)))
O gráfico acima mostra os 10 parlamentares que mais gastaram dinheiro da CEAP, sendo assim, pode-se notar que a variância entre os valores é ínfima. Variando apenas 0.19M aproximadamente e destacando o parlamentar Edio Lopes que 1.64M em reais do dinheiro da CEAP.
parlamentaresMenos <- dadosCEAP %>%
group_by(nomeParlamentar) %>%
filter(valorLíquido >= 0) %>%
summarise(totalGasto = sum(valorLíquido)) %>%
filter(totalGasto > 0) %>%
na.omit()
parlamentaresMenos %>%
plot_ly(x=~reorder(nomeParlamentar, totalGasto), y=~totalGasto, type = "bar") %>%
layout(title = "Parlamentares que menos gastaram dinheiro da CEAP",
xaxis = list(title="Nome do Parlamentar", range= c(0,10)),
yaxis = list(title ="Valor (em R$) gasto", range= c(0,10)))
O parlamentar que menos gastou foi o Camilo Cola, seguido por Eliseu Padilha e Marcio Monteiro. Após a análise desse gráfico podemos afirmar que a diferença entre Camilo e Eliseu é significativa, devido ao fato de que por mais que os valores não sejam tão altos comparados ao gráfico anterior, ainda é uma grande diferença olhando pelo lado porporcional.
Para responder a segunda pergunta, é preciso somar as despesas gastas no exterior agrupando por estado segundo a CEAP. Para assim ser possível responder quais os estados que mais gastam no exterior
mapa <- readOGR("/Users/mattheusbrito/Downloads/AD2/mapa/BRUFE250GC_SIR.shp")
mapa@data$sgUF <- c("AC", "AL", "AP", "BA", "CE", "DF", "ES", "GO", "MA", "MT", "MS", "MG", "PA", "PB", "PE", "PI", "RJ", "RN", "RS", "RR", "SC", "SP", "SE", "TO", "PR", "RO", "AM")
dadosEstados <- dadosCEAP %>%
group_by(sgUF) %>%
filter(valorLíquido >= 0) %>%
summarise(valorGasto = sum(valorLíquido))
mapa@data <- mapa@data %>%
left_join(dadosEstados)
## Joining, by = "sgUF"
gastosExterior <- dadosCEAP %>%
filter(tipoDocumento == 2) %>%
group_by(sgUF) %>%
filter(valorLíquido >= 0) %>%
summarise(exteriorGastos = sum(valorLíquido))
mapa@data <- mapa@data %>%
left_join(gastosExterior)
## Joining, by = "sgUF"
cores = colorNumeric("Reds", mapa@data$exteriorGastos)
mapa %>%
leaflet() %>%
addProviderTiles(providers$Esri.WorldGrayCanvas) %>%
addPolygons(opacity = 0.5,
weight = 1,
fillColor = cores(mapa@data$exteriorGastos),
fillOpacity = 1,
color = "black",
label = paste(mapa@data$NM_ESTADO),
popup = paste(mapa@data$NM_ESTADO, "</br>",
"Total de gastos no exterior: ", ifelse(is.na(mapa@data$exteriorGastos),
0, mapa@data$exteriorGastos))) %>%
addLegend(position = "bottomright", pal = cores, values = mapa@data$exteriorGastos,
title = "Gastos no exterior",
opacity = 1, na.label = "0")