Dados
Os dados usado nessa análise sobre a despesa de deputados federais da legisLatura atual com a atividade parlamentar. A CEAP (cota para o exercício da atividade parlamentar) é uma cota única mensal destinada a custear os gastos dos deputados exclusivamente vinculados ao exercício da atividade parlamentar. Exemplos de despesa desse tipo são: passagens aéreas, telefonia, serviços postais, manutenção de escritórios de apoio à atividade parlamentar, assinatura de publicações, fornecimento de alimentação ao parlamentar, hospedagem, outras despesas com locomoção, contemplando locação ou fretamento de aeronaves, veículos automotores e embarcações, serviços de táxi, pedágio e estacionamento e passagens terrestres. EX:
sample_n(data, 5)## # A tibble: 5 x 13
## nomeParlamentar idCadastro sgUF sgPartido tipoDespesa especDespesa
## <chr> <int> <chr> <chr> <chr> <chr>
## 1 RONALDO CARLET… 178861 BA PP Emissão Bi… <NA>
## 2 LEÔNIDAS CRIST… 74299 CE PDT COMBUSTÍVE… Veículos Au…
## 3 FERNANDO COELH… 141431 PE PSB COMBUSTÍVE… Veículos Au…
## 4 PAULO TEIXEIRA 141488 SP PT COMBUSTÍVE… Veículos Au…
## 5 MARCOS ABRÃO 178880 GO PPS Emissão Bi… <NA>
## # ... with 7 more variables: fornecedor <chr>, CNPJCPF <chr>,
## # tipoDocumento <int>, dataEmissao <dttm>, valorDocumento <dbl>,
## # valorGlosa <int>, valorLíquido <dbl>
Para uma melhor descrição dos tipos dos dados:
sapply(data, class)## $nomeParlamentar
## [1] "character"
##
## $idCadastro
## [1] "integer"
##
## $sgUF
## [1] "character"
##
## $sgPartido
## [1] "character"
##
## $tipoDespesa
## [1] "character"
##
## $especDespesa
## [1] "character"
##
## $fornecedor
## [1] "character"
##
## $CNPJCPF
## [1] "character"
##
## $tipoDocumento
## [1] "integer"
##
## $dataEmissao
## [1] "POSIXct" "POSIXt"
##
## $valorDocumento
## [1] "numeric"
##
## $valorGlosa
## [1] "integer"
##
## $valorLíquido
## [1] "numeric"
E o segundo conjunto de dados consiste em informações do limite mensal de uso do CEAP no estado, para cada um dos estados e Distrito Federal. EX:
sample_n(limit, 5)## UF limite_mensal
## 13 MT 39428.03
## 24 SC 39877.78
## 1 AC 44632.46
## 11 MG 36092.71
## 10 MA 42151.69
Para uma melhor descrição dos tipos dos dados:
sapply(limit, class)## UF limite_mensal
## "factor" "numeric"
Para melhor aproveitamento de ambos os datasets para que se possa usar os dados de limite de uso de CEAP estadual junto ao gasto mensal do parlamentar será feito um join dos dois datasets com base na coluna de estado.
# Join two datasets by UF column to use state ceap spending limit.
colnames(data)[3] <- "UF"
data = data %>%
full_join(limit, by=c("UF", "UF"))Questionamentos
1 - Qual a distribuição dos gastos durante a semana ? Existem gastos durante os finais de semana ?
Resposta suposta:
A resposta que eu supponho que sim, existem gastos nos finais de semana, e suponho também que eles sejam bem altos.
spend_per_day <- data %>%
mutate(dia = wday(as.Date(dataEmissao), label = TRUE)) %>%
filter(!is.na(dia)) %>%
group_by(dia) %>%
summarise(gastos = sum(valorDocumento))
p1 <- spend_per_day %>%
ggplot(aes(x = reorder(dia, gastos), y = gastos, text = paste(gastos))) +
labs(x='Dia da semana', y='Gasto total') +
geom_col(width = 0.7) +
coord_flip()
ggplotly(p1)2 - Quais são os partidos campeôes de gastos em cada estado ?
Resposta suposta:
Tomando por exemplo o estádo da paraíba, suponho que seja o PMDB, pois é o que tem o maior número de representantes.
greatest_of_state <- data %>%
group_by(UF, sgPartido) %>%
summarise(gastos = sum(valorDocumento)) %>%
group_by(UF) %>%
top_n(1, gastos)
p2 <- greatest_of_state %>%
filter(!is.na(UF)) %>%
ggplot(aes(x = reorder(UF, gastos), y = gastos, text = paste(sgPartido))) +
labs(x='Estado', y='Gasto total') +
geom_point()
ggplotly(p2)