A princípio esse markdown é uma continuação desse aqui: Análise de gastos dos parlamentares, que demostra algumas análises descritivas dos dados da CEAP. Dessa forma, o objetivo da parte 2 é trazer novos questionamentos desses dados e analisá-los descritivamente.
Importando os dados:
dadosCEAP = read_csv(("../data/dadosCEAP.csv"))
Antes de começar com perguntas, iremos preparar os dados para o que iremos precisar:
dadosCEAP <- dadosCEAP %>%
mutate(
regiao = case_when(
sgUF %in% c("RJ", "SP", "ES", "MG") ~ "Sudeste",
sgUF %in% c("PB", "RN", "SE", "BA", "MA", "PE", "AL", "CE", "PI") ~ "Nordeste",
sgUF %in% c("GO", "MT", "MS", "DF") ~ "Centro-Oeste",
sgUF %in% c("RS", "PR", "SC") ~ "Sul",
sgUF %in% c("PA", "AC", "AM", "RO", "RR", "AP", "TO") ~ "Norte"
)
)
dadosCEAP <- dadosCEAP %>%
mutate(
dia = day(dataEmissao),
mes = month(dataEmissao),
ano = year(dataEmissao))
dadosCEAP <- dadosCEAP %>%
mutate(data = paste(ano, mes, dia, sep='-') %>%
as.Date(.))
dadosCEAP$diaSemana <- weekdays(as.Date(dadosCEAP$data))
dadosCEAP <- dadosCEAP %>%
mutate(fds = ifelse(diaSemana %in% c("sábado","domingo"),TRUE,FALSE))
Depois da separação dos estados em regiões(Norte, Nordeste, Sul, Sudeste e Centro Oeste) e da extração das datas do horário de emissão, vamos as perguntas:
dadosCEAP %>%
group_by(tipoDespesa,
regiao) %>%
summarise(valorTot = sum(valorLíquido)) %>%
ggplot(aes(y = valorTot,
x = regiao,
fill = tipoDespesa)) +
geom_col(position = position_identity()) +
labs(x = "Região brasileira",
y = "Total gasto (R$)") +
coord_flip()
Como podemos observar no gráfico acima, os tipos de despesas de cada região do Brasil:
Ao elencar os tópicos acima, podemos ver que regiões como Sul e Sudeste tiveram comportamentos semelhantes com os tipos de despesa, ao gastar com fornecimento de alimentação, manutenção de escritório e telefonia. Já as demais regiões, Norte, Nordeste e Centro Oeste tiveram como top 3 com divulgação de atividade parlamentar, fornecimento de alimentação e serviços de telefonia.
É válido ressaltar, assim como foi feito no markdown parte 1, que a proporção de parlamentares de cada região do Brasil é diferente, por exemplo, a região Sudeste tem a maior concentração de parlamentares e com isso, consequentemente, os gastos naturalmente tendem a serem maiores.
dadosCEAP %>%
filter(fds == TRUE) %>%
group_by(tipoDespesa,
sgPartido) %>%
summarise(valorTot = sum(valorLíquido)) %>%
arrange(-valorTot) %>%
plot_ly(x = ~valorTot,
y = ~tipoDespesa,
color = ~sgPartido,
type = 'scatter',
text = ~paste('Total gasto (R$): ', valorTot,
'<br>Tipo de despesa: ', tipoDespesa,
'<br>Partido: ', sgPartido)) %>%
layout(title = "Tipos de gastos da CEAP de cada partido",
xaxis = list(title = "Total gasto (R$)"),
yaxis = list(title = "Tipo de despesa"))
A visualização acima, podemos observar que os maiores gastos dos finais de semana foram com:
Os valores acima foram retirados dos 3 maiores gastos, mas fato curioso é que o PT é o partido que lidera nas 3 categorias. Além disso, podemos ver também que na maioria dos tipos de despesas os partidos que mais gastam são PT, PP, PSDB, PMDB.
Obs.: Em nossa base de dados o úlitmo Natal registrado foi de 2016 e Reveillon de 2017.
dadosCEAP %>%
filter(data == "2016-12-25") %>%
group_by(nomeParlamentar,
tipoDespesa) %>%
summarise(valorTot = sum(valorLíquido)) %>%
arrange(-valorTot) %>%
ungroup() %>%
slice(1:10)
dadosCEAP %>%
filter(data == "2017-01-01") %>%
group_by(nomeParlamentar,
tipoDespesa) %>%
summarise(valorTot = sum(valorLíquido)) %>%
arrange(-valorTot) %>%
ungroup() %>%
slice(1:10) %>%
ggplot(aes(x = reorder(nomeParlamentar, -valorTot),
y = valorTot,
color = tipoDespesa)) +
geom_point() +
geom_segment(aes(x = reorder(nomeParlamentar, -valorTot),
xend = reorder(nomeParlamentar, -valorTot),
y = 0,
yend = valorTot)) +
coord_flip() +
labs(title = "Top 10 dos parlamentares que gastaram no Reveillon de 2017",
x = "Nome do parlamentar",
y = "Total gasto (R$)")
É interessante observar que em datas que teoricamente não possuem atividades trabalhistas, pois são feriados, há registros de emissão de notas fiscais. Elenquei os 10 parlamentares que tiveram a maior soma de gastos e é legal observar que os tipos de despesas são bem atípicas, como locação ou freteamento de veículos automotores, divulgação de atividade parlamentar, serviço de táxi/pedágio ou estacionamento e manutenção de escritório. Agora fica o questionamento, será que esse dinheiro foi gasto corretamente ou podemos dar o selo de turistas, panfleteiro, telefonista ou de vou de táxi? Quem quiser saber dos canditados e seus respectivos gastos e selos que ganham, acessem o vidinha de balada.