A princípio esse markdown é uma continuação desse aqui: Análise de gastos dos parlamentares, que demostra algumas análises descritivas dos dados da CEAP. Dessa forma, o objetivo da parte 2 é trazer novos questionamentos desses dados e analisá-los descritivamente.

Importando os dados:

dadosCEAP = read_csv(("../data/dadosCEAP.csv"))

Antes de começar com perguntas, iremos preparar os dados para o que iremos precisar:

  1. Separar os estados brasileiros em suas respectivas regiões
dadosCEAP <- dadosCEAP %>% 
  mutate(
    regiao = case_when(
      sgUF %in% c("RJ", "SP", "ES", "MG") ~ "Sudeste",
      sgUF %in% c("PB", "RN", "SE", "BA", "MA", "PE", "AL", "CE", "PI") ~ "Nordeste",
      sgUF %in% c("GO", "MT", "MS", "DF") ~ "Centro-Oeste",
      sgUF %in% c("RS", "PR", "SC") ~ "Sul",
      sgUF %in% c("PA", "AC", "AM", "RO", "RR", "AP", "TO") ~ "Norte"
    )
  )
  1. Extrair só a data do parâmentro data de emissão e verificar os finais de semana:
dadosCEAP <- dadosCEAP %>% 
  mutate(
    dia = day(dataEmissao),
    mes = month(dataEmissao),
    ano = year(dataEmissao))

dadosCEAP <- dadosCEAP %>% 
  mutate(data = paste(ano, mes, dia, sep='-') %>% 
           as.Date(.))

dadosCEAP$diaSemana <- weekdays(as.Date(dadosCEAP$data))

dadosCEAP <- dadosCEAP %>%
  mutate(fds = ifelse(diaSemana %in% c("sábado","domingo"),TRUE,FALSE))

Depois da separação dos estados em regiões(Norte, Nordeste, Sul, Sudeste e Centro Oeste) e da extração das datas do horário de emissão, vamos as perguntas:

Com relação aos gastos de cada região, podemos observar se há alguma similaridade ou padrão com tipos de despesas e esses gastos?

dadosCEAP %>% 
  group_by(tipoDespesa,
           regiao) %>% 
  summarise(valorTot = sum(valorLíquido)) %>% 
  ggplot(aes(y = valorTot,
             x = regiao,
             fill = tipoDespesa)) +
  geom_col(position = position_identity()) +
  labs(x = "Região brasileira",
       y = "Total gasto (R$)") +
  coord_flip()

Como podemos observar no gráfico acima, os tipos de despesas de cada região do Brasil:

  • Fornecimento de alimentação do parlamentar;
  • Divulgação de atividade do parlamentar;
  • Manutenção de escritório de apoio à atividade parlamentar;
  • Telefonia.

Ao elencar os tópicos acima, podemos ver que regiões como Sul e Sudeste tiveram comportamentos semelhantes com os tipos de despesa, ao gastar com fornecimento de alimentação, manutenção de escritório e telefonia. Já as demais regiões, Norte, Nordeste e Centro Oeste tiveram como top 3 com divulgação de atividade parlamentar, fornecimento de alimentação e serviços de telefonia.

É válido ressaltar, assim como foi feito no markdown parte 1, que a proporção de parlamentares de cada região do Brasil é diferente, por exemplo, a região Sudeste tem a maior concentração de parlamentares e com isso, consequentemente, os gastos naturalmente tendem a serem maiores.

Com os dados da CEAP podemos ver a data de emissão do respectivo documento. Dessa forma, quanto e como gastam os partidos em finais de semana?

dadosCEAP %>%
  filter(fds == TRUE) %>% 
  group_by(tipoDespesa,
           sgPartido) %>% 
  summarise(valorTot = sum(valorLíquido)) %>% 
  arrange(-valorTot) %>%
  plot_ly(x = ~valorTot,
          y = ~tipoDespesa,
          color = ~sgPartido,
          type = 'scatter',
          text = ~paste('Total gasto (R$): ', valorTot,
                        '<br>Tipo de despesa: ', tipoDespesa,
                        '<br>Partido: ', sgPartido)) %>% 
  layout(title = "Tipos de gastos da CEAP de cada partido",
         xaxis = list(title = "Total gasto (R$)"),
         yaxis = list(title = "Tipo de despesa"))

A visualização acima, podemos observar que os maiores gastos dos finais de semana foram com:

  • Combustível: R$ 1.017.093,51;
  • Manutenção de escritório de apoio à atividade parlamentar: R$ 880.633,47;
  • Telefonia: R$ 754.069,51.

Os valores acima foram retirados dos 3 maiores gastos, mas fato curioso é que o PT é o partido que lidera nas 3 categorias. Além disso, podemos ver também que na maioria dos tipos de despesas os partidos que mais gastam são PT, PP, PSDB, PMDB.

E ao observar os dados dos finais de semana, que por sinal são valores altos, que tal observar os dados último Natal e reveillon ?

Obs.: Em nossa base de dados o úlitmo Natal registrado foi de 2016 e Reveillon de 2017.

dadosCEAP %>% 
  filter(data == "2016-12-25") %>% 
  group_by(nomeParlamentar,
           tipoDespesa) %>% 
  summarise(valorTot = sum(valorLíquido)) %>% 
  arrange(-valorTot) %>% 
  ungroup() %>% 
  slice(1:10)
dadosCEAP %>% 
  filter(data == "2017-01-01") %>% 
  group_by(nomeParlamentar,
           tipoDespesa) %>% 
  summarise(valorTot = sum(valorLíquido)) %>% 
  arrange(-valorTot) %>% 
  ungroup() %>% 
  slice(1:10) %>% 
  ggplot(aes(x = reorder(nomeParlamentar, -valorTot),
             y = valorTot,
             color = tipoDespesa)) +
  geom_point() +
  geom_segment(aes(x = reorder(nomeParlamentar, -valorTot),
                   xend = reorder(nomeParlamentar, -valorTot),
                   y = 0,
                   yend = valorTot)) +
  coord_flip() +
  labs(title = "Top 10 dos parlamentares que gastaram no Reveillon de 2017",
       x = "Nome do parlamentar",
       y = "Total gasto (R$)")

É interessante observar que em datas que teoricamente não possuem atividades trabalhistas, pois são feriados, há registros de emissão de notas fiscais. Elenquei os 10 parlamentares que tiveram a maior soma de gastos e é legal observar que os tipos de despesas são bem atípicas, como locação ou freteamento de veículos automotores, divulgação de atividade parlamentar, serviço de táxi/pedágio ou estacionamento e manutenção de escritório. Agora fica o questionamento, será que esse dinheiro foi gasto corretamente ou podemos dar o selo de turistas, panfleteiro, telefonista ou de vou de táxi? Quem quiser saber dos canditados e seus respectivos gastos e selos que ganham, acessem o vidinha de balada.