Após a análise: “Análise da Cota para Exercício da Atividade Parlamentar (CEAP)”(http://rpubs.com/adbys/325534) surgem alguns questionamentos extras.
Uma dúvida que surge é qual a região do país que mais gasta os recursos da CEAP. Para responder essa pegunta utilizamos um gráfico de pizza.
totalGasto <- gastos %>% filter(sgUF != "NA", valorDocumento > 0, valorLíquido > 0) %>% summarise(GastoTotal = sum(valorLíquido))
gastosPorRegiao <- gastos %>% filter(sgUF != "NA", valorDocumento > 0, valorLíquido > 0) %>% mutate(Regiao = ifelse(sgUF == 'PB' | sgUF == 'PE' | sgUF == 'RN' | sgUF == 'CE' | sgUF == 'PI' | sgUF == 'BA' | sgUF == 'MA' | sgUF == 'SE' | sgUF == 'AL', 'NE', ifelse(sgUF == 'ES' | sgUF == 'RJ' | sgUF == 'MG' | sgUF == 'SP', 'SE', ifelse(sgUF == 'RS' | sgUF == 'PR' | sgUF == 'SC', 'S', ifelse(sgUF == 'MS' | sgUF == 'GO' | sgUF == 'MT' | sgUF == 'DF', 'CO', ifelse(sgUF == 'RO' | sgUF == 'AC' | sgUF == 'PA' | sgUF == 'AM' | sgUF == 'RR' | sgUF == 'AP' | sgUF == 'TO', 'N', 'NA')))))) %>% group_by(Regiao) %>% summarise(Gastos = (sum(valorLíquido)/totalGasto$GastoTotal) * 100) %>% arrange(Gastos)
regiaolbls <- gastosPorRegiao$Regiao
regiaolbls <- paste(regiaolbls, round(gastosPorRegiao$Gastos, 2))
regiaolbls <- paste(regiaolbls,"%",sep="")
pie(gastosPorRegiao$Gastos, labels = regiaolbls, main = "Percentual de gastos da CEAP por região")
Pelo gráfico de pizza percebemos que a região Nordeste é a segunda região que mais utiliza os recursos da CEAP. Um fato curioso é que a primeira região que mais utiliza os recursos da CEAP é o sudeste. Para se ter uma ideia do tamanho dos gastos da região sudeste podemos fazer o comparativo com a região nordeste. Enquanto a região sudeste possui quatro estados, a região nordeste possui 9. Somando os gastos da região Sul que possui três estados e Norte que possui sete não é capaz de passar do gasto total dos parlamentares da região sudeste.
Outra pergunta pertinente é se os gastos por categoria dos parlamentares do estado da Paraíba seguem um padrão de gastos. Agrupamos todos os gastos dos representantes do estado da Paraíba e traçamos um Boxplot.
formaDeUsoPorCategoria <- gastos %>% group_by(TipoDespesa = tipoDespesa) %>% filter(sgUF == "PB", valorDocumento > 0, valorLíquido > 0)
ggplot(formaDeUsoPorCategoria, aes(x = "", y = valorLíquido, fill=TipoDespesa)) + geom_boxplot()+ labs(title = "Distribuição dos gastos da CEAP no Estado da Paraíba", x = "Tipo de Gasto", y = "Gasto(R$)") + coord_cartesian(ylim = c(0, 30000)) + theme(legend.text = element_text(size=6))
Para o Boxplot acima percebemos muitos outliers como também algumas categorias que os gastos nao seguem um padrão. Para os gastos seguirem um padrão temos que a caixa do Bloxplot deve ser simétrica e que cada uma de suas metades não tenham uma grande extensão. A categoria LOCAÇÃO OU FRETAMENTO DE AERONAVES foi a que teve um padrão melhor definido.
Por fim vamos analisar se existe algum parlamentar paraibano que está gastando mais que seus conterrâneos. Traçamos um grafico de pizza onde cada parte corresponde ao percentual gasto por cada parlamentar.
totalGastoParaiba <- gastos %>% filter(sgUF == "PB", valorDocumento > 0, valorLíquido > 0) %>% summarise(GastoTotal = sum(valorLíquido))
porcentagemGastaPorParlamentar <- gastos %>% group_by(Parlamentar = nomeParlamentar) %>% filter(sgUF == "PB", valorDocumento > 0, valorLíquido > 0) %>% summarise(Gastos = ((sum(valorLíquido)/totalGastoParaiba$GastoTotal)) * 100) %>% arrange(Gastos)
lbls <- tail(porcentagemGastaPorParlamentar$Parlamentar, n=14)
lbls <- paste(lbls, round(tail(porcentagemGastaPorParlamentar$Gastos, n=14), 2))
lbls <- paste(lbls,"%",sep="")
pie(tail(porcentagemGastaPorParlamentar$Gastos, n=14), labels = lbls, cex=0.7)
Percebemos que os parlamentares que mais gastam seguem uma média. Vemos que dez parlamentares gastaram na faixa de 9.63% a 7.12% do dinheiro total gasto pelo estado. Desta forma não foi identificado nenhum outlier.