#install.packages("dplyr")
#install.packages("ggplot2")
#installed.packages("scales")
library(dplyr, warn.conflicts = FALSE)
library(ggplot2)
library(scales)
theme_set(theme_bw())
Para ajudar com nosso entendimento sobre os dados, temos uma explicaĂ§Ă£o do que significa cada variĂ¡vel.
summary(data$numAno)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2016 2016 2016 2016 2016 2016
summary(data$numMes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000 2.000 3.000 3.297 4.000 7.000
Os dados utilizados nessa anĂ¡lise sĂ£o de 2016 atĂ© o mĂªs de julho.
No grĂ¡fico de barras 1 vemos a quantidade de deputados por partido. O partido que tem mais representatividade da CĂ¢mara Federal Ă© o PMDB com 78 deputados, seguido pelo PT 67 os partidos que tem menos representatividade sĂ£o PRP e PRTB.
#quantidade de gastos por partido
gastos.por.partido <- data %>%
filter(vlrDocumento>0 & vlrLiquido>0) %>%
select(sgPartido, txNomeParlamentar, vlrDocumento) %>%
distinct() %>%
group_by(sgPartido) %>%
summarise(total = sum(vlrDocumento))
#plotanto quantidade de gastos por partido
hist.gastos.por.partido <- ggplot(data=gastos.por.partido, aes(x=reorder(sgPartido, total), y=total)) +
geom_bar(stat="identity") +
coord_flip() +
labs(title="Quantidade de Gastos por partido", x="Partido", y="Total")
hist.gastos.por.partido
No grĂ¡fico de barras 2 vemos a distribuiĂ§Ă£o de gastos por partido, ou seja, o total de gasto somados de todos os deputados daquele partido. Esse valores sĂ£o a soma dos valores totais dos documentos emitidos nas prestações de contas.
Quando comparamos o histograma 1 com o 2, concluĂmos o que jĂ¡ Ă© esperado. Quanto mais deputados, mais gastos determinado partido tem. Os grĂ¡ficos nĂ£o sĂ£o absolutamente idĂªnticos, algumas mudanças ocorrem como por exemplo o PCdoB Ă© o 14º partido com mais deputados, porĂ©m na escala de gastos ele sobe para 12º.
#vendo os tipos de gastos
tiposGastos <- unique(data$txtDescricao)
#agrupando por gastos e vendo os valores dos gastos
gasto.por.tipo <- data %>%
group_by(txtDescricao) %>%
summarise(valor.total = sum(vlrDocumento))
#plotando histograma ordenado por valores totais dos gastos
histograma1 <- ggplot(data=gasto.por.tipo, aes(x=reorder(txtDescricao, valor.total), y=valor.total)) +
geom_bar(stat = "identity") +
coord_flip() +
labs(title = "Panorama geral - Gastos deputados federais", x = "Nome do gasto", y = "Valor total")
histograma1
O histograma acima nos mostra um panorama geral dos gastos dos deputados de acordo com o seu valor total. Observamos que o maior gasto que nossos deputados realizam Ă© com DivulgaĂ§Ă£o de atividades parlamentares e o menor gasto foi com LocaĂ§Ă£o ou fretamento de embarcações.
media.gastos.por.partido <- data %>%
filter(sgPartido != "NA" & vlrDocumento>0 & vlrLiquido>0) %>%
group_by(sgPartido) %>%
summarise(media.gastos = mean(vlrDocumento))
grafico.media.gastos.por.partido <- ggplot(data=media.gastos.por.partido, aes(x=reorder(sgPartido, media.gastos), y=media.gastos)) +
geom_jitter(stat="identity") +
labs(title = "Media dos gastos deputados federais", x = "Partido", y = "Valor total")
grafico.media.gastos.por.partido
No grĂ¡fico acima podemos ver a mĂ©dia de gastos por partido. Obsevamos que os partidos se matĂ©m numa faixa de valores aparentemente prĂ³xima. Temos um ponto atĂpico nesse grĂ¡fico, o partido PRP apresenta-se com sua mĂ©dia de gastos bastante diferente dos demais partidos, isso acontece devido ao nĂºmero de parlamentares desse partido ser baixo mais precisamente apenas um deputado, com isso, a mĂ©dia de gastos fica concentrada em apenas um ponto, elevando assim seu valor.
Seguindo nossa anĂ¡lise, vamos ver quais o deputados que gastaram mais em 2016.
deputados.que.mais.gastam <- data %>%
group_by(txNomeParlamentar) %>%
summarise(valor.total = sum(vlrDocumento)) %>%
arrange(desc(valor.total))
deputados.que.mais.gastam %>%
head()
## Source: local data frame [6 x 2]
##
## txNomeParlamentar valor.total
## <fctr> <dbl>
## 1 FRANCISCO CHAPADINHA 440522.9
## 2 BETINHO GOMES 268539.2
## 3 DOMINGOS NETO 267290.0
## 4 GIOVANI CHERINI 266232.2
## 5 HIRAN GONÇALVES 264641.5
## 6 ODORICO MONTEIRO 261916.0
ggplot(deputados.que.mais.gastam, aes(x = "deputados", y = valor.total)) +
geom_boxplot() +
scale_y_continuous(labels = comma) +
ggtitle("Gasto dos deputados")
No boxplot acima mostra a relaĂ§Ă£o dos deputados que mais gastam. Temos um outlier (esse ponto extremo acima) Ă© o gasto do deputado Francisco Chapadinha, que se encontra bem acima da mediana de gastos dos outros deputados.
Como mostrado no boxplot acima, o deputado que mais tem gastado em 2016 Ă© o Francisco Chapadinha do PTN-PA. No grĂ¡fico abaixo temos uma melhor visĂ£o de como o excelentĂssimo deputado realiza seus gastos.
gastos.francisco.chapadinha <- data %>%
filter(txNomeParlamentar == "FRANCISCO CHAPADINHA") %>%
group_by(txtDescricao) %>%
summarise(valor.total = sum(vlrDocumento))
ggplot(gastos.francisco.chapadinha, aes(x=reorder(txtDescricao, valor.total), y=valor.total))+
geom_bar(stat="identity") +
coord_flip() +
labs(title = "Gastos do Deputado Francisco Chapadinha PTN_PA", x = "Nome do gasto", y = "Valor total")