#dependencias = c("dplyr", "ggplot2", "GGally", "readr", "plotly")
#devtools::install_github("ropensci/plotly")
#install.packages(dependencias)

library(dplyr, warn.conflicts = FALSE)
library(ggplot2)
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:graphics':
## 
##     layout

Discplina de Análise de Dados 1- Ciência da Computação UFCG - 2016.1

#(Pergunta 1) Dando um foco no nosso estado (Paraíba), quais fornecedores mais se destacam aqui no nosso estado, essas empresas são realmente daqui? Se sim, qual a relação entre nossos deputados e esses fornecedores?
#(Pergunta 2) Analisando o gasto dos deputados com passagens aéreas, é esperado que esses gastos tenha uma correlação com o estado de origem do deputado, isso realmente existe? Existem outliers nesses gastos, se sim, como podemos entendê-los?
deputados.pb <- dados %>%
  filter(sgUF == "PB") %>%
  select(txNomeParlamentar, sgPartido) %>%
  distinct()

#filtrando os deputados da paraiba
deputados.pb <- c("AGUINALDO RIBEIRO", "BENJAMIN MARANHÃO", "DAMIÃO FELICIANO", "EFRAIM FILHO", "HUGO MOTTA", "LUIZ COUTO", "MANOEL JUNIOR", "MARCONDES GADELHA", "PEDRO CUNHA LIMA", "RÔMULO GOUVEIA", "VENEZIANO VITAL DO RÊGO", "WELLINGTON ROBERTO", "WILSON FILHO")

fornecedores.deputados.pb <- dados %>%
  filter(txNomeParlamentar %in% deputados.pb ) %>%
  select(txNomeParlamentar, txtCNPJCPF, txtFornecedor, txtDescricao, vlrDocumento) %>%
  mutate(txtCNPJCPF = as.factor(txtCNPJCPF)) %>%
  group_by(txNomeParlamentar, txtCNPJCPF, txtFornecedor, txtDescricao) %>%
  summarise(valor.total = sum(vlrDocumento))
fornecedores.hugo.motta <- fornecedores.deputados.pb %>%
  filter(txNomeParlamentar == "HUGO MOTTA") %>%
  select(txtCNPJCPF, txtFornecedor, txtDescricao, valor.total) %>%
  group_by(txtFornecedor, txtDescricao) %>%
  summarise(valor.total = sum(valor.total))
## Adding missing grouping variables: `txNomeParlamentar`
ggplot(data=fornecedores.hugo.motta, aes(x=reorder(txtFornecedor, valor.total), y=valor.total)) + 
  geom_bar(stat="identity") +
  coord_flip() +
  labs(title="Fornecedores Deputado Hugo Motta", x="Fornecedor", y="Total")

plot_ly(data = fornecedores.hugo.motta, x = valor.total, y = txtFornecedor, mode = "markers", color = txtDescricao)
## Warning in (scales::col_factor(colors, levels = lvls, na.color =
## "transparent"))(lvls): Some values were outside the color scale and will be
## treated as NA
## Warning in mapply(FUN = f, ..., SIMPLIFY = FALSE): argumento longo não é
## múltiplo do comprimento do curto
cia.aereas <- c("Cia Aérea - TAM", "Avianca", "Azul Linhas Aéreas", "Cia Aérea - AVIANCA", "Cia Aérea - AZUL","Cia Aérea - GOL", "GOL - LINHAS AÉREAS INTELIGENTES", "GOL - LINHAS AÉREAS S/A", "Cia Aérea - TAM", "TAM LINAS AÉREAS S.A", "Tam Linhas Aéreas")

gastos.passagens.aereas <- fornecedores.deputados.pb %>%
  filter(txtFornecedor %in% cia.aereas) %>%
  group_by(txNomeParlamentar) %>%
  summarise(valor.total = sum(valor.total))



ranking.gastos <- plot_ly(gastos.passagens.aereas,
  x = reorder(txNomeParlamentar, valor.total),
  y = valor.total,
  name = "Gastos Passagens Aéreas",
  type = "bar")

ranking.gastos

O ranking acima nos mostra o valor total dos gastos dos deputados com passagens aéreas.

Companhias aéreas que mais lucram com os deputados paraibanos.

gastos.passagens.aereas.empresas <- fornecedores.deputados.pb %>%
  filter(txtFornecedor %in% cia.aereas) %>%
  group_by(txNomeParlamentar, txtFornecedor) %>%
  summarise(valor.total = sum(valor.total))

cia.tam <- c("Cia Aérea - TAM", "TAM LINAS AÉREAS S.A", "Tam Linhas Aéreas")
tam <- gastos.passagens.aereas.empresas %>%
  filter(txtFornecedor %in% cia.tam)

p <- plot_ly(tam,
  x = txNomeParlamentar,
  y = reorder(valor.total, valor.total),
  name = "Tam",
  type = "bar")

cia.avianca <- c("Avianca","Cia Aérea - AVIANCA")
avianca <- gastos.passagens.aereas.empresas %>%
  filter(txtFornecedor %in% cia.avianca)

p2 <- add_trace(
  avianca,
  x = txNomeParlamentar,
  y = valor.total,
  name = "Avianca",
  type = "bar")

cia.azul <- c("Azul Linhas Aéreas","Cia Aérea - AZUL")
azul <- gastos.passagens.aereas.empresas %>%
  filter(txtFornecedor %in% cia.azul)

p3 <- add_trace(
  azul,
  x = txNomeParlamentar,
  y = valor.total,
  name = "Azul",
  type = "bar")

cia.gol <- c("Cia Aérea - GOL", "GOL - LINHAS AÉREAS INTELIGENTES", "GOL - LINHAS AÉREAS S/A")
gol <- gastos.passagens.aereas.empresas %>%
  filter(txtFornecedor %in% cia.gol)

p4 <- add_trace(
  gol,
  x = txNomeParlamentar,
  y = valor.total,
  name = "Gol",
  type = "bar")

p5 <- layout(p4, barmode = "stack")
  

p5

No gráfico acima temos a distribuição dos gastos dos deputados paraibanos de acordo com as companhias aéreas.