Curso: Tecnólogo em Ciência de Dados
Matéria: Introdução a Ciência de dados
Lecionador: Dr. Ricardo Alves de Olinda
faculdade: Universidade Estadual da Paraíba(UEPB)

Introdução

A elaboração deste relatório representa uma imersão na plataforma do R Studio, utilizando a extensão Rmarkdown como ferramenta principal. Durante o processo de criação, a aplicação de técnicas e conhecimentos adquiridos em aulas especializadas sobre o uso do Rmarkdown foi uma constante. Destaco aqui a relevância das instruções ministradas pelo Dr. Ricardo Alves de Olinda, docente do Curso Tecnólogo de Ciência de Dados na UEPB. As bases sólidas fornecidas por suas aulas contribuíram significativamente para a qualidade deste trabalho, sendo complementadas por recursos provenientes de vídeo aulas disponíveis no YouTube e referências de sites especializados em análise de dados.

O propósito central deste documento é apresentar os resultados de uma análise dos dados fornecidos pela Câmara dos Deputados, focando no uso da Cota para o Exercício da Atividade Parlamentar (CEAP), tanto em âmbito nacional quanto, mais especificamente, no estado da Paraíba. O intuito é investigar os expressivos gastos dos deputados federais e compreender como a CEAP é utilizada. Este relatório oferecerá insights sobre os partidos e deputados que mais oneram os cofres públicos, assim como aqueles que demonstram uma gestão mais comedida dos recursos disponíveis. A análise será suportada por tabelas e gráficos, visando proporcionar uma compreensão acessível e clara dessas informações.

A estrutura deste relatório não busca somente a exposição de dados brutos, empenha-se ativamente em proporcionar uma contextualização, com o propósito não apenas de facilitar a compreensão do leitor, mas também de instigá-lo a reflexões diante desses dados impactantes. Cada seção foi cuidadosamente elaborada, para ser um relatório que conduz o leitor por uma análise lógica e abrangente. O objetivo é fornecer insights valiosos que não se limitam à superficialidade dos números, mas que exploram à distribuição e utilização das cotas parlamentares. Em última análise, o relatório busca não apenas informar, mas instigar uma reflexão engajada sobre o papel e a responsabilidade dos representantes parlamentares em relação aos recursos públicos.

Material e Métodos

Materiais Utilizados:

O material usado no relatório foi disponibiizado no site oficial da câmara dos deputados, disponível nesse LINK em vários formatos, com indentificações e especificações de ações que se utilizam da CEAP de cada Deputado. Esse relatório foi codificado inteiramente no R studio, na extensão Rmarkdown, onde foi utilizada todas as técnicas e materiais repassados nas aulas referente ao conteúdo de Rmarkdown.

Métodos Utilizados:

Os dados foram submetidos a um processo de limpeza para remover valores ausentes e inconsistências. Em seguida, foram realizadas análises estatísticas utilizando funções de pacotes disponíveis no Rstudio para calcular somas, médias e outras métricas relevantes. Gráficos foram gerados com outro pacote chamado ggplot2 para visualizar padrões e tendências nos dados, tendo como os seguintes pacotes R essenciais para a análise e visualização dos dados: readxl, dplyr, ggplot2 e kableExtra. Cada um com uma função diferente, o readxl para carregar o banco de dados, o dplyr para filtrar melhor os dados, o ggplot2 para criação de gráficos e o KableExtra para melhorar a estilização das tabelas.

Aplicação da Análise de Dados


Esta tabela abaixo apresenta os dados dos gastos dos Deputados referentes à CEAP (Cota para o Exercício da Atividade Parlamentar) em 2023, e desempenha um papel central e incial no relatório, fornecendo uma visão das despesas totais, promovendo certa transparência no uso dos recursos públicos. O destaque principal é o total das despesas até o momento em 2023, englobando todos os pagamentos realizados por meio da Cota Parlamentar. Essa informação é essencial para compreender o impacto financeiro dessa prática parlamentar, e permite contextualizar as despesas totais até o momento em 2023.

somatotal <- sum(dadosdeputados$GASTOS)

somatotal <- sprintf("R$ %.2f", somatotal)

somatotal <- data.frame(Categoria = "Total Gastos",
                                totalgastosem2023 = somatotal)

tabela <- kable(somatotal, format = "html", 
                align = "c", 
                col.names = c("Deputados", "Total de Gastos em 2023"),
                col.width = c("70%", "30%"), 
                escape = FALSE, 
                table.attr = "class='table table-striped table-bordered'", 
                caption.style = "text-align: center; font-size: 18px; font-weight: bold;", 
                row.names = FALSE) 

tabela
Deputados Total de Gastos em 2023
Total Gastos R$ 156224269.04

A análise desta outra tabela abaixo, que é mais detalhada e que apresenta a distribuição dos gastos da CEAP em 2023 revela pontos cruciais sobre a utilização dos recursos pelos deputados. Ao contrário da tabela que destaca o total de despesas( Tabela anterior), esta oferece insights específicos sobre as principais requisições e os valores associados, destacando áreas prioritárias como a divulgação da atividade parlamentar, passagens aéreas e aluguel de veículos. Levando em consideração esses dados é possível obter uma reflexão sobre a eficiência e responsabilidade na utilização desses recursos públicos em um país que necessita muito dos recursos públicos para funcionar.

Essa análise entre diferentes categorias de gastos nos fornece uma compreensão aprofundada da distribuição proporcional dos recursos, identificando áreas que requerem maiores custos. A contextualização partidária adiciona complexidade ao entendimento, trazendo indagações sobre possíveis disparidades e influências externas. Esta tabela com essa abordagem contribui não apenas para uma visão mais completa do uso da CEAP pelos deputados, mas também para uma discussão informada sobre transparência, responsabilidade e as decisões que moldam o destino dos recursos públicos.

ondefoigasto <- dadosdeputados %>%
  group_by(DESCRIÇÃO) %>%
  summarize(gastostotais = sum(GASTOS))

ondefoigasto <- ondefoigasto %>%
  arrange(desc(gastostotais))


# COMO FORMATAR OS NÚMEROS PARA REAL MANUALMENTE, LEMBRE-SE, COM OUTROS PACOTES DEU CONFLITO!
ondefoigasto$gastostotais <- sprintf("R$ %.2f", ondefoigasto$gastostotais)

tabela <- kable(ondefoigasto, format = "html", 
                align = "c", 
                col.names = c("ONDE FOI GASTO", "TOTAL DE GASTOS ATÉ O MOMENTO EM 2023"),
                col.width = c("70%", "30%"), 
                escape = FALSE, 
                table.attr = "class='table table-striped table-bordered'", 
                caption.style = "text-align: center; font-size: 18px; font-weight: bold;", 
                row.names = FALSE) 

tabela
ONDE FOI GASTO TOTAL DE GASTOS ATÉ O MOMENTO EM 2023
DIVULGAÇÃO DA ATIVIDADE PARLAMENTAR. R$ 53610817.49
PASSAGEM AÉREA - SIGEPA R$ 32783456.53
LOCAÇÃO OU FRETAMENTO DE VEÍCULOS AUTOMOTORES R$ 25164548.58
MANUTENÇÃO DE ESCRITÓRIO DE APOIO À ATIVIDADE PARLAMENTAR R$ 19476523.15
COMBUSTÍVEIS E LUBRIFICANTES. R$ 13644708.99
HOSPEDAGEM ,EXCETO DO PARLAMENTAR NO DISTRITO FEDERAL. R$ 1782336.04
TELEFONIA R$ 1691796.84
CONSULTORIAS, PESQUISAS E TRABALHOS TÉCNICOS. R$ 1605153.67
PASSAGEM AÉREA - RPA R$ 1426955.77
LOCAÇÃO OU FRETAMENTO DE AERONAVES R$ 1204678.10
FORNECIMENTO DE ALIMENTAÇÃO DO PARLAMENTAR R$ 904207.86
SERVIÇO DE SEGURANÇA PRESTADO POR EMPRESA ESPECIALIZADA. R$ 883507.59
PASSAGEM AÉREA - REEMBOLSO R$ 847426.71
SERVIÇO DE TÁXI, PEDÁGIO E ESTACIONAMENTO R$ 682835.78
LOCAÇÃO OU FRETAMENTO DE EMBARCAÇÕES R$ 196830.00
SERVIÇOS POSTAIS R$ 102762.59
ASSINATURA DE PUBLICAÇÕES R$ 94121.24
PASSAGENS TERRESTRES, MARÍTIMAS OU FLUVIAIS R$ 78245.02
PARTICIPAÇÃO EM CURSO, PALESTRA OU EVENTO SIMILAR R$ 40351.61
AQUISIÇÃO DE TOKENS E CERTIFICADOS DIGITAIS R$ 3005.48

Ao olhar o gráfico abaixo, que apresenta os gastos dos principais partidos políticos do Brasil em 2023, temos uma representação visual esclarecedora das discrepâncias nos gastos parlamentares. Organizados de forma decrescente, os partidos são comparados quanto ao montante total gasto por seus integrantes, permitindo identificar claramente quais partidos estão liderando em termos de utilização da Cota para Exercício da Atividade Parlamentar, que tem como influência a quantidade de deputados eleitos por cada um dos partidos, trazendo uma relação no quesito gastos, pois quanto mais deputados daqueles partidos eleitos, mais gastos, não somente pela má gestão, mas também pela quantidade de deputados que fazem o uso da CEAP. Essa representação gráfica não apenas revela as diferenças absolutas nos gastos entre os partidos, mas também enfatiza a magnitude do impacto financeiro, apontando para uma possível necessidade de revisão nas práticas de utilização da CEAP, e das possíveis influências externas.

gastosdospartidos <- dadosdeputados %>%
  group_by(PARTIDO) %>%
  summarise(somadosgastos = sum(GASTOS, na.rm = TRUE)) %>%
  arrange(desc(somadosgastos))
ggplot(gastosdospartidos, aes(x = reorder(PARTIDO, -somadosgastos), y = somadosgastos)) +
  geom_bar(stat = "identity", fill = "red") +
  labs(title = "      PARTIDOS QUE MAIS GASTARAM ATÉ O MOMENTO EM 2023",
       x = " ",
       y = " ") +
  theme_classic() +
  theme(axis.text = element_text(angle = 45, hjust = 1)) +
  scale_y_continuous(labels = scales::comma)

Ao direcionar a atenção para o contexto estadual da Paraíba, o gráfico abaixo oferece uma perspectiva específica sobre a utilização da CEAP (Cota para Exercício da Atividade Parlamentar) pelos partidos políticos locais em 2023. Essa representação visual mostra os partidos que mais se beneficiaram da Cota no estado, proporcionando insights sobre o envolvimento de cada partido nesse mecanismo. A visualização facilita a identificação dos partidos que possuem maior número de integrantes utilizando a CEAP na Paraíba, promovendo uma análise mais abrangente das práticas de gastos parlamentares no âmbito estadual. Apesar desse gráfico mostrar o contexto da paraíba, os dados mostram um padrão no que se diz ao tamanho do gasto de alguns partidos, existe também uma relação com a quantidade de deputados eleitos por aquele partido, que alavancam os gastos, assim como no âmbito nacional.

  dadosdeputados %>%
  group_by(PARTIDO) %>%
  filter(UF == "PB") %>% 
  filter(GASTOS >= 0) %>% 
    summarise(gastosdaparaiba = sum(GASTOS)) %>%
      ggplot(aes(x = reorder(PARTIDO, -gastosdaparaiba), y = gastosdaparaiba))  + 
      geom_bar(stat = "identity", fill = "orange") +
        labs(title = "    GASTOS DOS PARTIDOS DA PB ATÉ O MOMENTO EM 2023",
             x = " ",
             y = " ") +
         theme_classic() +
         theme(axis.text = element_text(angle = 45, hjust = 1)) +
          scale_y_continuous(labels = scales::comma)

No gráfico subsequente relacionado a Paraíba, é viável examinar de forma detalhada os Deputados Federais Paraíbanos que mais utilizaram a CEAP (Cota para o Exercício da Atividade Parlamentar) ao longo de 2023. Essa representação visual direciona o olhar para os indivíduos, destacando aqueles que apresentam os maiores volumes de gastos através dessa cota. Tal abordagem permite uma análise mais personalizada e específica em relação aos representantes do estado da Paraíba, identificando aqueles que têm contribuído significativamente para as despesas parlamentares.

  dadosdeputados %>%
  group_by(DEPUTADO) %>%
  filter(UF == "PB") %>% 
  filter(GASTOS >= 0) %>% 
    summarise(gastosdepparaiba = sum(GASTOS)) %>%
      ggplot(aes(x = reorder(DEPUTADO, -gastosdepparaiba), y = gastosdepparaiba))  + 
      geom_bar(stat = "identity", fill = "blue") +
        labs(title = "  DEPUTADOS QUE USARAM A CEAP NA PB ATÉ O MOMENTO EM 2023",
             x = " ",
             y = " ") +
         theme_classic() +
         theme(axis.text = element_text(angle = 45, hjust = 1)) +
          scale_y_continuous(labels = scales::comma)

Conclusão

Ao concluir este relatório, é possível destacar a significativa contribuição das ferramentas e técnicas aprendidas no R Studio, com ênfase na extensão Rmarkdown, para a análise detalhada dos gastos parlamentares por meio da CEAP em 2023. A base sólida fornecida por instruções especializadas e recursos adicionais, como vídeo aulas e referências online, enriqueceram o processo de elaboração deste documento.

A análise dos dados da Câmara dos Deputados, tanto em nível nacional quanto no contexto específico da Paraíba, revelou insights valiosos sobre como os recursos públicos são gerenciados pelos deputados federais. A estrutura cuidadosamente elaborada deste relatório, com tabelas e gráficos claros, vai além da exposição de dados brutos, buscando instigar reflexões críticas sobre a transparência, responsabilidade e eficiência na utilização da CEAP.

A tabela inicial forneceu um panorama geral dos gastos, destacando o impacto financeiro da CEAP até o momento em 2023. Já a análise mais detalhada, expressa na segunda tabela, ofereceu uma visão granular sobre as principais requisições de gastos, proporcionando uma compreensão mais precisa da alocação desses recursos. A seguir, os gráficos contextualizaram esses dados, destacando os partidos que mais gastaram em âmbito nacional e estadual, assim como os deputados paraibanos que se destacaram no uso da Cota. Em última análise, este relatório não apenas informa sobre os gastos parlamentares, mas também busca desafiar e trazer ao leitor uma reflexão sobre o papel e a responsabilidade dos representantes parlamentares no manejo dos recursos públicos.

Referências

Grolemund, G., & Wickham, H. (2018). R para Ciência de Dados. Curso-R. Recuperado de https://livro.curso-r.com/13-1-r-b%C3%A1sico.html

Câmara dos Deputados. (s.d.). API de Dados Abertos da Câmara dos Deputados. Recuperado de https://dadosabertos.camara.leg.br/swagger/api.html#staticfile

Fernanda Peres. (s.d.). Canal de Fernanda Peres no YouTube. Recuperado de https://www.youtube.com/@FernandaPeres

Didática Tech. (s.d.). A Linguagem R. Recuperado de https://didatica.tech/a-linguagem-r/

Anexos

É possível visualizar os códigos através da opção show(mostrar) ao lado direito em todos os gráficos. Mas segue os códigos abaixo.


library(readxl)
library(dplyr)
library(ggplot2)
library(kableExtra)

dadosdeputados <- read_xlsx("Ano-2023.xlsx")




somatotal <- sum(dadosdeputados$GASTOS)

somatotal <- sprintf("R$ %.2f", somatotal)

somatotal <- data.frame(Categoria = "Total Gastos",
                                totalgastosem2023 = somatotal)

tabela <- kable(somatotal, format = "html", 
                align = "c", 
                col.names = c("Deputados", "Total de Gastos em 2023"),
                col.width = c("70%", "30%"), 
                escape = FALSE, 
                table.attr = "class='table table-striped table-bordered'", 
                caption.style = "text-align: center; font-size: 18px; font-weight: bold;", 
                row.names = FALSE) 

tabela




ondefoigasto <- dadosdeputados %>%
  group_by(DESCRIÇÃO) %>%
  summarize(gastostotais = sum(GASTOS))

ondefoigasto <- ondefoigasto %>%
  arrange(desc(gastostotais))


ondefoigasto$gastostotais <- sprintf("R$ %.2f", ondefoigasto$gastostotais)

tabela <- kable(ondefoigasto, format = "html", 
                align = "c", 
                col.names = c("ONDE FOI GASTO", "TOTAL DE GASTOS ATÉ O MOMENTO EM 2023"),
                col.width = c("70%", "30%"), 
                escape = FALSE, 
                table.attr = "class='table table-striped table-bordered'", 
                caption.style = "text-align: center; font-size: 18px; font-weight: bold;", 
                row.names = FALSE) 

tabela
gastosdospartidos <- dadosdeputados %>%
  group_by(PARTIDO) %>%
  summarise(somadosgastos = sum(GASTOS, na.rm = TRUE)) %>%
  arrange(desc(somadosgastos))
ggplot(gastosdospartidos, aes(x = reorder(PARTIDO, -somadosgastos), y = somadosgastos)) +
  geom_bar(stat = "identity", fill = "red") +
  labs(title = "      PARTIDOS QUE MAIS GASTARAM ATÉ O MOMENTO EM 2023",
       x = " ",
       y = " ") +
  theme_classic() +
  theme(axis.text = element_text(angle = 45, hjust = 1)) +
  scale_y_continuous(labels = scales::comma)
  

  dadosdeputados %>%
  group_by(PARTIDO) %>%
  filter(UF == "PB") %>% 
  filter(GASTOS >= 0) %>% 
    summarise(gastosdaparaiba = sum(GASTOS)) %>%
      ggplot(aes(x = reorder(PARTIDO, -gastosdaparaiba), y = gastosdaparaiba))  + 
      geom_bar(stat = "identity", fill = "orange") +
        labs(title = "    GASTOS DOS PARTIDOS DA PB ATÉ O MOMENTO EM 2023",
             x = " ",
             y = " ") +
         theme_classic() +
         theme(axis.text = element_text(angle = 45, hjust = 1)) +
          scale_y_continuous(labels = scales::comma)


  dadosdeputados %>%
  group_by(DEPUTADO) %>%
  filter(UF == "PB") %>% 
  filter(GASTOS >= 0) %>% 
    summarise(gastosdepparaiba = sum(GASTOS)) %>%
      ggplot(aes(x = reorder(DEPUTADO, -gastosdepparaiba), y = gastosdepparaiba))  + 
      geom_bar(stat = "identity", fill = "blue") +
        labs(title = "  DEPUTADOS QUE USARAM A CEAP NA PB ATÉ O MOMENTO EM 2023",
             x = " ",
             y = " ") +
         theme_classic() +
         theme(axis.text = element_text(angle = 45, hjust = 1)) +
          scale_y_continuous(labels = scales::comma)