1. Contexto
No dia 12 de janeiro de 2023 foram divulgados os dados dos gastos do
CPGF (Cartão de Pagamento do Governo Federal) . Por curiosidade
resolvi analisar a planilha, a intenção inicial era fazer um comparativo
entre os gastos do diversos governos com dados corrigidos pela
inflação.
Para tal, utilizo o pacote do R deflateBR , que extrai dados dos
principais índices de preços da API do IPEA, compatibiliza as datas
mensais desses índices com as datas dos valores nominais da série e, por
fim, deflaciona e retorna os valores corrigidos. O índice escolhido foi
o IPCA (Índice Nacional de Preços ao Consumidor Amplo), por ser o
principal índice brasileiro de inflação.
- Os maiores gastos foram feitos durante o governo Lula e há
considerável diminuição das compras a partir do governo
Dilma/Temer.
- A grande maioria das despesas é feita em hospedagem ou
alimentação.
- Hospedagem é a categoria com mais gastos, com o valor acumulado de
R$ 99.546.417 (valores corrigidos pelo IPCA dez-2022) ao longo dos
últimos 20 anos.
- Desde o início da série foram gastos R$ 210.556.492 no CPGF.
- Há de se destacar as despesas no Mercadinho La Palma LTDA ao longo
dos anos: foram 6.351.730 reais gastos no estabelecimento, o local com
maior soma de gastos durante a série.
Entretanto, desde o começo da análise até a presente data, muitas
dúvidas surgiram sobre a qualidade dos dados divulgados, o que põe em
cheque qualquer tipo de comparação entre os governos. Segundo reportagem
do UOL ,
não se sabe se os gastos do presidente são referentes a apenas gastos
individuais ou se englobam outras secretarias. Além disso, há
inconsistências entre os dados apresentados na planilha e os divulgados
no portal da transparência .
Ainda assim, continuei a análise por curiosidade. Entretanto, é
interessante ter uma boa dose de ceticismo ao fazer comparações.
2. Pré-processamento dos dados
Carregando os pacotes
#carregando as bibliotecas
library(tidyverse)
library(ggplot2)
library(deflateBR)
library(stringr)
library("skimr")
library("scales")
library(patchwork)
library(knitr)
library(kableExtra)
library(htmltools)
#retirando a notação cientifica
options(scipen=999)
#mudando o diretório
setwd('C:/Users/SAMSUNG/OneDrive/Documentos/GitHub/cartao_corporativo')
Os dados utilizados nessa análise podem ser encontrados aqui.
Loading da base
corporativo <- read.csv2('corporativo.csv', encoding='LATIN1')
corporativo %>%
head(10) %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
DATA.PGTO
|
CPF.SERVIDOR
|
CPF.CNPJ.FORNECEDOR
|
NOME.FORNECEDOR
|
VALOR
|
TIPO
|
SUBELEMENTO.DE.DESPESA
|
CDIC
|
|
02/01/2003
|
*.010.008-
|
31349202000177
|
JW TRANSPORTADORA TUR?TICA
|
R$ 1.696,90
|
D
|
LOCACAO DE MEIOS DE TRANSPORTE
|
00200.220539/2003-63.R.08.18/12/2002.31/12/2014.N
|
|
02/01/2003
|
*.010.008-
|
31349202000177
|
JW TRANSPORTADORA TUR?TICA
|
R$ 1.336,60
|
D
|
LOCACAO DE MEIOS DE TRANSPORTE
|
00200.220539/2003-63.R.08.18/12/2002.31/12/2014.N
|
|
02/01/2003
|
*.868.251-
|
31349202000177
|
JW TRANSPORTADORA TUR?TICA
|
R$ 1.396,43
|
D
|
LOCACAO DE MEIOS DE TRANSPORTE
|
00200.600539/2003-63.R.08.18/12/2002.31/12/2014.N
|
|
03/01/2003
|
*.004.131-
|
592717000170
|
FLORES ALVORADA
|
R$ 8.585,00
|
C
|
OUTROS SERVI?OS DE TERCEIROS-PESSOA JUR?ICA
|
00200.800212/2003-91.R.08.07/12/2002.31/12/2014.N
|
|
03/01/2003
|
*.004.131-
|
839308000125
|
CRISTAL LIMPEZA - COM?RCIO DE MATERIAIS PARA LIMPE
|
R$ 251,50
|
C
|
MATERIAL DE LIMPEZA E PROD. DE HIGIENIZA??
|
00200.800212/2003-91.R.08.07/12/2002.31/12/2014.N
|
|
03/01/2003
|
*.262.328-
|
2014093000139
|
SEBASTI? ALVES DE SOUSA - ME
|
R$ 105,00
|
D
|
MATERIAL P/MANUTEN?? DE BENS M?EIS
|
00200.150539/2003-63.R.08.16/12/2002.31/12/2014.N
|
|
03/01/2003
|
*.262.328-
|
2363792000194
|
JO? LEITE NETO - ME - JLN ELETRONICOS
|
R$ 200,00
|
D
|
MATERIAL P/MANUTEN?? DE BENS M?EIS
|
00200.150539/2003-63.R.08.16/12/2002.31/12/2014.N
|
|
03/01/2003
|
*.010.008-
|
96475389000109
|
CONDOMINIO EDIFICIO THE PARK HALL
|
R$ 2.590,00
|
D
|
HOSPEDAGENS
|
00200.220539/2003-63.R.08.18/12/2002.31/12/2014.N
|
|
03/01/2003
|
*.010.008-
|
1720459000122
|
FULL TIME LOCA?? E SERVI?OS S/C LTDA
|
R$ 3.618,70
|
D
|
LOCACAO DE MEIOS DE TRANSPORTE
|
00200.220539/2003-63.R.08.18/12/2002.31/12/2014.N
|
|
03/01/2003
|
*.262.471-
|
47508411013134
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
R$ 716,40
|
C
|
GENEROS DE ALIMENTA??
|
00200.900212/2003-91.R.08.18/12/2002.31/12/2014.N
|
Procurando por duplicatas
sum(duplicated(corporativo)) %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = TRUE)
Há 34578 linhas iguais no dataset. Por enquanto vamos deixá-las.
Dropando colunas e linhas
corporativo %>%
tail(10) %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
|
DATA.PGTO
|
CPF.SERVIDOR
|
CPF.CNPJ.FORNECEDOR
|
NOME.FORNECEDOR
|
VALOR
|
TIPO
|
SUBELEMENTO.DE.DESPESA
|
CDIC
|
|
113333
|
03/12/2022
|
*.136.591-
|
3696869000100
|
BIG TRANS COMERCIAL DE ALIMENTOS LTDA
|
363,68
|
C
|
GENEROS DE ALIMENTA??
|
00264.000642/2022-21.R.08.25/11/2022.31/12/2022.N
|
|
113334
|
03/12/2022
|
*.136.591-
|
47508411094975
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
39,95
|
C
|
GENEROS DE ALIMENTA??
|
00264.000642/2022-21.R.08.25/11/2022.31/12/2022.N
|
|
113335
|
03/12/2022
|
*.136.591-
|
3696869000100
|
BIG TRANS COMERCIAL DE ALIMENTOS LTDA
|
58,03
|
C
|
GENEROS DE ALIMENTA??
|
00264.000642/2022-21.R.08.25/11/2022.31/12/2022.N
|
|
113336
|
03/12/2022
|
*.136.591-
|
17261661005728
|
OUTBACK STEAKHOUSE RESTAURANTES BRASIL S/A
|
179,5
|
C
|
FORNECIMENTO DE ALIMENTA??
|
00264.000642/2022-21.R.08.25/11/2022.31/12/2022.N
|
|
113337
|
03/12/2022
|
*.136.591-
|
39879944000116
|
BIOMUNDO 105 NORTE COMERCIO DE ALIMENTOS
|
54,95
|
C
|
GENEROS DE ALIMENTA??
|
00264.000642/2022-21.R.08.25/11/2022.31/12/2022.N
|
|
113338
|
04/12/2022
|
*.136.591-
|
47508411094975
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
518,07
|
C
|
GENEROS DE ALIMENTA??
|
00264.000642/2022-21.R.08.25/11/2022.31/12/2022.N
|
|
113339
|
04/12/2022
|
*.136.591-
|
12550441000146
|
RESTAURANTE SOHO
|
330,52
|
C
|
FORNECIMENTO DE ALIMENTA??
|
00264.000642/2022-21.R.08.25/11/2022.31/12/2022.N
|
|
113340
|
04/12/2022
|
*.136.591-
|
3696869000100
|
BIG TRANS COMERCIAL DE ALIMENTOS LTDA
|
54,66
|
C
|
GENEROS DE ALIMENTA??
|
00264.000642/2022-21.R.08.25/11/2022.31/12/2022.N
|
|
113341
|
Fonte: SUPRIM
|
|
NA
|
|
|
|
|
|
|
113342
|
At? 19/12/2022
|
|
NA
|
|
|
|
|
|
- removendo as duas ultimas linhas da nota de rodapé
corporativo <- corporativo[-c(113341,113342 ), ]
- removendo as colunas
CPF.SERVIDOR,
CPF.CNPJ.FORNECEDOR, TIPO e
CDIC
corporativo = subset(corporativo, select = -c(CPF.SERVIDOR, CPF.CNPJ.FORNECEDOR, TIPO,CDIC ))
Passando DATA.PGTO para datetime
corporativo$DATA.PGTO = as.Date(corporativo$DATA.PGTO, format = '%d/%m/%Y')
Ajeitando a coluna VALOR
corporativo$VALOR <- str_extract(corporativo$VALOR, "(\\d.+)")
- Substituindo o . por , e a , por .
corporativo$VALOR <- gsub("[.]", "", corporativo$VALOR)
corporativo$VALOR <- str_replace(corporativo$VALOR, "," , ".")
Convertendo VALOR para número
corporativo$VALOR <- as.numeric(corporativo$VALOR)
Checando dados faltantes
sum(is.na(corporativo)) %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = TRUE)
Há dados faltantes
skim_without_charts(corporativo)
Data summary
|
Name
|
corporativo
|
|
Number of rows
|
113340
|
|
Number of columns
|
4
|
|
_______________________
|
|
|
Column type frequency:
|
|
|
character
|
2
|
|
Date
|
1
|
|
numeric
|
1
|
|
________________________
|
|
|
Group variables
|
None
|
Variable type: character
|
skim_variable
|
n_missing
|
complete_rate
|
min
|
max
|
empty
|
n_unique
|
whitespace
|
|
NOME.FORNECEDOR
|
0
|
1
|
3
|
97
|
0
|
8607
|
0
|
|
SUBELEMENTO.DE.DESPESA
|
0
|
1
|
4
|
50
|
0
|
112
|
0
|
Variable type: Date
|
skim_variable
|
n_missing
|
complete_rate
|
min
|
max
|
median
|
n_unique
|
|
DATA.PGTO
|
0
|
1
|
2003-01-02
|
2022-12-19
|
2010-02-19
|
6670
|
Variable type: numeric
|
skim_variable
|
n_missing
|
complete_rate
|
mean
|
sd
|
p0
|
p25
|
p50
|
p75
|
p100
|
|
VALOR
|
14
|
1
|
1013.87
|
3970.27
|
0.12
|
111
|
288.4
|
691.72
|
312903.4
|
Dropando:
corporativo <- corporativo %>% drop_na()
3. Deflacionamento dos dados
O índice de preços ao consumidor mostra o custo de uma cesta de bens
e serviços em relação ao custo da mesma cesta no ano-base. Ele é usado
para medir o nível geral de preços da economia e é justamente a variação
percentual desse índice que mede a taxa de inflação. Dessa maneira, ele
é usado para monitorar mudanças no custo de vida ao longo do tempo.
Quando o índice aumenta, as famílias precisam gastar mas dinheiro para
manter o mesmo padrão de vida.Assim, se a taxa de inflação do preços ao
consumidor é de 10%, por exemplo, os preços dos artigos que as famílias
estão comprando estão subindo 10% ao ano.
É importante corrigir os valores monetários, pois não é possível
comparar de maneira válida o poder aquisitivo em dois momentos
diferentes do tempo.Para comparar valores monetários do passado com os
valores correntes é preciso que o valor de antes seja inflacionado por
meio de um índice de preços. Isso porque, preços, PIB, componentes de
despesa etc. são todos medidos em termos de valores correntes de
mercado, e são variáveis nominais. Variáveis nominais são aquelas que
são medidas em unidades monetárias, enquanto variáveis reais são medidas
em unidades físicas (e o embate entre variáveis reais e nominais é
chamado de dicotomia clássica, o que é outro assunto…).
Embora variáveis nominais sejam úteis por nos permitir a soma de
diferentes tipos de bens e serviços, não é possível comparar valores
nominais em dois pontos distintos do tempo. Pegue o PIB, por exemplo.
Não há como comparar dois valores de PIB em anos distintos sem
corrigi-los, por que se o valor corrente do mercado e dos bens e
serviços mudar com o tempo não poderemos saber se essa mudança reflete
mudanças nas quantidades de bens e serviços produzidas, mudanças em seus
preços ou uma combinação dos dois fatores. De maneira mais clara:
aumento no valor corrente do PIB pode tanto ser expansão da produção de
bens e serviços quanto simplesmente uma inflação que aumentou o preço
dos produtos.
Dos vários índices de preço ao consumidor calculados no Brasil, o
mais popular é o IPCA (Índice Nacional de Preços ao Consumidor Amplo),
que é o que usaremos na análise. Para deflacionar os dados utilizamos o
pacote deflateBR que extrai os dados monetários da API do
IPEA.
corporativo$VALOR_DEF = ipca(corporativo$VALOR, corporativo$DATA.PGTO, "12/2022")
##
## Downloading necessary data from IPEA's API
## ...
4. Estatísticas gerais
corporativo %>%
select(VALOR_DEF) %>%
summarize(total = sum(VALOR_DEF), media = mean(VALOR_DEF), max = max(VALOR_DEF), min = min(VALOR_DEF), valor_quartil = quantile(VALOR_DEF, c(0.25, 0.5, 0.75)), q = c(0.25, 0.5, 0.75) ) %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = TRUE)
|
total
|
media
|
max
|
min
|
valor_quartil
|
q
|
|
210556492
|
1857.972
|
651219.7
|
0.2944865
|
216.5736
|
0.25
|
|
210556492
|
1857.972
|
651219.7
|
0.2944865
|
602.3294
|
0.50
|
|
210556492
|
1857.972
|
651219.7
|
0.2944865
|
1396.6758
|
0.75
|
5. Gastos no cartão por período
Gastos no cartão corporativo por dia
p <- ggplot(data = corporativo, aes(x = DATA.PGTO, y = VALOR_DEF)) +
geom_line(color = "darkorchid4", size = 1) +
labs(title = 'Gastos no cartão corporativo por dia 2003-2022',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = 'Data') +
scale_y_continuous(labels = label_number( accuracy = 1, big.mark = '.',
decimal.mark = ','))

Soma dos gastos no cartão corporativo por ano
corporativo_year <- corporativo %>%
group_by(year = lubridate::floor_date(DATA.PGTO, "year")) %>%
summarize(summary_variable = sum(VALOR_DEF, na.rm = TRUE))
ggplot(data = corporativo_year, aes(x = year, y = summary_variable)) +
geom_line(color = "darkorchid4", size = 1) +
labs(title = 'Soma dos gastos do cartão corporativo por ano 2003-2022',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = 'Data') +
scale_y_continuous(labels = label_number(accuracy = 1))+ theme_classic()

corporativo_year %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive"), full_width = FALSE)
|
year
|
summary_variable
|
|
2003-01-01
|
15945340
|
|
2004-01-01
|
18390203
|
|
2005-01-01
|
13622608
|
|
2006-01-01
|
12515200
|
|
2007-01-01
|
9373558
|
|
2008-01-01
|
13914722
|
|
2009-01-01
|
11920227
|
|
2010-01-01
|
13662266
|
|
2011-01-01
|
8982480
|
|
2012-01-01
|
8542149
|
|
2013-01-01
|
10532167
|
|
2014-01-01
|
15298336
|
|
2015-01-01
|
8635526
|
|
2016-01-01
|
5815024
|
|
2017-01-01
|
5357122
|
|
2018-01-01
|
6293466
|
|
2019-01-01
|
6699446
|
|
2020-01-01
|
8793923
|
|
2021-01-01
|
11081838
|
|
2022-01-01
|
5180890
|
6. Gastos agrupados por subelemento de despesa
Geral
gastos_categ <- corporativo %>% group_by(SUBELEMENTO.DE.DESPESA) %>%
summarise(
media_def = mean(VALOR_DEF, na.rm = TRUE),
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(5)
- Vamos corrigir a escrita:
corporativo$SUBELEMENTO.DE.DESPESA <- recode(corporativo$SUBELEMENTO.DE.DESPESA, 'LOCACAO DE MEIOS DE TRANSPORTE' = "LOCAÇÃO DE MEIOS DE TRANSPORTE")
corporativo$SUBELEMENTO.DE.DESPESA <- recode(corporativo$SUBELEMENTO.DE.DESPESA,"GENEROS DE ALIMENTA??" = "GENEROS DE ALIMENTAÇÃO")
corporativo$SUBELEMENTO.DE.DESPESA <- recode(corporativo$SUBELEMENTO.DE.DESPESA,"FORNECIMENTO DE ALIMENTA??" = "FORNECIMENTO DE ALIMENTAÇÃO")
corporativo$SUBELEMENTO.DE.DESPESA <- recode(corporativo$SUBELEMENTO.DE.DESPESA,"SERVI?OS DE TELECOMUNICA??S" = "SERVIÇOS DE TELECOMUNICAÇÕES")
corporativo$SUBELEMENTO.DE.DESPESA <- recode(corporativo$SUBELEMENTO.DE.DESPESA,"MATERIAL DE LIMPEZA E PROD. DE HIGIENIZA??" = "MATERIAL DE LIMPEZA E PROD. DE HIGIENIZAÇÃO")
gastos_categ %>% kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = TRUE)
|
SUBELEMENTO.DE.DESPESA
|
media_def
|
soma_def
|
|
HOSPEDAGENS
|
2197.978
|
99546417
|
|
LOCACAO DE MEIOS DE TRANSPORTE
|
15367.409
|
30888492
|
|
GENEROS DE ALIMENTA??
|
1139.291
|
28390005
|
|
FORNECIMENTO DE ALIMENTA??
|
3597.323
|
23735135
|
|
SERV.DE APOIO ADMIN.,TECNICO E OPERACIONAL
|
2637.830
|
12875250
|
- Agora podemos plotar um gráfico
gastos_categ %>%
mutate(SUBELEMENTO.DE.DESPESA = fct_reorder(SUBELEMENTO.DE.DESPESA,soma_def ))%>%
ggplot(aes(x = SUBELEMENTO.DE.DESPESA, y = soma_def,
fill = factor(ifelse(SUBELEMENTO.DE.DESPESA=='HOSPEDAGENS', '...', '')))) +
geom_bar(stat = 'identity', show.legend = FALSE) +
scale_fill_manual(name = 'soma_def', values= c('#9E67C3', '#68228b'))+
coord_flip() +
labs( y = '',
x = '') +
ggtitle('Soma das 5 categorias com mais gastos 2003-2022',
subtitle = 'Dados indexados pelo IPCA Dez-2022')+
scale_y_continuous(labels = label_number(accuracy = 1))+
theme_classic()

Gastos por categoria dividido por governo
Lula I
Tabela
#gastos do governo lula i
tlula_1 <- corporativo %>% group_by(SUBELEMENTO.DE.DESPESA) %>%
subset(DATA.PGTO >= "2003-01-02" & DATA.PGTO <= "2006-12-31",) %>%
summarise(
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(5)
|
SUBELEMENTO.DE.DESPESA
|
soma_def
|
|
LOCAÇÃO DE MEIOS DE TRANSPORTE
|
29326895.9
|
|
HOSPEDAGENS
|
18771121.1
|
|
GENEROS DE ALIMENTAÇÃO
|
3571066.1
|
|
FORNECIMENTO DE ALIMENTAÇÃO
|
3299095.6
|
|
SERVIÇOS DE TELECOMUNICAÇÕES
|
928133.2
|
Gráfico
tlula_1 %>% mutate(SUBELEMENTO.DE.DESPESA = fct_reorder(SUBELEMENTO.DE.DESPESA, soma_def ))%>%
ggplot(aes(x = SUBELEMENTO.DE.DESPESA, y = soma_def,
fill = factor(ifelse(SUBELEMENTO.DE.DESPESA=='LOCAÇÃO DE MEIOS DE TRANSPORTE', '...', '')))) +
geom_bar(stat = 'identity', show.legend = FALSE) +
scale_fill_manual(name = 'soma_def', values= c('#9E67C3', '#68228b')) +
coord_flip() +
labs(title = 'Top 5 categorias com mais gastos durante Lula I',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
scale_y_continuous(labels = label_number(accuracy = 1))+
theme_classic()

Lula II
Tabela
#gastos do governo lula ii
tlula_2 <- corporativo %>% group_by(SUBELEMENTO.DE.DESPESA) %>%
subset(DATA.PGTO >= "2007-01-01" & DATA.PGTO <= "2010-12-31",) %>%
summarise(
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(5)
|
SUBELEMENTO.DE.DESPESA
|
soma_def
|
|
HOSPEDAGENS
|
30303300
|
|
GENEROS DE ALIMENTAÇÃO
|
6793699
|
|
FORNECIMENTO DE ALIMENTAÇÃO
|
5429272
|
|
SERV.DE APOIO ADMIN.,TECNICO E OPERACIONAL
|
1562098
|
|
LOCAÇÃO DE MEIOS DE TRANSPORTE
|
1331047
|
Gráfico
tlula_2 %>% mutate(SUBELEMENTO.DE.DESPESA = fct_reorder(SUBELEMENTO.DE.DESPESA, soma_def ))%>%
ggplot(aes(x = SUBELEMENTO.DE.DESPESA, y = soma_def,
fill = factor(ifelse(SUBELEMENTO.DE.DESPESA=='HOSPEDAGENS', '...', '')))) +
geom_bar(stat = 'identity', show.legend = FALSE) +
scale_fill_manual(name = 'soma_def', values= c('#9E67C3', '#68228b')) +
coord_flip() +
labs(title = 'Top 5 categorias com mais gastos durante Lula II',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
scale_y_continuous(labels = label_number(accuracy = 1))+
theme_classic()

Dilma
Tabela
#gastos do governo dilma
tdilma <- corporativo %>% group_by(SUBELEMENTO.DE.DESPESA) %>%
subset(DATA.PGTO >= "2011-01-01" & DATA.PGTO <= "2016-08-31",) %>%
summarise(
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(5)
|
SUBELEMENTO.DE.DESPESA
|
soma_def
|
|
HOSPEDAGENS
|
29768534.5
|
|
GENEROS DE ALIMENTAÇÃO
|
9311573.5
|
|
FORNECIMENTO DE ALIMENTAÇÃO
|
6793463.3
|
|
SERV.DE APOIO ADMIN.,TECNICO E OPERACIONAL
|
5712926.1
|
|
MATERIAL DE LIMPEZA E PROD. DE HIGIENIZAÇÃO
|
701049.3
|
Gráfico
tdilma %>% mutate(SUBELEMENTO.DE.DESPESA = fct_reorder(SUBELEMENTO.DE.DESPESA, soma_def ))%>%
ggplot(aes(x = SUBELEMENTO.DE.DESPESA, y = soma_def,
fill = factor(ifelse(SUBELEMENTO.DE.DESPESA=='HOSPEDAGENS', '...', '')))) +
geom_bar(stat = 'identity', show.legend = FALSE) +
scale_fill_manual(name = 'soma_def', values= c('#9E67C3', '#68228b')) +
coord_flip() +
labs(title = 'Top 5 categorias com mais gastos durante gov Dilma',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
scale_y_continuous(labels = label_number(accuracy = 1))+
theme_classic()

Temer
Tabela
#gastos do governo temer
ttemer <- corporativo %>% group_by(SUBELEMENTO.DE.DESPESA) %>%
subset(DATA.PGTO >= "2016-09-01" & DATA.PGTO <= "2018-12-31",) %>%
summarise(
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(5)
|
SUBELEMENTO.DE.DESPESA
|
soma_def
|
|
HOSPEDAGENS
|
4898900.85
|
|
GENEROS DE ALIMENTAÇÃO
|
3251868.86
|
|
SERV.DE APOIO ADMIN.,TECNICO E OPERACIONAL
|
2924449.04
|
|
FORNECIMENTO DE ALIMENTAÇÃO
|
1902444.47
|
|
MATERIAL DE LIMPEZA E PROD. DE HIGIENIZAÇÃO
|
89934.95
|
Gráfico
ttemer %>% mutate(SUBELEMENTO.DE.DESPESA = fct_reorder(SUBELEMENTO.DE.DESPESA, soma_def ))%>%
ggplot(aes(x = SUBELEMENTO.DE.DESPESA, y = soma_def,
fill = factor(ifelse(SUBELEMENTO.DE.DESPESA=='HOSPEDAGENS', '...', '')))) +
geom_bar(stat = 'identity', show.legend = FALSE) +
scale_fill_manual(name = 'soma_def', values= c('#9E67C3', '#68228b')) +
coord_flip() +
labs(title = 'Top 5 categorias com mais gastos durante Temer',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
scale_y_continuous(labels = label_number(accuracy = 1))+
theme_classic()

Bolsonaro
Tabela
#gastos do governo bolsonaro
tbolsonaro <- corporativo %>% group_by(SUBELEMENTO.DE.DESPESA) %>%
subset(DATA.PGTO >= "2019-01-01" & DATA.PGTO <= "2021-12-31",) %>%
summarise(
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(5)
|
SUBELEMENTO.DE.DESPESA
|
soma_def
|
|
HOSPEDAGENS
|
13653919.4
|
|
FORNECIMENTO DE ALIMENTAÇÃO
|
5178499.7
|
|
GENEROS DE ALIMENTAÇÃO
|
4266786.5
|
|
SERV.DE APOIO ADMIN.,TECNICO E OPERACIONAL
|
1652050.7
|
|
LOCA?? BENS MOV. OUTR. NATUREZA E INTANG?EIS
|
589317.7
|
Gráfico
tbolsonaro %>% mutate(SUBELEMENTO.DE.DESPESA = fct_reorder(SUBELEMENTO.DE.DESPESA, soma_def ))%>%
ggplot(aes(x = SUBELEMENTO.DE.DESPESA, y = soma_def,
fill = factor(ifelse(SUBELEMENTO.DE.DESPESA=='HOSPEDAGENS', '...', '')))) +
geom_bar(stat = 'identity', show.legend = FALSE) +
scale_fill_manual(name = 'soma_def', values= c('#9E67C3', '#68228b')) +
coord_flip() +
labs(title = 'Top 5 categorias com mais gastos durante gov. Bolsonaro',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
scale_y_continuous(labels = label_number(accuracy = 1))+
theme_classic()

Olhando os 3 picos de gastos 2003, 2014 e 2021
2003
Tabela
corporativo %>%
subset(DATA.PGTO >= "2003-01-01" & DATA.PGTO <= "2003-12-31") %>%
group_by(SUBELEMENTO.DE.DESPESA) %>%
summarise(
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(10)%>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
SUBELEMENTO.DE.DESPESA
|
soma_def
|
|
LOCAÇÃO DE MEIOS DE TRANSPORTE
|
9417613.97
|
|
HOSPEDAGENS
|
4139948.09
|
|
FORNECIMENTO DE ALIMENTAÇÃO
|
777691.74
|
|
GENEROS DE ALIMENTAÇÃO
|
447790.94
|
|
COMBUSTIVEIS E LUBRIF. AUTOMOTIVOS
|
202453.61
|
|
OUTROS SERVI?OS DE TERCEIROS-PESSOA JUR?ICA
|
160908.54
|
|
MATERIAL DE LIMPEZA E PROD. DE HIGIENIZAÇÃO
|
71881.81
|
|
SERVIÇOS DE TELECOMUNICAÇÕES
|
65240.83
|
|
MANUT. E CONS. DE VE?ULOS
|
56385.64
|
|
SERV.DE APOIO ADMIN.,TECNICO E OPERACIONAL
|
55509.17
|
Gráfico: Locação
corporativo %>%
subset(DATA.PGTO >= "2003-01-01" & DATA.PGTO <= "2003-12-31") %>%
subset(corporativo$SUBELEMENTO.DE.DESPESA == 'LOCAÇÃO DE MEIOS DE TRANSPORTE',) %>%
ggplot(aes(x = DATA.PGTO, y = VALOR_DEF)) +
geom_line(color = "darkorchid4", size = 0.4, na.rm=TRUE) +
labs(title = 'Gastos no cartão corporativo em 2003: Locação de Meios de Transporte',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = 'Data') +
scale_y_continuous(labels = label_number(accuracy = 1))+ theme_classic()

Parece que em 2003 os maiores gastos foram por volta de dezembro
(talvez esteja relacionado com as festas do fim de ano
Os dois maiores gastos em 2003 foram com Locação de Meios de
Transporte (R$ 9 417 613,97) e com Hospedagens (R$ 4 139 948,09). Todos
os presidentes após Lula tiveram grandes gastos com hospedagem, mas
locação de meios de transporte é algo que se caracteriza do governo
Lula, sendo a categoria que tem mais gastos tanto no primeiro quanto no
segundo governo.
Teve um dia que o gasto chegou a quase 600k
corporativo %>%
subset(corporativo$VALOR_DEF >= 600000,)%>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
|
DATA.PGTO
|
NOME.FORNECEDOR
|
VALOR
|
SUBELEMENTO.DE.DESPESA
|
VALOR_DEF
|
|
46373
|
2008-12-17
|
SAUIPE S.A - SAUIPE PARK
|
290176
|
HOSPEDAGENS
|
651219.7
|
Gasto com hotelaria, em resort.
corporativo %>%
subset(corporativo$VALOR_DEF >= 300000,)%>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
|
DATA.PGTO
|
NOME.FORNECEDOR
|
VALOR
|
SUBELEMENTO.DE.DESPESA
|
VALOR_DEF
|
|
4662
|
2003-12-14
|
FULL TIME LOCA?? E SERVI?OS S/C LTDA
|
103728.4
|
LOCAÇÃO DE MEIOS DE TRANSPORTE
|
302776.9
|
|
46373
|
2008-12-17
|
SAUIPE S.A - SAUIPE PARK
|
290176.0
|
HOSPEDAGENS
|
651219.7
|
|
106505
|
2021-01-03
|
HOTUR S PAULO PART E EMPR LTDA
|
312903.4
|
HOSPEDAGENS
|
364307.5
|
O outro pico diário é de 2021: foram gastos 364307.5 (valores
corrigidos pela inflação) em hotelaria.
2014
Tabela Geral
corporativo %>%
subset(DATA.PGTO >= "2014-01-01" & DATA.PGTO <= "2014-12-31") %>%
group_by(SUBELEMENTO.DE.DESPESA) %>%
summarise(
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(10)%>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
SUBELEMENTO.DE.DESPESA
|
soma_def
|
|
HOSPEDAGENS
|
9387138.16
|
|
FORNECIMENTO DE ALIMENTAÇÃO
|
2318112.18
|
|
GENEROS DE ALIMENTAÇÃO
|
1698035.71
|
|
SERV.DE APOIO ADMIN.,TECNICO E OPERACIONAL
|
1122055.03
|
|
MATERIAL DE LIMPEZA E PROD. DE HIGIENIZAÇÃO
|
134836.84
|
|
SERVIÇOS DE TELECOMUNICAÇÕES
|
104422.70
|
|
MATERIAL FARMACOLOGICO
|
86994.29
|
|
LOCA?? DE IM?EIS
|
67690.72
|
|
MATERIAL DE COPA E COZINHA
|
51102.65
|
|
LIMPEZA E CONSERVA??
|
51001.92
|
Gráfico: Hospedagens
corporativo %>%
subset(DATA.PGTO >= "2014-01-01" & DATA.PGTO <= "2014-12-31") %>%
subset(corporativo$SUBELEMENTO.DE.DESPESA == 'HOSPEDAGENS',) %>%
ggplot(aes(x = DATA.PGTO, y = VALOR_DEF)) +
geom_line(color = "darkorchid4", size = 0.4, na.rm=TRUE) +
labs(title = 'Gastos no cartão corporativo em 2014: HOSPEDAGENS',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = 'Data') +
scale_y_continuous(labels = label_number(accuracy = 1))+ theme_classic()

2021
Tabela
corporativo %>%
subset(DATA.PGTO >= "2021-01-01" & DATA.PGTO <= "2021-12-31") %>%
group_by(SUBELEMENTO.DE.DESPESA) %>%
summarise(
soma_def = sum(VALOR_DEF, na.rm = TRUE)) %>%
arrange(-soma_def) %>%
head(10) %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
SUBELEMENTO.DE.DESPESA
|
soma_def
|
|
HOSPEDAGENS
|
5504915.90
|
|
FORNECIMENTO DE ALIMENTAÇÃO
|
2278446.73
|
|
GENEROS DE ALIMENTAÇÃO
|
1562072.36
|
|
SERV.DE APOIO ADMIN.,TECNICO E OPERACIONAL
|
760960.89
|
|
LOCA?? BENS MOV. OUTR. NATUREZA E INTANG?EIS
|
437374.98
|
|
COMBUSTIVEIS E LUBRIF. AUTOMOTIVOS
|
298584.34
|
|
MATERIAL DE LIMPEZA E PROD. DE HIGIENIZAÇÃO
|
54658.85
|
|
COMBUSTIVEIS E LUBRF. P/ OUTRAS FINALIDADES
|
27989.72
|
|
MATERIAL DE ACONDICIONAMENTO E EMBALAGEM
|
19872.38
|
|
LOCA?? DE IM?EIS
|
19611.65
|
Gráfico: Hospedagem
corporativo %>%
subset(DATA.PGTO >= "2021-01-01" & DATA.PGTO <= "2021-12-31") %>%
subset(corporativo$SUBELEMENTO.DE.DESPESA == 'HOSPEDAGENS',) %>%
ggplot(aes(x = DATA.PGTO, y = VALOR_DEF)) +
geom_line(color = "darkorchid4", size = 0.4, na.rm=TRUE) +
labs(title = 'Gastos no cartão corporativo em 2021: HOSPEDAGENS',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = 'Data') +
scale_y_continuous(labels = label_number(accuracy = 1))+ theme_classic()

Novamente, hospedagem com os maiores gastos, seguido por gastos com
alimentação.
7. Em quais estabelecimentos os presidentes mais compraram?
Acumulativo da série:
corporativo %>%
group_by(NOME.FORNECEDOR)%>%
summarise(frequencia = n(), total = sum(VALOR_DEF), media = mean(VALOR_DEF),max = max(VALOR_DEF)) %>%
arrange(-total) %>%
head(5) %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
NOME.FORNECEDOR
|
frequencia
|
total
|
media
|
max
|
|
MERCADINHO LA PALMA LTDA
|
3591
|
6351730
|
1768.791
|
29558.52
|
|
FULL TIME LOCA?? E SERVI?OS S/C LTDA
|
377
|
5721221
|
15175.651
|
302776.87
|
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
4710
|
4558705
|
967.878
|
13052.78
|
|
BOURBON IBIRAPUERA HOTEL & CONVENTION
|
2617
|
4407385
|
1684.137
|
110884.13
|
|
P.J.P. LOCA??S E SERVI?OS LTDA - BRAS?IA RENT A
|
276
|
3273551
|
11860.691
|
93727.96
|
Lula I
Tab freq
tab_freq_lula1 <- corporativo %>%
subset(DATA.PGTO >= "2003-01-02" & DATA.PGTO <= "2006-12-31",) %>%
group_by(NOME.FORNECEDOR)%>%
summarise(frequencia = n(), total = sum(VALOR_DEF), media = mean(VALOR_DEF),max = max(VALOR_DEF)) %>%
arrange(-frequencia) %>%
head(5)
|
NOME.FORNECEDOR
|
frequencia
|
total
|
media
|
max
|
|
SAINT MORITZ HOT. ACCOR BRASIL S.A.
|
962
|
1338617.3
|
1391.4941
|
43358.583
|
|
TIMES SQUARE HOT. ACCOR BRASIL S.A
|
777
|
481436.0
|
619.6088
|
10072.214
|
|
CIA. INDUSTRIAL DE GRANDES HOT?IS - HOTEL GL?IA
|
709
|
1235027.0
|
1741.9281
|
43874.228
|
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
626
|
538944.8
|
860.9342
|
8333.844
|
|
TELEMAR NORTE LESTE S/A
|
618
|
272939.3
|
441.6494
|
6291.306
|
Gráfico
tab_freq_lula1 %>%
ggplot(aes(NOME.FORNECEDOR, frequencia)) +
geom_bar(stat = 'identity', fill = "darkorchid4") +
coord_flip() +
labs(title = 'Top 5 estabelecimentos com maior frequência de compra: Lula I',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
theme_classic()

Lula II
Tab freq
tab_freq_lula2 <- corporativo %>%
subset(DATA.PGTO >= "2007-01-01" & DATA.PGTO <= "2010-12-31",) %>%
group_by(NOME.FORNECEDOR)%>%
summarise(frequencia = n(), total = sum(VALOR_DEF), media = mean(VALOR_DEF),max = max(VALOR_DEF)) %>%
arrange(-frequencia) %>%
head(5)
|
NOME.FORNECEDOR
|
frequencia
|
total
|
media
|
max
|
|
ABACO SCP SAINT MORITZ
|
2445
|
2046276.1
|
836.9228
|
5824.474
|
|
BOURBON IBIRAPUERA HOTEL & CONVENTION
|
1889
|
1853542.1
|
981.2293
|
5363.742
|
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
1094
|
1388634.7
|
1269.3187
|
13052.778
|
|
TELEMAR NORTE LESTE S/A
|
939
|
364637.1
|
388.3250
|
2128.455
|
|
ESTANPLAZA ADMINISTRADORA HOTELARIA E COMERCIAL LT
|
920
|
1873739.5
|
2036.6734
|
8572.708
|
Gráfico
tab_freq_lula2 %>%
ggplot(aes(NOME.FORNECEDOR, frequencia)) +
geom_bar(stat = 'identity', fill = "darkorchid4") +
coord_flip() +
labs(title = 'Top 5 estabelecimentos com maior frequência de compra: Lula II',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
theme_classic()

Dilma
Tab freq
tab_freq_dilma <- corporativo %>%
subset(DATA.PGTO >= "2011-01-01" & DATA.PGTO <= "2016-08-31",) %>%
group_by(NOME.FORNECEDOR)%>%
summarise(frequencia = n(), total = sum(VALOR_DEF), media = mean(VALOR_DEF),max = max(VALOR_DEF)) %>%
arrange(-frequencia) %>%
head(5)
|
NOME.FORNECEDOR
|
frequencia
|
total
|
media
|
max
|
|
MERCADINHO LA PALMA LTDA
|
1210
|
2268926.3
|
1875.1457
|
25300.350
|
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
904
|
836622.1
|
925.4670
|
9655.679
|
|
GOLDEN TOWER HOTEIS E TURISMO LTDA
|
865
|
2338946.4
|
2703.9843
|
19852.491
|
|
BOURBON IBIRAPUERA HOTEL & CONVENTION
|
693
|
2255611.3
|
3254.8503
|
110884.131
|
|
TELEMAR NORTE LESTE S/A
|
551
|
117959.7
|
214.0829
|
742.662
|
Gráfico
tab_freq_dilma %>%
ggplot(aes(NOME.FORNECEDOR, frequencia)) +
geom_bar(stat = 'identity', fill = "darkorchid4") +
coord_flip() +
labs(title = 'Top 5 estabelecimentos com maior frequência de compra: Dilma',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
theme_classic()

Temer
Tab freq
tab_freq_temer <- corporativo %>%
subset(DATA.PGTO >= "2016-09-01" & DATA.PGTO <= "2018-12-31",) %>%
group_by(NOME.FORNECEDOR)%>%
summarise(frequencia = n(), total = sum(VALOR_DEF), media = mean(VALOR_DEF),max = max(VALOR_DEF)) %>%
arrange(-frequencia) %>%
head(5)
|
NOME.FORNECEDOR
|
frequencia
|
total
|
media
|
max
|
|
MERCADINHO LA PALMA LTDA
|
759
|
574704.2
|
757.1861
|
7923.946
|
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
612
|
475014.7
|
776.1678
|
11247.641
|
|
BIG TRANS COMERCIAL DE ALIMENTOS LTDA
|
532
|
458277.0
|
861.4229
|
4154.722
|
|
SUPERMERCADO VAREJAO OBA LTDA
|
415
|
271316.4
|
653.7745
|
2451.457
|
|
INTERNATIONAL MEAL COMPANY ALIMENT
|
265
|
506636.6
|
1911.8361
|
9625.169
|
Gráfico
tab_freq_temer%>%
ggplot(aes(NOME.FORNECEDOR, frequencia)) +
geom_bar(stat = 'identity', fill = "darkorchid4") +
coord_flip() +
labs(title = 'Top 5 estabelecimentos com maior frequência de compra: Temer',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
theme_classic()

Bolsonaro
Tab freq
tab_freq_bolsonaro <- corporativo %>%
subset(DATA.PGTO >= "2019-01-01" & DATA.PGTO <= "2021-12-31",) %>%
group_by(NOME.FORNECEDOR)%>%
summarise(frequencia = n(), total = sum(VALOR_DEF), media = mean(VALOR_DEF),max = max(VALOR_DEF)) %>%
arrange(-frequencia) %>%
head(5)
|
NOME.FORNECEDOR
|
frequencia
|
total
|
media
|
max
|
|
MERCADINHO LA PALMA LTDA
|
759
|
574704.2
|
757.1861
|
7923.946
|
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
612
|
475014.7
|
776.1678
|
11247.641
|
|
BIG TRANS COMERCIAL DE ALIMENTOS LTDA
|
532
|
458277.0
|
861.4229
|
4154.722
|
|
SUPERMERCADO VAREJAO OBA LTDA
|
415
|
271316.4
|
653.7745
|
2451.457
|
|
INTERNATIONAL MEAL COMPANY ALIMENT
|
265
|
506636.6
|
1911.8361
|
9625.169
|
Gráfico
tab_freq_bolsonaro%>%
ggplot(aes(NOME.FORNECEDOR, frequencia)) +
geom_bar(stat = 'identity', fill = "darkorchid4") +
coord_flip() +
labs(title = 'Top 5 estabelecimentos com maior frequência de compra: Bolsonaro',
subtitle = 'Dados indexados pelo IPCA Dez-2022',
y = '',
x = '') +
theme_classic()

Os governos Lula e Dilma foram marcados por gastos frequentes em
hotéis enquanto nos governos Temer e Bolsonaro os gastos mais frequentes
são com alimentação.
O Mercadinho La Palma parece ser um favorito entre os
presidentes.
Tanto é um favorito que nos últimos 20 anos foi quem mais faturou com
gastos no cartão corporativo de 6.351.730 reais:
corporativo %>%
group_by(NOME.FORNECEDOR)%>%
summarise(frequencia = n(), total = sum(VALOR_DEF), media = mean(VALOR_DEF),max = max(VALOR_DEF)) %>%
arrange(-total) %>%
head(5) %>%
kbl() %>%
kable_styling(bootstrap_options = c("striped", "condensed", "responsive", "hover"), full_width = FALSE)
|
NOME.FORNECEDOR
|
frequencia
|
total
|
media
|
max
|
|
MERCADINHO LA PALMA LTDA
|
3591
|
6351730
|
1768.791
|
29558.52
|
|
FULL TIME LOCA?? E SERVI?OS S/C LTDA
|
377
|
5721221
|
15175.651
|
302776.87
|
|
COMPANHIA BRASILEIRA DE DISTRIBUI??
|
4710
|
4558705
|
967.878
|
13052.78
|
|
BOURBON IBIRAPUERA HOTEL & CONVENTION
|
2617
|
4407385
|
1684.137
|
110884.13
|
|
P.J.P. LOCA??S E SERVI?OS LTDA - BRAS?IA RENT A
|
276
|
3273551
|
11860.691
|
93727.96
|
O Mercadinho La Palma LTDA ao longo dos anos…
corporativo %>%
subset(corporativo$NOME.FORNECEDOR == 'MERCADINHO LA PALMA LTDA',) %>%
group_by(year = lubridate::floor_date(DATA.PGTO, "year")) %>%
summarize(total = sum(VALOR_DEF, na.rm = TRUE)) %>%
ggplot(aes(x = year, y = total)) +
geom_line(color = "darkorchid4", size = 0.4, na.rm=TRUE) +
labs(title = 'Gastos no cartão corporativo no Mercadinho La Palma ao longo dos anos',
subtitle = 'Dados indexados pelo IPCA Dez-2022') + theme_classic()
