Introdução

O problema em questão diz respeito aos parcelamentos simplificados e ordinários ativos, conforme estabelecidos pela Lei 10.522, de 2002. Esta questão é relevante tanto para os contribuintes quanto para as autoridades fiscais, pois impacta diretamente a gestão financeira e a eficácia das políticas de parcelamento de débitos fiscais. Contribuintes estão interessados em compreender e gerenciar suas obrigações fiscais, enquanto as autoridades fiscais buscam otimizar a arrecadação e garantir a adimplência.

Para enfrentar esse desafio, a metodologia adotada se baseará na análise minuciosa dos dados disponíveis. Serão empregadas técnicas de exploração e descrição estatística, além de modelagem de dados, para extrair padrões, identificar tendências e oferecer insights significativos. A análise será conduzida de forma a fornecer uma compreensão abrangente dos padrões de pagamento, comportamentos financeiros e eficácia nacional dos parcelamentos simplificados e ordinários.

A abordagem proposta se concentra em cinco aspectos-chave: Distribuição das dívidas ao redor do país, Valores médios das dívidas, Análise de crédito nas regiões do país, Análise dos tributos e Expectativa de fluxo de caixa. Esses tópicos visam fornecer uma visão abrangente do status dos parcelamentos, identificando áreas de risco e oportunidades para melhorar a eficácia das políticas fiscais.

A análise proposta beneficiará tanto os contribuintes quanto as autoridades fiscais. Contribuintes terão uma compreensão mais clara de sua situação financeira, permitindo uma gestão mais eficiente de seus débitos fiscais. Para as autoridades fiscais, a análise fornecerá insights estratégicos para otimizar as políticas de parcelamento, melhorar a adimplência e identificar áreas que exigem intervenção. Em última análise, a análise proposta visa melhorar a transparência, eficiência e eficácia do sistema de parcelamento fiscal para ambas as partes interessadas.

Pacotes requeridos

O código apresentado neste projeto requer a instalação dos seguintes pacotes para ser executado com sucesso. A ausência desses pacotes resultará na incapacidade de executar o código de forma adequada.

Pacote Uso
library(ggplot2) Para construção dos gráficos.
library(geobr) Para adquirir o shapefile que representa o mapa do Brasil.
library(dplyr) Para manipulação dos DataFrames.
library(knitr) Para personalização avançada, adição de estilos e elementos visuais em tabelas.
library(kableExtra) Para formatação de tabelas com recursos adicionais.

Preparação dos dados

Na etapa de preparação dos dados, apresentamos em detalhes as operações executadas para normalizar o conjunto de dados.

Carregamento dos dados

Os dados utilizados neste trabalho foram extraídos do portal de dados abertos do governo federal. Especificamente, foram obtidos informações sobre os parcelamentos ativos concedidos pela Secretaria Especial da Receita Federal do Brasil (RFB), os quais podem ser acessados através do Site Oficial.

Leitura dos dados

Os dados referentes aos parcelamentos são armazenados no site em formato CSV, o que simplifica o processo de leitura no RStudio.

Atenção: O nome do nosso arquivo contém caracteres especiais. Para garantir uma leitura bem-sucedida, é essencial renomeá-lo, removendo quaisquer caracteres especiais. Além disso, assegure-se de que o arquivo esteja localizado no mesmo diretório do script R para permitir o acesso aos dados da seguinte maneira:

# Leitura dos dados .csv
parcelamento_ord_simp <- read.csv(file = "Parcelamento-Ordinario-e-Simplificado-PF.csv",
                                  header = T,
                                  strip.white = T,
                                  na.strings = "",
                                  sep = ";")

Visualização dos dados carregados

A base de dados possui 14 colunas e 153743 linhas. As colunas são nomeadas da seguinte forma: cpf.cnpj, nome, municipio, uf, processo, tributo, situacao, data.adesao, parcelado.na.data.adesao, qtde.parcelas, valor.parcela, qtde.em..atraso, saldo.parcelas.em.atraso.corrigido, saldo.total.antes.da.correcao. A seguir, apresentam-se dez linhas da tabela.

cpf.cnpj nome municipio uf processo tributo situacao data.adesao parcelado.na.data.adesao qtde.parcelas valor.parcela qtde.em..atraso saldo.parcelas.em.atraso.corrigido saldo.total.antes.da.correcao
*.000.410- VALDIR DE SOUZA PADAO JUNIOR SÃO BORJA RS 11060.729.331/19-55 CONTRIB PREV ATIVO 17/06/2020 8381,43 60 139,69 0 0 2514,42
*.001.627- IARA TANIA GONCALVES NITERÓI RJ 10730.407.547/19-60 IRPF ATIVO 13/12/2019 8741,4 60 145,69 0 0 1893,97
*.008.251- TELMA BERNADETE ANJOS DE OLIVEIRA BRASÍLIA DF 10166.400.369/20-31 IRPF ATIVO 14/01/2020 5399,2 48 112,48 2 292,26 449,92
*.012.945- MARDONY QUARESMA BRAGA MACHACALIS MG 10630.403.942/21-16 IRPF ATIVO 08/06/2021 8150,06 60 135,83 0 0 4083,18
*.016.046- CARLA DA SILVA CHAVES SETE LAGOAS MG 13609.400.528/20-30 IRPF ATIVO 12/03/2020 2392,23 23 104,01 1 134,47 104,01
*.018.430- ALINE DE SOUZA MELO PALHOÇA SC 10983.402.376/20-44 IRPF ATIVO 13/07/2020 970,95 60 16,18 1 20,77 339,78
*.018.430- ALINE DE SOUZA MELO PALHOÇA SC 10983.402.377/20-99 IRPF ATIVO 13/07/2020 6768,65 60 112,81 2 289,62 2013,16
*.020.536- ROSANE LOPES FONTOURA E FARIA BELO HORIZONTE MG 10680.401.753/20-32 IRPF ATIVO 20/02/2020 6419,84 60 106,99 0 0 1604,85
*.022.938- NULL NULL NULL 16045.720.002/19-51 IRPF ATIVO 30/07/2019 299898,32 60 4998,3 0 0 39986,4
*.024.492- RAYLENE ALVARENGA DA SILVA MANAUS AM 10283.402.002/20-16 IRPF ATIVO 30/07/2020 6698,02 60 111,63 20 2865,8 4465,2

Limpeza dos dados

Remoção de colunas

Iniciaremos a limpeza da base de dados com a remoção das colunas que não serão utilizadas para nossas análises, estas são: cpf.cnpj , nome , municipio , processo e situacao.

# Subset sem a coluna cpf/cnpj, nome, municipio, processo e situação
parcelamento_ord_simp <- subset(parcelamento_ord_simp, select = -c(cpf.cnpj, nome, municipio, processo, situacao))

A seguir, apresentam-se dez linhas da tabela após a remoção das colunas.

uf tributo data.adesao parcelado.na.data.adesao qtde.parcelas valor.parcela qtde.em..atraso saldo.parcelas.em.atraso.corrigido saldo.total.antes.da.correcao
RS CONTRIB PREV 17/06/2020 8381,43 60 139,69 0 0 2514,42
RJ IRPF 13/12/2019 8741,4 60 145,69 0 0 1893,97
DF IRPF 14/01/2020 5399,2 48 112,48 2 292,26 449,92
MG IRPF 08/06/2021 8150,06 60 135,83 0 0 4083,18
MG IRPF 12/03/2020 2392,23 23 104,01 1 134,47 104,01
SC IRPF 13/07/2020 970,95 60 16,18 1 20,77 339,78
SC IRPF 13/07/2020 6768,65 60 112,81 2 289,62 2013,16
MG IRPF 20/02/2020 6419,84 60 106,99 0 0 1604,85
NULL IRPF 30/07/2019 299898,32 60 4998,3 0 0 39986,4
AM IRPF 30/07/2020 6698,02 60 111,63 20 2865,8 4465,2

Renomeação de colunas

Após a exclusão das colunas, procederemos à renomeação para padronizar os nomes, uma vez que, durante o carregamento, as colunas foram designadas com “.” em seus nomes, os quais serão alterados para Uppercase.

# Novos nomes desejados para as colunas
novos_nomes <- c("UF", "TRIBUTO", "DATA_ADESAO", "PARCELADO_NA_DATA_ADESAO", 
                      "QTDE_PARCELAS", "VALOR_PARCELA", "QTDE_EM_ATRASO", "SALDO_PARCELAS_EM_ATRASO_CORRIGIDO", 
                      "SALDO_TOTAL_ANTES_DA_CORRECAO")

# Atribuindo os novos nomes às colunas
colnames(parcelamento_ord_simp) <- novos_nomes

A seguir, apresentam-se dez linhas da tabela após renomear das colunas.

UF TRIBUTO DATA_ADESAO PARCELADO_NA_DATA_ADESAO QTDE_PARCELAS VALOR_PARCELA QTDE_EM_ATRASO SALDO_PARCELAS_EM_ATRASO_CORRIGIDO SALDO_TOTAL_ANTES_DA_CORRECAO
RS CONTRIB PREV 17/06/2020 8381,43 60 139,69 0 0 2514,42
RJ IRPF 13/12/2019 8741,4 60 145,69 0 0 1893,97
DF IRPF 14/01/2020 5399,2 48 112,48 2 292,26 449,92
MG IRPF 08/06/2021 8150,06 60 135,83 0 0 4083,18
MG IRPF 12/03/2020 2392,23 23 104,01 1 134,47 104,01
SC IRPF 13/07/2020 970,95 60 16,18 1 20,77 339,78
SC IRPF 13/07/2020 6768,65 60 112,81 2 289,62 2013,16
MG IRPF 20/02/2020 6419,84 60 106,99 0 0 1604,85
NULL IRPF 30/07/2019 299898,32 60 4998,3 0 0 39986,4
AM IRPF 30/07/2020 6698,02 60 111,63 20 2865,8 4465,2

Remoção de valores nulos

Em seguida vamos remover os valores nulos da base de dados.

# Remoção de linhas nulas
parcelamento_ord_simp <- parcelamento_ord_simp %>% 
  filter(UF != "NULL")

A seguir, apresentam-se dez linhas da tabela após remover valores nulos.

UF TRIBUTO DATA_ADESAO PARCELADO_NA_DATA_ADESAO QTDE_PARCELAS VALOR_PARCELA QTDE_EM_ATRASO SALDO_PARCELAS_EM_ATRASO_CORRIGIDO SALDO_TOTAL_ANTES_DA_CORRECAO
RS CONTRIB PREV 17/06/2020 8381,43 60 139,69 0 0 2514,42
RJ IRPF 13/12/2019 8741,4 60 145,69 0 0 1893,97
DF IRPF 14/01/2020 5399,2 48 112,48 2 292,26 449,92
MG IRPF 08/06/2021 8150,06 60 135,83 0 0 4083,18
MG IRPF 12/03/2020 2392,23 23 104,01 1 134,47 104,01
SC IRPF 13/07/2020 970,95 60 16,18 1 20,77 339,78
SC IRPF 13/07/2020 6768,65 60 112,81 2 289,62 2013,16
MG IRPF 20/02/2020 6419,84 60 106,99 0 0 1604,85
AM IRPF 30/07/2020 6698,02 60 111,63 20 2865,8 4465,2
AM IRPF 30/07/2020 12852,09 60 214,2 20 5499,2 8568

Normalização das datas

Também vamos normalizar as datas, utilizaremos apenas os anos para as nossas análises

# Normalização das datas
parcelamento_ord_simp$DATA_ADESAO <- as.Date(parcelamento_ord_simp$DATA_ADESAO, format = "%d/%m/%Y")
parcelamento_ord_simp$ANO_ADESAO <- format(parcelamento_ord_simp$DATA_ADESAO, format = "%Y")

A seguir, apresentam-se dez linhas da tabela após a normalização das datas.

UF TRIBUTO DATA_ADESAO PARCELADO_NA_DATA_ADESAO QTDE_PARCELAS VALOR_PARCELA QTDE_EM_ATRASO SALDO_PARCELAS_EM_ATRASO_CORRIGIDO SALDO_TOTAL_ANTES_DA_CORRECAO ANO_ADESAO
RS CONTRIB PREV 2020-06-17 8381,43 60 139,69 0 0 2514,42 2020
RJ IRPF 2019-12-13 8741,4 60 145,69 0 0 1893,97 2019
DF IRPF 2020-01-14 5399,2 48 112,48 2 292,26 449,92 2020
MG IRPF 2021-06-08 8150,06 60 135,83 0 0 4083,18 2021
MG IRPF 2020-03-12 2392,23 23 104,01 1 134,47 104,01 2020
SC IRPF 2020-07-13 970,95 60 16,18 1 20,77 339,78 2020
SC IRPF 2020-07-13 6768,65 60 112,81 2 289,62 2013,16 2020
MG IRPF 2020-02-20 6419,84 60 106,99 0 0 1604,85 2020
AM IRPF 2020-07-30 6698,02 60 111,63 20 2865,8 4465,2 2020
AM IRPF 2020-07-30 12852,09 60 214,2 20 5499,2 8568 2020

Transformação dos dados em numérico

A transformação dos dados em numerico é necessária para nossa análise, faremos isso com algumas colunas que estão como caractere para podermos analisá-las.

#Transformação dos dados para numérico
parcelamento_ord_simp$PARCELADO_NA_DATA_ADESAO <- as.double(gsub(",", ".", parcelamento_ord_simp$PARCELADO_NA_DATA_ADESAO))

parcelamento_ord_simp$VALOR_PARCELA  <- as.double(gsub(",", ".", parcelamento_ord_simp$VALOR_PARCELA    ))

parcelamento_ord_simp$SALDO_TOTAL_ANTES_DA_CORRECAO <- as.double(gsub(",", ".", parcelamento_ord_simp$SALDO_TOTAL_ANTES_DA_CORRECAO))

parcelamento_ord_simp$SALDO_PARCELAS_EM_ATRASO_CORRIGIDO     <- as.double(gsub(",", ".", parcelamento_ord_simp$SALDO_PARCELAS_EM_ATRASO_CORRIGIDO))

A seguir, apresentam-se dez linhas da tabela após a normalização dos nomes dos municípios.

UF TRIBUTO DATA_ADESAO PARCELADO_NA_DATA_ADESAO QTDE_PARCELAS VALOR_PARCELA QTDE_EM_ATRASO SALDO_PARCELAS_EM_ATRASO_CORRIGIDO SALDO_TOTAL_ANTES_DA_CORRECAO ANO_ADESAO
RS CONTRIB PREV 2020-06-17 8381.43 60 139.69 0 0.00 2514.42 2020
RJ IRPF 2019-12-13 8741.40 60 145.69 0 0.00 1893.97 2019
DF IRPF 2020-01-14 5399.20 48 112.48 2 292.26 449.92 2020
MG IRPF 2021-06-08 8150.06 60 135.83 0 0.00 4083.18 2021
MG IRPF 2020-03-12 2392.23 23 104.01 1 134.47 104.01 2020
SC IRPF 2020-07-13 970.95 60 16.18 1 20.77 339.78 2020
SC IRPF 2020-07-13 6768.65 60 112.81 2 289.62 2013.16 2020
MG IRPF 2020-02-20 6419.84 60 106.99 0 0.00 1604.85 2020
AM IRPF 2020-07-30 6698.02 60 111.63 20 2865.80 4465.20 2020
AM IRPF 2020-07-30 12852.09 60 214.20 20 5499.20 8568.00 2020

Remoção dos dados do Exterior

A remoção dos dados do Exterior será feita para facilitar nossas análises no âmbito nacional.

# Filtrar as linhas excluindo a sigla 'EX' de exterior
parcelamento_ord_simp <- parcelamento_ord_simp %>% filter(UF != "EX")

A seguir, apresentam-se dez linhas da tabela após a remoção dos dados do Exterior.

UF TRIBUTO DATA_ADESAO PARCELADO_NA_DATA_ADESAO QTDE_PARCELAS VALOR_PARCELA QTDE_EM_ATRASO SALDO_PARCELAS_EM_ATRASO_CORRIGIDO SALDO_TOTAL_ANTES_DA_CORRECAO ANO_ADESAO
RS CONTRIB PREV 2020-06-17 8381.43 60 139.69 0 0.00 2514.42 2020
RJ IRPF 2019-12-13 8741.40 60 145.69 0 0.00 1893.97 2019
DF IRPF 2020-01-14 5399.20 48 112.48 2 292.26 449.92 2020
MG IRPF 2021-06-08 8150.06 60 135.83 0 0.00 4083.18 2021
MG IRPF 2020-03-12 2392.23 23 104.01 1 134.47 104.01 2020
SC IRPF 2020-07-13 970.95 60 16.18 1 20.77 339.78 2020
SC IRPF 2020-07-13 6768.65 60 112.81 2 289.62 2013.16 2020
MG IRPF 2020-02-20 6419.84 60 106.99 0 0.00 1604.85 2020
AM IRPF 2020-07-30 6698.02 60 111.63 20 2865.80 4465.20 2020
AM IRPF 2020-07-30 12852.09 60 214.20 20 5499.20 8568.00 2020

Dados normalizados

Após a limpeza dos dados este é o dataframe que vamos utilizar para nossas análises, agora a base de dados possui 10 colunas e 152242 linhas. As colunas são nomeadas da seguinte forma: UF, TRIBUTO, DATA_ADESAO, PARCELADO_NA_DATA_ADESAO, QTDE_PARCELAS, VALOR_PARCELA, QTDE_EM_ATRASO, SALDO_PARCELAS_EM_ATRASO_CORRIGIDO, SALDO_TOTAL_ANTES_DA_CORRECAO, ANO_ADESAO.

A seguir, apresentam-se dez linhas da tabela.

UF TRIBUTO DATA_ADESAO PARCELADO_NA_DATA_ADESAO QTDE_PARCELAS VALOR_PARCELA QTDE_EM_ATRASO SALDO_PARCELAS_EM_ATRASO_CORRIGIDO SALDO_TOTAL_ANTES_DA_CORRECAO ANO_ADESAO
RS CONTRIB PREV 2020-06-17 8381.43 60 139.69 0 0.00 2514.42 2020
RJ IRPF 2019-12-13 8741.40 60 145.69 0 0.00 1893.97 2019
DF IRPF 2020-01-14 5399.20 48 112.48 2 292.26 449.92 2020
MG IRPF 2021-06-08 8150.06 60 135.83 0 0.00 4083.18 2021
MG IRPF 2020-03-12 2392.23 23 104.01 1 134.47 104.01 2020
SC IRPF 2020-07-13 970.95 60 16.18 1 20.77 339.78 2020
SC IRPF 2020-07-13 6768.65 60 112.81 2 289.62 2013.16 2020
MG IRPF 2020-02-20 6419.84 60 106.99 0 0.00 1604.85 2020
AM IRPF 2020-07-30 6698.02 60 111.63 20 2865.80 4465.20 2020
AM IRPF 2020-07-30 12852.09 60 214.20 20 5499.20 8568.00 2020

Análise exploratória dos dados

Distribuição das dívidas ao redor do país

A visualização a seguir apresenta a distribuição das dívidas em diferentes estados do país. Este histograma vertical ilustra a quantidade de dívidas em várias regiões, oferecendo uma visão abrangente da situação financeira em todo o território nacional.

# Contar a frequência de cada sigla de estado
contagem_uf <- parcelamento_ord_simp %>% count(UF)

# Renomear a coluna n para DIVIDAS
contagem_uf <- contagem_uf %>% rename(DIVIDAS = n)

# Oredenação dos valores do maior para o menor
contagem_uf$UF <- reorder(contagem_uf$UF, -contagem_uf$DIVIDAS)

contagem_uf$UF <- factor(contagem_uf$UF, levels = rev(levels(contagem_uf$UF)))

# Plotar o histograma na vertical
ggplot(contagem_uf, aes(x = UF, y = DIVIDAS)) +
  geom_bar(stat = "identity", fill = "#2ecc71", color = "white") +
  coord_flip() +
  theme_minimal() +
  labs(title = "Distribuição das dívidas ao redor do país",x = "Estados", y = "Qtde. de Dívidas")

É interessante notar que, de acordo com os dados apresentados, os estados de São Paulo (SP), Rio de Janeiro (RJ) e Minas Gerais (MG) emergem como os principais focos de dívidas, concentrando a maioria dos valores devedores. Logo em seguida, destacam-se os estados do Rio Grande do Sul (RS), Bahia (BA) e Paraná (PR), que também apresentam uma proporção significativa de dívidas.

Valores médios das dívidas

Nesta etapa, conduzimos uma análise dos valores em atraso dos contribuintes, com o intuito de calcular o total dos débitos de todos os contribuintes inadimplentes, abrangendo tanto a escala nacional quanto a regional.

No âmbito nacional, a soma total das dívidas junto à União alcança o considerável montante de R$3.534.443.423. A distribuição desses valores por estados é visualizada no gráfico apresentado abaixo:

# Adicionando uma coluna com a região correspondente a cada UF
dados <- parcelamento_ord_simp %>%
  mutate(regiao = case_when(
    UF %in% c("AC", "AM", "AP", "PA", "RO", "RR", "TO") ~ "Norte",
    UF %in% c("AL", "BA", "CE", "MA", "PB", "PE", "PI", "RN", "SE") ~ "Nordeste",
    UF %in% c("ES", "MG", "RJ", "SP") ~ "Sudeste",
    UF %in% c("PR", "RS", "SC") ~ "Sul",
    UF %in% c("DF", "GO", "MS", "MT") ~ "Centro-Oeste"
  ))

# Agrupando por região e, em seguida, calculando a soma dos valores das parcelas em atraso
soma_atraso_por_regiao <- dados %>%
  group_by(regiao) %>%
  summarise(soma_valores_atraso = sum(VALOR_PARCELA[QTDE_EM_ATRASO > 0] * QTDE_EM_ATRASO))

# Cores para as 5 regiões do Brasil
cores_estados <- c("#8e44ad", "#2ecc71", "#3498db", "#e74c3c", "#f39c12")

# Criando um barplot usando ggplot2
ggplot(soma_atraso_por_regiao, aes( y = soma_valores_atraso, x = regiao, fill = regiao)) +
  geom_bar(stat="identity") +
  labs(title = "Variação média das dívidas em atraso no Brasil", x = "Regiões", y = "Valores em Milhões de R$") +
  guides(fill = guide_legend(title = "Regiões")) +
  theme(panel.background = element_rect(fill = "white"),
        panel.grid.major.y = element_line(color = "gray", linetype = "dashed"),
        panel.grid.minor.y = element_blank()) +
  scale_y_continuous(
    breaks = seq(0, 27, by = 1) * 1e6,  # Incrementos de 1 milhão
    labels = function(x) sprintf("%.0f", x / 1e6)  # Formato manualmente para excluir uma casa decimal
  )+
  scale_fill_manual(values = cores_estados)

Por meio dessa representação visual, notamos que a maioria dos valores das parcelas em atraso está concentrada nas regiões mais populosas do país, como o Sudeste e o Nordeste, o que é compreensível dada a densidade populacional dessas áreas.

A seguir, observamos a dispersão da média dos atrasos nas parcelas dos devedores:

# Filtrando os dados para excluir atraso 0
dados_sem_atraso_0 <- parcelamento_ord_simp[parcelamento_ord_simp$QTDE_EM_ATRASO > 0, ]

# Criaando um novo DataFrame com a contagem da quantidade de parcelas em atraso
contagem_atraso <- table(dados_sem_atraso_0$QTDE_EM_ATRASO)

# Convertendo o DataFrame para um data.frame
df_contagem_atraso <- data.frame(Contagem = as.numeric(names(contagem_atraso)),
                                 Qtde_Parcelas = as.numeric(contagem_atraso))

# Exibindo o gráfico de barras
ggplot(df_contagem_atraso, aes(x = factor(Contagem), y = Qtde_Parcelas)) +
  geom_bar(stat = "identity", fill = "#2ecc71") +
  labs(title = "Soma da Quantidade de Parcelas em Atraso",
       x = "Qtde. de Parcelas em Atraso",
       y = "Soma da Qtde. de Parcelas") +
  theme_minimal()

Ao analisar visualmente a média dos atrasos nas parcelas dos devedores por meio de um gráfico de dispersão, é evidente que a maior parte da variação ocorre entre 1 e 3 parcelas em atraso. Essa descoberta sugere a possibilidade de uma ação coordenada com instituições bancárias para explorar oportunidades de renegociação de dívidas para aquelas pessoas que possuem até 3 parcelas em atraso. A concentração nessa faixa pode ser um indicativo valioso ao considerar estratégias específicas para lidar com devedores nessa situação, visando melhorar a eficiência na recuperação de dívidas e promover soluções personalizadas para os clientes.

Análise de credito nas regiões do pais

A visualização a seguir apresenta uma análise da situação de crédito nas diferentes regiões do país. Este gráfico de barras oferece uma visão abrangente da porcentagem de bons pagadores em cada região, fornecendo insights valiosos para instituições financeiras e órgãos reguladores.

Destaca-se a importância de compreender as nuances regionais no cenário de crédito, permitindo uma tomada de decisão mais precisa e estratégica para o setor financeiro.

# Adicionando uma coluna com a região correspondente a cada UF
dados <- parcelamento_ord_simp %>%
  mutate(REGIAO = case_when(
    UF %in% c("AC", "AM", "AP", "PA", "RO", "RR", "TO") ~ "Norte",
    UF %in% c("AL", "BA", "CE", "MA", "PB", "PE", "PI", "RN", "SE") ~ "Nordeste",
    UF %in% c("ES", "MG", "RJ", "SP") ~ "Sudeste",
    UF %in% c("PR", "RS", "SC") ~ "Sul",
    UF %in% c("DF", "GO", "MS", "MT") ~ "Centro-Oeste"
  ))

# Calculando a quantidade de bons pagadores e inadimplentes por região
contagem_credito <- dados %>%
  group_by(REGIAO) %>%
  summarise(BONSPAGADORES = sum(QTDE_EM_ATRASO == 0), INADIMPLENTES = sum(QTDE_EM_ATRASO > 0)) %>%
  mutate(PORCENTAGEM_BONSPAGADORES = (BONSPAGADORES / (BONSPAGADORES + INADIMPLENTES)) * 100)

# Reordenar os níveis da variável REGIAO com base na porcentagem de bons pagadores
contagem_credito$REGIAO <- factor(contagem_credito$REGIAO, levels = contagem_credito$REGIAO[order(contagem_credito$PORCENTAGEM_BONSPAGADORES)])

# Cores para as 5 regiões do Brasil
cores_estados <- c(Norte = "#8e44ad", Nordeste = "#2ecc71", Sudeste = "#3498db", Sul = "#e74c3c", `Centro-Oeste` = "#f39c12")

# Plotagem do gráfico de barras
ggplot(contagem_credito, aes(x = REGIAO, y = PORCENTAGEM_BONSPAGADORES, fill = REGIAO)) +
  geom_bar(stat = "identity") +
  labs(title = "Análise de crédito nas regiões do país", x = "Regiões", y = "Porcentagem de Bons Pagadores (%)") +
  scale_y_continuous(breaks = seq(0, 75, by = 5)) +
  scale_fill_manual(values = cores_estados) +
  guides(fill = guide_legend(title = "Regiões")) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))  # Rotacionar os rótulos do eixo x para facilitar a leitura

Ao analisar os dados, observamos que o Centro-Oeste e o Sul despontam como as regiões com maior percentual de bons pagadores, ambos com uma adimplência superior a 70%. Esses resultados colocam o Centro-Oeste e o Sul à frente das regiões Sudeste, Nordeste e Norte, refletindo um cenário de maior estabilidade financeira nessas áreas.

Análise dos tributos

Nesta análise o gráfico apresentado destaca a soma acumulativa do valor total das parcelas para cada tipo de tributo.

Ao avaliar a representação visual, é possível identificar a contribuição relativa de cada tributo para o montante total de parcelas. Cada cor representa a expectativa cumulativa de recebimento até o ano atual por tributo.As cores distintas para cada barra facilitam a identificação e a comparação entre os diferentes tipos de tributos.

# Somar o total das parcelas por tipo de tributo
total_parcelas_por_tributo <- parcelamento_ord_simp %>%
  group_by(TRIBUTO) %>%
  summarise(total_parcelas = sum(QTDE_PARCELAS * pmax(VALOR_PARCELA, 1)))

#Exibindo o gráfico de setor
ggplot(total_parcelas_por_tributo, aes(x = "", y = total_parcelas, fill = TRIBUTO)) +
  geom_bar(stat = "identity", width = 1, color = "white") +
  coord_polar(theta = "y") +
  labs(title = 'Total do Valor de Parcelas por Tipo de Tributo') +
  guides(fill = guide_legend(title = "Tributo")) +
  theme_minimal() +
  theme(axis.text = element_blank(),
        axis.title = element_blank(),
        panel.grid = element_blank(),
        plot.margin = unit(rep(0, 4), "cm"))

Essa análise permite uma compreensão mais aprofundada da distribuição do comprometimento financeiro em relação aos tributos específicos, informando estratégias de gestão e tomada de decisões.

Expectativa de fluxo de caixa

Ao explorar a expectativa de fluxo de caixa, optamos por representar visualmente os dados por meio de um gráfico de barras. Este gráfico proporciona uma visão clara e intuitiva da evolução esperada dos recursos financeiros ao longo dos anos.

Cada barra no gráfico representa a expectativa acumulativa de recebimento até o ano atual, considerando diversos fatores, como o valor das parcelas, o saldo total antes da correção e a data de adesão ao parcelamento. A utilização de cores distintas para cada ano facilita a identificação e comparação das contribuições ao longo do tempo.

# Converter a coluna de data para o formato Date
parcelamento_ord_simp$DATA_ADESAO <- as.Date(parcelamento_ord_simp$DATA_ADESAO, format = "%d/%m/%Y")

# Criar uma nova coluna com o ano da adesão e mês da adesão
parcelamento_ord_simp$ANO_ADESAO <- lubridate::year(parcelamento_ord_simp$DATA_ADESAO)
parcelamento_ord_simp$MES_ADESAO <- lubridate::month(parcelamento_ord_simp$DATA_ADESAO)

# Filtrando os anos a serem avaliados (2017-2022)
dados_filtrados <- parcelamento_ord_simp %>%
  filter(ANO_ADESAO >= 2017 & ANO_ADESAO <= 2022)

# Calculando a expectativa de fluxo de caixa por ano
expectativa_fluxo_caixa <- dados_filtrados %>%
  arrange(ANO_ADESAO) %>%
  group_by(ANO_ADESAO) %>%
  summarise(
    EXPECTATIVA = sum(
      ifelse(
        PARCELADO_NA_DATA_ADESAO - ((VALOR_PARCELA * (12 - MES_ADESAO)) + SALDO_TOTAL_ANTES_DA_CORRECAO) > 0,
        (VALOR_PARCELA * (12 - MES_ADESAO)),
        0
      )
    )
  )

# Adicionaando a soma cumulativa
expectativa_fluxo_caixa <- expectativa_fluxo_caixa %>%
  mutate(
    EXPECTATIVA_CUMULATIVA = cumsum(EXPECTATIVA),
    EXPECTATIVA_CUMULATIVA_ATE_ANO_ATUAL = cumsum(EXPECTATIVA_CUMULATIVA)
  )

# Criando o gráfico de barras
ggplot(expectativa_fluxo_caixa,aes(x = as.factor(ANO_ADESAO), y = EXPECTATIVA_CUMULATIVA_ATE_ANO_ATUAL, fill = as.factor(ANO_ADESAO))) +
  geom_bar(stat = "identity") +
  guides(fill = guide_legend(title = "Ano")) +
  scale_y_continuous(
    breaks = seq(0, 1200, by = 100) * 1e6,  # Incrementos de 100 milhão
    labels = function(x) sprintf("%.0f", x / 1e6)  # Formato manualmente para excluir uma casa decimal
  ) +
  labs(title = "Expectativa de Fluxo de Caixa por Ano (2017-2022)",
       x = "Anos",
       y = "Expectativa de Fluxo de Caixa em Milhoes de R$") +
  theme_minimal()

A análise deste gráfico permite visualizar tendências significativas, identificar anos com maior impacto financeiro e entender a distribuição do fluxo de caixa ao longo do período em análise.

Conclusão

Diante da complexidade e da importância das questões relacionadas aos parcelamentos fiscais, é evidente a necessidade de uma abordagem abrangente e estratégica. Ao longo desta análise, exploramos diversos aspectos fundamentais, desde a distribuição das dívidas em âmbito nacional até a projeção do fluxo de caixa resultante. A compreensão desses elementos-chave, como valores médios das dívidas, análise de crédito por região e identificação dos tributos envolvidos, oferece insights valiosos tanto para os contribuintes quanto para as autoridades fiscais. Por meio da análise minuciosa dos dados disponíveis e da aplicação de técnicas estatísticas avançadas, buscamos não apenas identificar áreas de risco, mas também oportunidades para aprimorar a eficácia das políticas fiscais. Ao promover transparência, eficiência e eficácia no sistema de parcelamento fiscal, nosso objetivo é contribuir para uma gestão financeira mais sólida e uma administração tributária mais eficiente, beneficiando assim toda a sociedade.