Esse trabalho tem como objetivo analisar necessidades de financiamento do setor público(NFSP) no conceito primário, isto é, à diferença entre as receitas e despesas do setor público com exceção dos gastos com juros entre 2003 e 2023. Esse período de tempo foi visto quatro presidentes diferentes e a crise do COVID entre 2020 e 2022 que afetaram as taxas do NFSP.
O trabalho encontra-se organizado da seguinte forma: após esta introdução sera feito uma explicação da metodologia usada no trabalho com as estatísticas descritivas, o modelo teórico usado e a filtragem dos dados; a seção seguinte a metodologia vai ser demostrado os resultados encontrados sobre a NFSP junto com as análises dessas informações; por último as conclusões do trabalho apos a sua análise.
A serie temporal do NFSP foi coletada no site do banco central e o
periodo que vai ser analisado é entre 2003 e 2023 os valores estao em
R$(MILHOES)
Desvio Padrão
O desvio padrão é uma medida de dispersão que indica o quanto os valores de um conjunto de dados se afastam da média. Sua fórmula é representada por:
\[ \sigma = \sqrt{\frac{\sum_{i=1}^{N}(X_i - \bar{X})^2}{N}} \]
Onde:
σ é o desvio padrão,
X_i são os valores individuais do conjunto de dados,
X̄ é a média do conjunto de dados,
N é o número total de observações.
Coeficiente de Variação
O coeficiente de variação é uma medida relativa de variabilidade,
expressa como uma porcentagem da média. É especialmente útil para
comparar a dispersão de conjuntos de dados diferentes. A fórmula é dada
por:
\[ CV = \left(\frac{\sigma}{\bar{X}}\right) \times 100\% \]
Onde:
CV é o coeficiente de variação,
σ é o desvio padrão,
X̄ é a média.
Média
A média é uma medida de tendência central que representa o valor médio de um conjunto de dados. É calculada pela soma de todos os valores dividida pelo número total de observações:
\[ \bar{X} = \frac{\sum_{i=1}^{N}X_i}{N} \]
Onde:
X̄ é a média,
X_i são os valores individuais do conjunto de dados,
N é o número total de observações.
A avaliação da normalidade de uma distribuição é crucial em análises estatísticas, e vários indicadores podem ser utilizados para realizar essa verificação.
O QQ-Plot é uma ferramenta gráfica que compara os quantis de uma distribuição de dados com os quantis teóricos de uma distribuição normal. Se os pontos no gráfico seguem aproximadamente uma linha reta, a distribuição pode ser considerada normal. Desvios da linha linear indicam desvios da normalidade. É uma técnica visual útil para verificacao da normalidade.
O Teste de Jarque-Bera avalia se a assimetria e a curtose de uma amostra são consistentes com uma distribuição normal. Se os dados são normalmente distribuídos, o resultado do teste se aproxima de zero. Desvios significativos indicam que a distribuição não é normal. Este teste é sensível a desvios na forma da distribuição.
O Teste de Shapiro-Wilk avalia se uma amostra segue uma distribuição normal. A hipótese nula é que os dados são normalmente distribuídos. Um p-value baixo sugere que a hipótese nula pode ser rejeitada, indicando desvio da normalidade. É amplamente utilizado e eficaz para amostras pequenas.
A decomposição de séries temporais é um processo de separar uma série
temporal em seus componentes principais. Esses componentes podem ser
interpretados como tendências, sazonalidade e componentes
aleatórios.
Tendência é a direção geral de longo prazo de uma série temporal. Ela pode ser representada por uma linha reta ou curva.
Sazonalidade é a variação periódica de uma série temporal ao longo do tempo. Ela pode ser representada por um padrão repetitivo.
Componentes aleatórios são as variações aleatórias ou imprevisíveis de uma série temporal.
O ciclo é uma flutuação de longo prazo que não é necessariamente repetitiva ou periódica.
Aditiva:
Na decomposição aditiva, a série temporal é expressa como a soma dos componentes (tendência, ciclo, sazonalidade e residual):
\[ S(t) = T(t) + C(t) + S(t) + R(t) \]
Multiplicativa:
Na decomposição multiplicativa, a série temporal é expressa como o produto dos componentes:
\[ S(t) = T(t) \times C(t) \times S(t) \times R(t) \]
Filtro de Hodrick-Prescott:
Este é um método que visa separar a tendência de longo prazo do ciclo de curto prazo. Ele utiliza um filtro matemático para decompor a série em componentes tendência e ciclo.
##
## "Min. :-95343 " "1st Qu.:-45941 " "Median :-22231 " "Mean : 5315 "
##
## "3rd Qu.: 13440 " "Max. :745266 "
## Desvio_Padrao Coeficiente_de_Variacao
## 1 117009.8 2201.461
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -223793 -97039 -44473 -15620 17995 912374
## Desvio_Padrao Coeficiente_de_Variacao
## 1 159416.2 -1020.562
Temos uma media de R$-15.620.000.000 de reais da NFSP o que significa que essa foi a media anual desde 2003 necessario para financiar o setor publico, que é menor do que a media do valor sem ser deflacionado, podemos observa esse comportamento analisando o grafico tambem.
O desvio padrão é utilizado para mensurar a dispersão dos valores em relação à média. Observa-se que, para ambas as variáveis, o NFSP deflacionado exibe um desvio padrão superior, o que sugere uma maior variabilidade nos valores dessa variável.
##
## Jarque Bera Test
##
## data: nfspn
## X-squared = 5923.6, df = 2, p-value < 2.2e-16
##
## Shapiro-Wilk normality test
##
## data: nfspn
## W = 0.51601, p-value < 2.2e-16
Todos os testes realizados apresentam evidências consistentes, evidenciadas por p-values muito baixos e valores baixos no teste de W e um valor muito alto para o X-squared, indicando que a série temporal não adere a uma distribuição normal. Na tentativa de normalizar essa série temporal, optou-se por fracioná-la em períodos correspondentes a diferentes presidentes.
## ### Testes para df_Lula_1 ###
##
## Jarque Bera Test
##
## data: serie_temporal$Valor
## X-squared = 3.7129, df = 2, p-value = 0.1562
##
##
## Shapiro-Wilk normality test
##
## data: serie_temporal$Valor
## W = 0.92807, p-value = 0.005794
## ### Testes para df_Lula_2 ###
##
## Jarque Bera Test
##
## data: serie_temporal$Valor
## X-squared = 3.3317, df = 2, p-value = 0.189
##
##
## Shapiro-Wilk normality test
##
## data: serie_temporal$Valor
## W = 0.93417, p-value = 0.009742
## ### Testes para df_Dilma ###
##
## Jarque Bera Test
##
## data: serie_temporal$Valor
## X-squared = 0.9814, df = 2, p-value = 0.6122
##
##
## Shapiro-Wilk normality test
##
## data: serie_temporal$Valor
## W = 0.98368, p-value = 0.5266
## ### Testes para df_Temer ###
##
## Jarque Bera Test
##
## data: serie_temporal$Valor
## X-squared = 0.46, df = 2, p-value = 0.7945
##
##
## Shapiro-Wilk normality test
##
## data: serie_temporal$Valor
## W = 0.97545, p-value = 0.7137
## ### Testes para df_Bolsonaro ###
##
## Jarque Bera Test
##
## data: serie_temporal$Valor
## X-squared = 37.686, df = 2, p-value = 6.554e-09
##
##
## Shapiro-Wilk normality test
##
## data: serie_temporal$Valor
## W = 0.64315, p-value = 1.496e-09
## ### Testes para df_Lula_3 ###
##
## Jarque Bera Test
##
## data: serie_temporal$Valor
## X-squared = 0.99705, df = 2, p-value = 0.6074
##
##
## Shapiro-Wilk normality test
##
## data: serie_temporal$Valor
## W = 0.91135, p-value = 0.2904
Após fracionar é observado que os testes de de Shapiro-Wilk e Jarque Bera indicam normalidade para todos os periodos menos o de Bolsonaro, esse comportamento fora da normalidade nesse periodo pode ser decorrencia do periodo de 2020 onde aconteceu o COVID e temos um grande pulo no valor do NFSP.
## [1] "Taxas de Crescimento Linear:"
## $taxa_linear_df_Lula_1
## [1] -499.0734
##
## $taxa_linear_df_Lula_2
## [1] -449.0885
##
## $taxa_linear_df_Dilma
## [1] 326.1318
##
## $taxa_linear_df_Temer
## [1] 58.24344
##
## $taxa_linear_df_Bolsonaro
## [1] -22.33031
##
## $taxa_linear_df_Lula_3
## [1] 219.2888
## [1] "Taxas de Crescimento Econômico:"
## $taxa_economica_df_Lula_1
## [1] NaN
##
## $taxa_economica_df_Lula_2
## [1] NaN
##
## $taxa_economica_df_Dilma
## [1] 14.5672
##
## $taxa_economica_df_Temer
## [1] 16.53112
##
## $taxa_economica_df_Bolsonaro
## [1] NaN
##
## $taxa_economica_df_Lula_3
## [1] 19.28876
## [1] "Taxas de Crescimento Linear TOTAL:"
## [1] 544.2166
## [1] 544.2166
## [1] "Previsão para novembro: 633079.305867752"
## [1] "Previsão para dezembro: 4078402.18412836"
## [1] "Previsão para novembro usando so dados do Lula_3: 313768.838949509"
## [1] "Previsão para dezembro usando so dados do Lula_3: 1001828.62622939"
Foi calculado a previsao usando dois metodos um com a taxa de crescimento linear de toda base de dados sendo a primeira observacao em 2003 e a ultima em 2023 outubro e o outro metodo foi usando o crescimento linear observado durante o atual mandato de lula comecando em janeiro de 2023 ate outubro de 2023.
Com os dados coletados e analisados nessa pesquisa foi possível notar que existem diferentes fatores que podem influenciar a NFSP sendo o mais fácil de observar o impacto que o covid teve nos dados, quando analisados entre 2003 e 2023 não existe uma distribuição normal mas apos fracionar eles foi observado que sim existe uma distribuição normal e é possível ver movimentos sazonais quando o gráfico é observado.
Analisando o gráfico do NFSP vemos que normalmente os primeiros meses do ano temos um valor negativo indicando que o setor público não precisou de recursos para financiar suas atividades no período em questão, mas ao decorrer do ano esse valor vai aumentando e ficando positivo então acaba vendo uma necessidade de financiamento. Esse movimento de NFSP positivo só acontece no meio de 2015 quando foi preciso do financiamento ao setor publico.