1.Introdução

As receitas públicas são o montante total em recursos que serão incorporados ao patrimônio do Estado. Essas receitas servem para custear as despesas públicas e as necessidades de investimentos públicos.
As despesas públicas representam os gastos autorizados para o governo nas diversas atividades e programas que compõe o orçamento público. Nesse conjunto estão as despesas com pessoal, educação, saúde, transporte, segurança, etc.
Dependendo de como um país, estado ou cidade consegue administrar suas despesas e receitas sua população sofre consequências.

2.Objetivo

O objetivo do estudo é analisar como as atitudes econômicas dos governos das cidades brasileiras afetam a população das respectivas cidades.

2.1 Hipótese

A hipótese se baseia que quanto maior a responsabilidade financeira dos municípios, maior será sua população, pois uma cidade estável financeiramente atrai mais habitantes e facilita na construção de novas famílias.

3. Metodologia

Encontramos uma base de dados em que o estudo do IBGE nos mostra as populações de acordo com o censo de 2010 e as projeções das mesmas para 2018, vamos correlacionar com as despesas e receitas de suas cidades para conseguir analisar as consequências demográficas que as decisões econômicas feitas pelos governos sofrem.
# Carregar base de dados
library(readxl)
Cities_Brazil_IBGE <- read_excel("C:/Users/Rica Meira/Desktop/Base_de_dados-master/Cities_Brazil_IBGE.xlsx")
# Bibliotecas carregadas para o trabalho
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
library(ggplot2)
library(corrplot)
## corrplot 0.92 loaded

3.1 Tabelas

As tabelas auxiliam na comparação das variáveis e ajuda a ter uma visão melhor dos dados analisados. Por se tratar de uma base de dados longa, a efetuação da média e do desvio padrão de cada região facilita a visualização geral da abordagem.
1ª tabela - População estimada (2018) por região
 Cities_Brazil_IBGE %>% select(RegiaoBrasil,PopEstimada_2018) %>%
  group_by(RegiaoBrasil) %>% 
  summarise(Média=round(mean(PopEstimada_2018),2),DesvioPadrão=round(sd(PopEstimada_2018),2)) %>%
  flextable() %>% theme_tron_legacy()
2ª tabela - Receitas realizadas por região
Cities_Brazil_IBGE %>% select(RegiaoBrasil,ReceitasRealizadas_2014) %>%
  group_by(RegiaoBrasil) %>% 
  summarise(Média=round(mean(ReceitasRealizadas_2014),2),DesvioPadrão=round(sd(ReceitasRealizadas_2014),2)) %>%
  flextable() %>% theme_zebra()
3ª tabela - Despesas empenhadas por região
Cities_Brazil_IBGE %>% select(RegiaoBrasil,DespesasEmpenhadas_2014) %>%
  group_by(RegiaoBrasil) %>% 
  summarise(Média=round(mean(DespesasEmpenhadas_2014),2),DesvioPadrão=round(sd(DespesasEmpenhadas_2014),2)) %>%
  flextable() %>% theme_vader()
4ª tabela - População (2010) por região
Cities_Brazil_IBGE %>% select(RegiaoBrasil,`PopCenso 2010`) %>%
  group_by(RegiaoBrasil) %>% 
  summarise(Média=round(mean(`PopCenso 2010`),2),DesvioPadrão=round(sd(`PopCenso 2010`),2)) %>%
  flextable() %>% theme_vanilla()

4. Resutados e Discussões

Agora vamos analisar mais a fundo a relação das variáveis através do diagrama de dispersão, matriz de correlação e teste de hipótese.

4.1 Diagrama de dispersão

# Diagrama de dispersão
par(bg="lightyellow")
plot(Cities_Brazil_IBGE$ReceitasRealizadas_2014,Cities_Brazil_IBGE$DespesasEmpenhadas_2014,
     pch=16,col="blue",
     main="Diagrama de dispersão - Receitas e Despesas",
     ylab = "Despesas",xlab = "Receitas")
abline(lsfit(Cities_Brazil_IBGE$ReceitasRealizadas_2014,Cities_Brazil_IBGE$DespesasEmpenhadas_2014)
       ,col="darkred")

No diagrama conseguimos analisar duas variáveis quantitativas: despesas empenhadas e receitas realizadas. Percebemos que as cidades estão sendo economicamente estáveis quando se observa a progressão da linha. Os pontos no plano cartesiano indicam as cidades brasilieiras. A maioria dos pontos estão localizados, exatamente, em cima da linha, o que quer dizer que as cidades nessa situação estão gastando em despesas a mesma quantidade que eles recebem em receitas. Poucos pontos se destacam acima ou abaixo da linha.

4.2 Matriz de correlação

# Matriz de correlação
selecao<-c("ReceitasRealizadas_2014","PopCenso 2010",
           "DespesasEmpenhadas_2014", "PopEstimada_2018")

cor_1 <- cor(Cities_Brazil_IBGE[,selecao])
cor_1
##                         ReceitasRealizadas_2014 PopCenso 2010
## ReceitasRealizadas_2014               1.0000000     0.9597765
## PopCenso 2010                         0.9597765     1.0000000
## DespesasEmpenhadas_2014               0.9981605     0.9638095
## PopEstimada_2018                      0.9607953     0.9996075
##                         DespesasEmpenhadas_2014 PopEstimada_2018
## ReceitasRealizadas_2014               0.9981605        0.9607953
## PopCenso 2010                         0.9638095        0.9996075
## DespesasEmpenhadas_2014               1.0000000        0.9642668
## PopEstimada_2018                      0.9642668        1.0000000
library(corrplot)

par(cex=0.5)
corrplot(cor_1)

Na matriz conseguimos ter uma noção de como se relacionam as quatro variáveis em destaque: população(2010), receitas e despesas (2014), projeção da população (2018). O resultado mostra que todas a variáveis são proporcionais, ou seja, os dados mostram que com um governo que consegue sucesso na administração financeira da cidade tende a ter um crescimento populacional.

4.3 Teste de Hipótese

No teste de hipóteses as variáveis avaliadas são: Populaçaõ Estimada em 2018,as Despesas empenhadas em 2014,o Censo de 2010 realizado pelo IBGE e as receitas realizadas em 2014.
Todas as variáveis foram analisadas por municípios.
H0: Os dados seguem uma distribuição normal
H1: Os dados NÃO seguem uma distribuição normal
alpha: 0,05
Se pvalor < alpha rejeita H0
Se pvalor > alpha NÃO rejeita H0
wilcox.test( Cities_Brazil_IBGE$DespesasEmpenhadas_2014,
             Cities_Brazil_IBGE$PopEstimada_2018)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Cities_Brazil_IBGE$DespesasEmpenhadas_2014 and Cities_Brazil_IBGE$PopEstimada_2018
## W = 19080618, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
Valor de p < 2.2e-16
wilcox.test(Cities_Brazil_IBGE$ReceitasRealizadas_2014,
            Cities_Brazil_IBGE$PopEstimada_2018)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Cities_Brazil_IBGE$ReceitasRealizadas_2014 and Cities_Brazil_IBGE$PopEstimada_2018
## W = 19602911, p-value < 2.2e-16
## alternative hypothesis: true location shift is not equal to 0
Valor de p < 2.2e-16
wilcox.test(Cities_Brazil_IBGE$`PopCenso 2010`,Cities_Brazil_IBGE$PopEstimada_2018)
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  Cities_Brazil_IBGE$`PopCenso 2010` and Cities_Brazil_IBGE$PopEstimada_2018
## W = 15086063, p-value = 0.01199
## alternative hypothesis: true location shift is not equal to 0
Valor de p = 0.01199

5. Conclusão

A partir da análise feita das variáveis é possível concluir que os dados dispostos pela base de dados não seguem uma distribuição normal.Portanto os dados rejeitam a hipótese, já que o valor de p foi igual H1.