1) Introdução

Nas últimas décadas, o Brasil vem apresentando um processo acelerado de urbanização e crescimento populacional. Com isso, o déficit habitacional vem aumentando a cada ano em todo o território brasileiro, segundo dados da Câmara Brasileira da Indústria da Construção este ultrapassa 7 milhões de moradias.

Em contrapartida, os grandes centros urbanos possuem muitas moradias abandonados em potencial de uso. Esses edifícios vagos se mostram com um potencial para parte da solução do problema de falta de moradias no país.

O uso desses imóveis vazios é um auxílio para a função social, mas não resolve sozinho o problema do déficit habitacional no Brasil. Por isso, faz-se importante uma verificação de variáveis que influenciam nessa taxa para propostas de solução para o impasse que se encontra no território nacional.

2) Objetivo

O objetivo deste trabalho é analisar, com o apoio de ferramentas e modelos estatísticos, a influência das variáveis População Alfabetizada, Pessoas Ocupadas e PIB no déficit habitacional e verificar se existe uma relação entre o número de domicílios vagos e o déficit habitacional nas regiões metropolitanas do Brasil.

3) Método

Para realização do estudo foi utilizado o banco de dados do portal do IBGE (Instituto Brasileiro de Geografia e Estatística) referente ao XII Censo Demográfico (Censo 2010). O Censo se constitui em um retrato, em extensão e profundidade, da população brasileira e das suas características sócio-econômicas e, ao mesmo tempo, na base sobre a qual deverá se assentar todo o planejamento público e privado da próxima década.

Os dados referentes ao Censo 2010 estão disponíveis para visualização e download no site www.censo2010.ibge.gov.br. Os dados podem ser extraídos por setores como Brasil, Grande Região, Região Metropolitana, Unidades de Federação, Municípios e outras. O estudo foi realizado com a base de Regiões Metropolitanas sendo 34 reconhecidas pelo IBGE no ano de 2010, portanto o número de linhas da tabela utilizada é de 34.

O IBGE considera como Região Metropolitana (RM) uma área composta por um núcleo urbano densamente povoado e por suas áreas vizinhas menos povoadas. Este aglomerado de cidades compartilha de indústrias, infraestrutura e habitações. O Censo investiga temas para domicílios e moradores. Acerca dos domicílios, temos, por exemplo: iluminação, abastecimento de água, saneamento, existência de computador com acesso à Internet etc. Já os moradores são questionados acerca de escolaridade, trabalho e rendimento, idade, cor/raça, deficiência etc. Todas as variáveis estão disponíveis no portal do IBGE.

Para o estudo, as variáveis analisadas foram: Domicílios Vagos em condição de Ocupação, Taxa de Alfabetização, Déficit Habitacional, População Total, PIB per capita, Pessoas Ocupadas acima de 10 anos de idade. Para uma melhor comparação dos dados foi feita uma manipulação das variáveis. As variáveis Déficit Habitacional, Domicílios Vagos e Pessoas Ocupadas foram divididas pelo número total da população e multiplicadas por 100. Nos dando assim valores Per Capita para trabalharmos. A taxa de alfabetização e o PIB não sofreram manipulação pois já estavam em valores per capita. Para melhor compreensão mudamos o nome Taxa de Alfabetização para População Alfabetizada. Também foi criada uma variável Região que agrupou as RM’s por grandes regiões, auxiliando nas análises estatísticas. Todos os dados coletados são referentes ao ano de 2010.

Com os dados coletados e feitas as modificações das variáveis, foi composta uma tabela no Excel com 34 observações e 7 variáveis a serem analisadas na pesquisa. As análises foram feitas com auxílio dos programas “R Project” e “R Studio”, através de gráficos de pizza, boxplot, histograma e diagrama de dispersão. Também foram utilizados matriz de correlação entre variáveis e testes de hipóteses.

Os testes de hipóteses se constituem de teste de normalidade no primeiro momento para todas as variáveis, para sabermos a natureza da distribuição (normal ou não) e posteriormente é feito o teste de correlação. Neste, para análise entre duas variáveis quantitativas, utilizamos o método de Pearson para distribuição normal e o método de Spearman para distribuição não normal.

Para análise entre uma variável qualitativa e uma quantitativa verificamos primeiro a normalidade da variável quantitativa. Sendo esta não normal utilizamos o método não paramétrico de Kruskal-Wallis para a investigar a correlação.

Parâmetros para avaliação do teste de hipóteses:

H0 = a distribuição é normal

H1 = a distribuição não é normal

• p-value ≤ α: rejeito H0

• p-value > α: não rejeito H0

H0 = não existe correlação - hipótese nula

H1 = existe correlação

• p-value ≤ α: Rejeito H0

• p-value > α: Não rejeito H0

4) Análise de Resultados

Ao separarmos por região geográfica do país, as 34 RM’s avaliadas pelo Censo 2010, temos que 6% estão no Centro-Oeste, 35% no Nordeste, 9% no Norte, 21% no Sudeste e 29% no Sul, conforme ilustrado no Gráfico 1.

library(RcmdrMisc)
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich
library(readxl)
dados <- read_excel("C:/Users/lfiorot/dados.xlsx")
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E2 / R2C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E3 / R3C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E4 / R4C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E5 / R5C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E6 / R6C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E7 / R7C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E8 / R8C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E9 / R9C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E10 / R10C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E11 / R11C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E12 / R12C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E13 / R13C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E14 / R14C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E15 / R15C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E16 / R16C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E17 / R17C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E18 / R18C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E19 / R19C5: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i =
## sheet, : Expecting numeric in E20 / R20C5: got a date
library(colorspace, pos=19)

contagem <- table(dados$Regiao)
dados$Regiao<-as.factor(dados$Regiao)
nomes <- levels(dados$Regiao)

porcent <- round(contagem/sum(contagem)*100,0)

rotulo <- paste(nomes, " (",porcent,"%",") ",sep="") 

library(plotrix)

pie3D(table(dados$Regiao), labels=rotulo, explode=0.05, main="RM por Região", col=c("#7acf67","#1d97f5","#f00a34","#9f12e6","#e7ed3b"))

[Gráfico 1 – RM’s por Região]

local({
  .Table <- with(dados, table(Regiao))
  cat("\ncounts:\n")
  print(.Table)
  cat("\npercentages:\n")
  print(round(100*.Table/sum(.Table), 2))
})
## 
## counts:
## Regiao
## CentroOeste    Nordeste       Norte     Sudeste         Sul 
##           2          12           3           7          10 
## 
## percentages:
## Regiao
## CentroOeste    Nordeste       Norte     Sudeste         Sul 
##        5.88       35.29        8.82       20.59       29.41

Utilizou-se o gráfico tipo Boxplot para análise dos dados entre Região e Déficit Habitacional e entre Região e Domicílios Vagos. Esta ferramenta possibilitou uma visualização gráfica do comportamento de cada Região.

boxplot(DeficitHabitacional~Regiao, data=dados, id=list(method="y"), main="Boxplot Deficit Habitacional x Região",xlab="Região", 
col=c("#7acf67","#1d97f5","#f00a34","#9f12e6","#e7ed3b"))

[Gráfico 2 – Déficit Habitacional x Região]

Analisando o Gráfico 2 verificamos que as regiões Centro-Oeste e Norte uma distribuição simétrica. As regiões Sul e Sudeste possuem leve assimetria nos dados e a região Nordeste possui evidente assimetria superior com a presença de um outlier. Visualiza-se também que o Norte possui a mediana mais elevada em relação ao número de pessoas desabrigadas e o Sul a mediana mais baixa.

boxplot(DomiciliosVagos~Regiao, data=dados, id=list(method="y"), main="Boxplot Domicilios Vagos x Região",xlab="Região", 
col=c("#7acf67","#1d97f5","#f00a34","#9f12e6","#e7ed3b"))

[Gráfico 3 – Domicílios Vagos x Região]

Através do Gráfico 3, pode-se visualizar que o Centro-Oeste possui distribuição simétrica, Norte tem distribuição assimétrica inferior e as outras três regiões distribuição assimétrica superior. As regiões Sul e Sudeste possuem um outlier em cada uma.

Analisando a relação entre Déficit Habitacional e Domicílios Vagos por Região, no gráfico 4 representado pelo diagrama de dispersão, tem-se uma correlação positiva e fraca entre as variáveis, devido a inclinação da reta e dispersão dos pontos. Observa-se também a presença de dois outliers na região nordeste, conforme já havia sido mostrado no gráfico 2 boxplot.

library(car)
scatterplot(DomiciliosVagos~DeficitHabitacional | Regiao, regLine=TRUE, smooth=FALSE, boxplots='xy', by.groups=TRUE, data=dados)

[Gráfico 4 – Diagrama de Dispersão por Região: Déficit Habitacional x Domicílios Vagos]

Também foi utilizado o Diagrama de Dispersão para analisar a correlação de cada variável (população alfabetizada, PIB e pessoas ocupadas) separadamente com déficit habitacional.

scatterplot(PopulacaoAlfabetizada~DeficitHabitacional, regLine=TRUE, smooth=FALSE, 
  boxplots='xy', data=dados)

[Gráfico 5 – Diagrama de Dispersão: População Alfabetizada x Déficit Habitacional]

No gráfico 5 observamos uma correlação negativa, devido a inclinação da reta com tendência decrescente, e forte, devido a concentração dos pontos. Observa-se a presença de outliers.

scatterplot(PIBperCapita~DeficitHabitacional, regLine=TRUE, smooth=FALSE, 
  boxplots='xy', data=dados)

[Gráfico 6 – Diagrama de Dispersão: PIB per capita x Déficit Habitacional]

No gráfico 6 verificamos uma correlação negativa e fraca, devido a inclinação da reta e dispersão entre os pontos.Observa-se também a presença de outliers.

scatterplot(PessoasOcupadas~DeficitHabitacional, regLine=TRUE, smooth=FALSE, 
  boxplots='xy', data=dados)

[Gráfico 7 – Diagrama de Dispersão: Pessoas Ocupadas x Déficit Habitacional]

No gráfico 7 percebemos uma correlação nula, devido a falta de inclinação da reta e a grande dispersão entre os pontos. Isso significa que não existe correlação aparente entre as variáveis.

O gráfico 8 ilustra a correlação entre todas as variáveis analisadas no estudo. Observamos uma correlação positiva e forte entre o PIB e Pessoas Ocupadas e entre o PIB e População Alfabetizada. Destaque para as variáveis com maior correlação, sendo negativa e forte, Déficit Habitacional e População Alfabetizada.

library(corrplot)
## corrplot 0.84 loaded
MC<-cor(dados[,c("DeficitHabitacional","DomiciliosVagos","PessoasOcupadas","PIBperCapita",
  "PopulacaoAlfabetizada")], use="complete")
corrplot.mixed(MC,upper="square")

[Gráfico 8 - Matriz de Correlação entre variáveis quantitativas ]

TESTES DE HIPÓTESES

Antes de realizar os testes de hipóteses foi feito o teste de normalidade para cada variável. Sendo nível de significância α = 0,05, as variáveis Déficit Habitacional, PIB per capita e População Alfabetizada não possuem distribuição normal (p-value ≤ 0,05). Já as variáveis Domicílios Vagos e Pessoas Ocupadas possuem distribuição normal (p-value > 0,05).

normalityTest(~DeficitHabitacional, test="shapiro.test", data=dados)
## 
##  Shapiro-Wilk normality test
## 
## data:  DeficitHabitacional
## W = 0.79587, p-value = 2.135e-05
normalityTest(~DomiciliosVagos, test="shapiro.test", data=dados)
## 
##  Shapiro-Wilk normality test
## 
## data:  DomiciliosVagos
## W = 0.94804, p-value = 0.1073
normalityTest(~PessoasOcupadas, test="shapiro.test", data=dados)
## 
##  Shapiro-Wilk normality test
## 
## data:  PessoasOcupadas
## W = 0.95445, p-value = 0.1668
normalityTest(~PIBperCapita, test="shapiro.test", data=dados)
## 
##  Shapiro-Wilk normality test
## 
## data:  PIBperCapita
## W = 0.93027, p-value = 0.03184
normalityTest(~PopulacaoAlfabetizada, test="shapiro.test", data=dados)
## 
##  Shapiro-Wilk normality test
## 
## data:  PopulacaoAlfabetizada
## W = 0.74297, p-value = 2.408e-06

Foram feitos gráficos histograma (Anexo I) para cada variável para confirmação da normalidade, onde foi possível confirmar os resultados apresentados pelo teste.

Observou-se a presença de dois outliers na variável Déficit Habitacional (nas linhas 9 e 12). Como a mesma não possui distribuição normal, foi feita uma manipulação nos dados retirando os outliers para verificação da normalidade sem a presença dos mesmos. Porém, mesmo com a retirada das linhas 9 e 12, a distribuição continuou não normal. A verificação pode ser visualizada pelo gráfico histograma presente no Anexo II. Logo, utilizou-se a tabela completa para execução dos testes de hipóteses.

Os testes foram desenvolvidos de modo que fosse possível atender o objetivo da pesquisa.

Teste 1. Existe associação entre as variáveis Domicílios Vagos e Pessoas Ocupadas – Quanti x Quanti

Teste de Pearson: variáveis normais.

p-value = 0,01204 < α, rejeito Ho.

Logo, existe correlação entre as variáveis domicílios vagos e pessoas ocupadas. Correlação positiva e fraca = 0,43.

Portanto, quanto maior o número de domicilios vagos maior o número de pessoas ocupadas.

with(dados, cor.test(DomiciliosVagos, PessoasOcupadas, alternative="two.sided", 
  method="pearson"))
## 
##  Pearson's product-moment correlation
## 
## data:  DomiciliosVagos and PessoasOcupadas
## t = 2.6623, df = 32, p-value = 0.01204
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.1024099 0.6678268
## sample estimates:
##       cor 
## 0.4258285

Teste 2. Existe correlação entre as variáveis População Alfabetizada e Déficit Habitacional – Quanti x Quanti

Teste de Spearman: variáveis não normais.

p-value = 0,2781 > α, não rejeito Ho.

Assim, não existe correlação entre as variáveis população alfabetizada e déficit habitacional. Correlação negativa e fraca = -0.19.

with(dados, cor.test(DeficitHabitacional, PopulacaoAlfabetizada, 
  alternative="two.sided", exact=F, method="spearman"))
## 
##  Spearman's rank correlation rho
## 
## data:  DeficitHabitacional and PopulacaoAlfabetizada
## S = 7797.9, p-value = 0.2781
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.1914227

Teste 3. Existe correlação entre as variáveis Pessoas Ocupadas e Déficit Habitacional – Quanti x Quanti

Teste de Spearman: variáveis não normais.

p-value = 0,3902 > α, não rejeito Ho.

Logo, não existe correlação entre as variáveis pessoas ocupadas e déficit habitacional. Correlação negativa e fraca = -0,15.

with(dados, cor.test(DeficitHabitacional, PessoasOcupadas, alternative="two.sided", exact=F,
  method="spearman"))
## 
##  Spearman's rank correlation rho
## 
## data:  DeficitHabitacional and PessoasOcupadas
## S = 7541.2, p-value = 0.3902
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.1522005

Teste 4. Existe correlação entre as variáveis PIB per capita e Déficit Habitacional – Quanti x Quanti

Teste de Spearman: variáveis não normais.

p-value = 0,04991 < α, rejeito Ho.

Logo, existe correlação entre as variáveis PIB per capita e déficit habitacional. Correlação negativa e fraca = -0,34.

Portanto, quanto maior o PIB per capita menor o Déficit Habitacional.

with(dados, cor.test(DeficitHabitacional, PIBperCapita, alternative="two.sided", exact=F,
  method="spearman"))
## 
##  Spearman's rank correlation rho
## 
## data:  DeficitHabitacional and PIBperCapita
## S = 8763.2, p-value = 0.04991
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.3389105

Teste 5. Existe uma correlação entre as variáveis Domicílios Vagos e Déficit Habitacional – Quanti x Quanti

Teste de Spearman: variáveis não normais.

p-value = 0,4318 > α, não rejeito Ho.

Logo, não existe correlação entre as variáveis domicílios vagos e déficit habitacional. Correlação positiva e fraca = 0.14.

with(dados, cor.test(DeficitHabitacional, DomiciliosVagos, alternative="two.sided", exact=F,
  method="spearman"))
## 
##  Spearman's rank correlation rho
## 
## data:  DeficitHabitacional and DomiciliosVagos
## S = 5632.9, p-value = 0.4318
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.1393643

Teste 6. Existe uma correlação entre as variáveis PIB per capita e Pessoas Ocupadas – Quanti x Quanti

Teste de Spearman: variáveis não normais.

p-value = 0,0002339 < α, rejeito Ho.

Logo, existe correlação entre as variáveis PIB per capita e pessoas ocupadas. Correlação positiva e forte = 0.59.

Portanto, quanto maior o número de pessoas ocupadas maior o PIB per capita.

with(dados, cor.test(PIBperCapita, PessoasOcupadas, alternative="two.sided", exact=F,
  method="spearman"))
## 
##  Spearman's rank correlation rho
## 
## data:  PIBperCapita and PessoasOcupadas
## S = 2677.7, p-value = 0.0002339
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.5908778

Teste 7. Existe uma correlação entre as variáveis Pessoas Ocupadas e População Alfabetizada – Quanti x Quanti

Teste de Spearman: variáveis não normais.

p-value = 2.2e-16 < α, rejeito Ho.

Logo, existe correlação entre as variáveis pessoas ocupadas e população alfabetizada. Correlação positiva e forte = 0.985.

Portanto, quanto mais alfabetizada a população maior o número de pessoas ocupadas.

with(dados, cor.test(PessoasOcupadas, PopulacaoAlfabetizada, alternative="two.sided", exact=F,
  method="spearman"))
## 
##  Spearman's rank correlation rho
## 
## data:  PessoasOcupadas and PopulacaoAlfabetizada
## S = 3263.7, p-value = 0.002524
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.5013379

Teste 8. Existe impacto no Déficit Habitacional conforme a Região do país – Quanti x Quanli

Teste de Kruskal-Wallis: variáveis não normais.

p-value = 0.008333 < α, rejeito Ho.

Logo, existe impacto no Déficit Habitacional conforme a região do país.

dados$Regiao<-as.factor(dados$Regiao)
with(dados, tapply(DeficitHabitacional, Regiao, median, na.rm=TRUE))
## CentroOeste    Nordeste       Norte     Sudeste         Sul 
##       4.150       3.950       5.090       3.410       2.655
kruskal.test(DeficitHabitacional ~ Regiao, data=dados)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  DeficitHabitacional by Regiao
## Kruskal-Wallis chi-squared = 13.696, df = 4, p-value = 0.008333

5) Conclusão

Por meio da análise realizada, verificamos que o Déficit Habitacional das Regiões Metropolitanas no Brasil sofre impacto conforme a região em que a RM está localizada.

Com relação ao número de domicílios vagos, este aumenta conforme o número de pessoas ocupadas aumenta e não possui correlação com o déficit habitacional. O PIB per capita é a única variável que influência diretamente o déficit habitacional. Onde é maior o PIB per capita é menor o déficit habitacional.

Porém quando verificamos a influência da variável pessoas ocupadas no PIB per capita, percebemos que quando o número de pessoas ocupadas aumenta o PIB per capita também aumenta.

Ainda verificamos a influência da população alfabetizada no número de pessoas ocupadas e também percebemos uma correlação positiva e forte. Logo, quanto mais pessoas alfabetizadas maior o número de pessoas ocupadas. Assim, indiretamente elas influenciam na diminuição do déficit habitacional.

Com as análises, concluímos que quanto maior o número de pessoas alfabetizadas maior as chances de essas conseguirem alguma renda. Assim, quanto maior o número de pessoas com alguma renda maior o PIB per capita da RM. Por fim, quanto maior o PIB per capita menor o déficit habitacional.

Portanto, baseado no estudo estatístico realizado, recomendamos aos órgãos governamentais competentes, como solução para o déficit habitacional no país a longo prazo, investimentos em educação. Acredita-se que esta é a base do problema de falta de moradia nas RM’s. Com uma população mais escolarizada maiores possibilidades de terem uma renda e consequentemente maiores as possibilidades de habitarem uma moradia dentro das condições mínimas de habitabilidade.

Sugere como possibilidade de estudo a relação do grau de escolaridade com o PIB per capita e consequentemente com o déficit habitacional, para uma melhor interpretação da influência dessa variável.

6) Referências

http://www.cbicdados.com.br/menu/deficit-habitacional/deficit-habitacional-no-brasil

https://censo2010.ibge.gov.br/

https://sidra.ibge.gov.br/pesquisa/censo-demografico/demografico-2010/inicial

ANEXO I

with(dados, Hist(DeficitHabitacional, scale="frequency", 
  breaks="Sturges", col="#100954", main="Déficit Habitacional"))

with(dados, Hist(DomiciliosVagos, scale="frequency", breaks="Sturges", 
  col="#100954", main="Domicilios Vagos"))

with(dados, Hist(PessoasOcupadas, scale="frequency", breaks="Sturges", 
  col="#100954", main="Pessoas Ocupadas"))

with(dados, Hist(PIBperCapita, scale="frequency", breaks="Sturges", 
  col="#100954", main="PIB per Capita"))

with(dados, Hist(PopulacaoAlfabetizada, scale="frequency", 
  breaks="Sturges", col="#100954", main="População Alfabetizada"))

ANEXO II

library(RcmdrMisc)
dados1<-dados[-c(9,12),]
with(dados1, Hist(DeficitHabitacional, scale="frequency", 
  breaks="Sturges", col="#100954", main="Deficit Habitacional"))