ANÁLISE DESCRITIVA ESPACIAL COM O PACOTE geobr (PARTE I)

1ª ESCOLA DE VERÃO

PROF. GUILHERME AUGUSTO VELOSO

UFF - 20, 22 E 24 DE MARÇO DE 2023

1 Introdução

Compreender a distribuição espacial de dados oriundos de fenômenos ocorridos no espaço constitui hoje um grande desafio para a elucidação de questões centrais em diversas áreas do conhecimento, seja em saúde, no meio ambiente, em geologia, em agronomia, entre tantas outras.

Tais estudos vêm se tornando cada vez mais comuns, devido à disponibilidade de sistemas de informação geográfica com interfaces amigáveis.

Estes sistemas permitem a visualização espacial de variáveis como população de indivíduos, índices de qualidade de vida, vendas de empresa numa região ou a mortalidade por uma doença em determinados municípios.

Para tanto, basta dispor de um banco de dados e de uma base geográfica (como um mapa de municípios), e é possível apresentar um mapa colorido permitindo a visualização do padrão espacial do fenômeno.

Além da percepção visual da distribuição espacial do problema, é muito útil traduzir os padrões existentes com considerações objetivas e mensuráveis, como nos seguintes casos:

  • Epidemiologistas coletam dados sobre ocorrência de doenças: A distribuição dos casos de uma doença forma um padrão no espaço? Existe associação com alguma fonte de poluição? Evidência de contágio?

  • Deseja-se investigar se existe alguma concentração espacial na distribuição de roubos: Roubos que ocorrem em determinadas áreas estão correlacionados com características sócio-econômicas dessas áreas?

  • Geólogos desejam estimar a extensão de um depósito mineral em uma região a partir de amostras: Pode-se usar essas amostras para estimar a distribuição do mineral na região?

  • Deseja-se analisar uma região para fins de zoneamento agrícola: Como escolher as variáveis explicativas — solo, vegetação, geomorfologia — e determinar qual a contribuição de cada uma delas para definir em que local o tipo de cultura é mais adequado?

Todos esses problemas fazem parte da análise espacial de dados geográficos. A ênfase da análise espacial é mensurar propriedades e relacionamentos, levando em conta a localização espacial do fenômeno em estudo de forma explícita. Ou seja, a idéia central é incorporar o espaço à análise que se deseja fazer.

1.1 Dados Espaciais

A taxonomia mais utilizada para caracterizar os problemas de análise espacial considera três tipos de dados:

1.1.1 Eventos ou Padrões Pontuais

São fenômenos expressos através de ocorrências identificadas como pontos localizados no espaço, denominados processos pontuais. São exemplos:

  • Localização de crimes;
  • Ocorrências de doenças;
  • Localização de espécies vegetais.

Nesse tipo de dado espacial, objeto de interesse é a propria localização espacial dos eventos em estudo. Por exemplo, será que a mortalidade por tuberculose, mesmo considerando os fatores de risco conhecidos, varia com o local de residência do paciente?

Os objetivos da análise de processos pontuais são

  • Estudar a distribuição espacial destes pontos;
  • Testar hipóteses sobre o padrão observado: se é aleatório ou se apresenta em aglomerados ou regularmente distribuido;
  • Estabelecer o relacionamento de ocorrência de eventos com características do indivíduo, incorporando a possibilidade de haver algum fator ambiental, do qual não se dispõe de dados.

Como exemplo, a figura abaixo ilustra a aplicação das análises de padrões pontuais para o caso de mortalidade por causas externas em Porto Alegre, com os dados de 1996, realizada por Simone Santos e Christovam Barcellos, da FIOCRUZ.

A localização dos homicídios (vermelho), acidentes de trânsito (amarelo) e suicídios (azul) está mostrada na figura à esquerda. À direita, apresenta-se uma superfície para a intensidade estimada, que pode ser pensada como a “temperatura da violência”.

A superfície interpolada mostra um padrão de distribuição de pontos com uma forte concentração no centro da cidade e decrescendo em direção aos bairros mais afastados.

1.1.2 Superfícies Contínuas

Estimadas a partir de um conjunto de amostras de campo, que podem estar regularmente ou irregularmente distríbuidas. Usualmente, este tipo de dado é resultante do levantamento de recursos naturais, e que incluem mapas geológicos, topográficos, ecológicos, fitogeográficos e pedológicos.

Para a análise de superfícies, o objetivo é reconstruir a superfície da qual se retirou e mediu as amostras. Como exemplo, considera-se a distribuição de perfis e amostras de solo para o estado de Santa Catarina e áreas próximas, e o mapa de distribuição espacial da variável saturação por bases, produzidos por Simone Bônisch, do INPE, e apresentados abaixo:

Como foi construído este mapa? As cruzes destacadas indicam a localização dos pontos de coleta de amostras do solo; a partir destas medidas, foi estimado um modelo de dependência espacial, que permitiu a interpolação da superfície apresentada no mapa.

1.1.3 Área

Tratam-se de dados associados a levantamentos populacionais, como censos e estatísticas de saúde, e que originalmente se referem a indivíduos localizados em pontos específicos do espaço. Por razões, por exemplo, de confidencialidade, estes dados são agregados em unidades de análise, usualmente delimitadas por polígonos fechados (setores censitários, zonas de endereçamento postal, municípios).

Dentro dos polígonos fechados, supõe-se haver homogeneidade interna, ou seja, mudanças importantes só ocorrem nos limites. Nesse curso, trataremos apenas de dados de área. Nas próximas linhas, serão dados alguns exemplos motivacionais.

A distribuição dos casos de uma doença pode formar um padrão no espaço. Descrever o desenvolvimento de uma epidemia no espaço sugere formas de controlar e combater.

  • Caracterizando a localização de serviços de saúde: a demanda pelos serviços está sendo atendida adequadamente?

  • Poderia ser feita uma nova alocação geográfica de recursos que seja mais eficiente?

  • Há alguma associação entre a localização dos casos de uma doença e a posição de alguma fonte suspeita (rio, estação nuclear, fábrica,..)?

TAXA DE MORTALIDADE POR CÂNCER DE PULMÃO - 1994

Os indicadores sóciodemográficos evidenciam as múltiplas realidades sociais presentes no País e contribuem para a formulação de políticas e programas que visem à melhoria das desigualdades encontradas, em consonância com as diferenças demográficas, epidemiológicas e socioeconômicas.

\[\\[0.1in]\]

\[\\[0.1in]\]

% DE ANALFABETISMO ACIMA DE 15 ANOS - 2018

\[\\[0.1in]\]

MAPA DE EXCLUSÃO/INCLUSÃO SOCIAL DE SÃO PAULO (1991) E AGRUPAMENTOS DE EXCLUSÃO SOCIAL (ZONAS LESTE E SUL) E INCLUSÃO SOCIAL (CENTRO)

1.2 Análise Espacial

A partir da divisão dos tipos de dados espaciais citada anteriormente, verifica-se que os problemas de análise espacial lidam, basicamente, com dados ambientais, socioeconômicos e epidemiológicos.

Em todos os casos, a análise espacial é composta por um conjunto de procedimentos encadeados cuja finalidade é a escolha de um modelo inferencial que considere explicitamente os relacionamentos espaciais presentes no fenômeno.

Em geral, o processo de modelagem é precedido de uma fase de análise descritiva exploratória, associada a apresentação visual dos dados sob forma de gráficos e mapas e a identificação de padrões de dependência espacial no fenômeno em estudo.

2 Objetivos

O minicurso “Análise descritiva espacial com o pacote geobr” tem os seguintes objetivos:

  • Visão geral e funcionalidades do pacote geobr presente no software R;

  • Visualização com o pacote geobr de diversas unidades geográficas brasileiras disponíveis como municípios, estados, regiões de saúde, dentre outros;

  • Construção e customização de mapas coropléticos com o pacote geobr;

  • Conceitos importantes de estatística espacial descritiva e exploratória;

  • Investigação de padrões de dependência espacial com os índices de correlação Moran e Lisa.

3 O Pacote geobr

Um shapefile é um formato de armazenamento de dados para armazenar a posição, forma e atributos de feições geográficas. O geobr é um pacote do R que permite que os usuários acessem facilmente os shapefiles do Instituto Brasileiro de Geografia e Estatística (IBGE) e outros conjuntos oficiais de dados espaciais do Brasil.

O pacote inclui uma ampla variedade de conjuntos de dados geográficos como recursos simples, disponíveis em várias escalas geográficas e por vários anos. O pacote geobr foi desenvolvido por Rafael Henrique Moraes Pereira, pesquisador do Instituto de Pesquisa Econômica Aplicada (IPEA).

Mais informações sobre o pacote geobr podem ser encontradas no CRAN geobr


ROTEIRO RCLOUD

1- Fazer o cadastro

2- Baixar o arquivo sf e colocar no CLOUD

3- Instalar os pacotes classInt,DBI,magrittr,Rcpp,s2,units

4- Compilar o código

install.packages("sf_1.0-8.tar.gz",repos=NULL,type="source")

Para a execução da primeira parte desse curso, serão necessários os seguintes pacotes:

  • geobr: Permite o acesso aos shapefiles de diferentes unidades geográficas brasileiras.

  • ggplot2: Construção e customização de mapas coropléticos.

Dessa forma, segue o código de instalação dos pacotes citados anteriormente:

if(!require(geobr)){ install.packages("geobr"); require(geobr)}
if(!require(ggplot2)){ install.packages("ggplot2"); require(ggplot2)}

4 Unidades Geográficas Brasileiras

Conforme mencionado, o pacote geobr trabalha com diferentes unidades geográficas. Para cada unidade geográfica de interesse, o pacote geobr tem uma função diferente, dentre as seguintes:

Cada função acima gera o shapefile de uma unidade geográfica e todas as funções possuem sintaxe similar que podem ser verificadas com maiores detalhes no CRAN geobr.

Para trabalhar e manipular os dados envolvendo diferentes unidades geográficas brasileiras é extremamente útil codificá-las em números. Por exemplo:

  • Rio de Janeiro (cidade): 3304557
  • Rio de Janeiro (região geográfica imediata): 330001
  • Rio de Janeiro (região geográfica intermediária): 3301
  • Rio de Janeiro (estado): 33

A codificação de cidades e estados pode ser consultada no site IBGE. Já a codificação de regiões intermediárias e imediatas no site WIKIPEDIA

A seguir, seguem algumas unidades geográficas brasileiras e maiores detalhes:

4.1 País

Brasil<-read_country(year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Brasil,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

4.2 Região

Regiao<-read_region(year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Regiao,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

4.3 Estado

Estado<-read_state(code_state="all",year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Estado,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

EstadoRJ<-read_state(code_state=33,year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=EstadoRJ,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

4.4 Município

Municipio<- read_municipality(code_muni = "all",year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Municipio,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

MunicipioRJ<- read_municipality(code_muni = 33,year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=MunicipioRJ,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

RioDeJaneiro<- read_municipality(code_muni = 3304557,year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=RioDeJaneiro,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

4.5 Regiões Imediatas

As regiões geográficas imediatas constituem a divisão geográfica regional do país, segundo a composição elaborada pelo Instituto Brasileiro de Geografia e Estatística (IBGE).

São agrupamentos de municípios que têm como principal referência a rede urbana e possuem um centro urbano local como base, mediante a análise do IBGE.

Para sua elaboração, foram levadas em consideração a conexão de cidades próximas através de relações de dependência e deslocamento da população em busca de bens, prestação de serviços e trabalho.

Foram instituídas em 2017 para a atualização da divisão regional brasileira e correspondem a uma revisão das antigas microrregiões, que estavam em vigor desde o quadro criado em 1989. Essa configuração deve ser utilizada para fins de planejamento e estimativas

Immediate<- read_immediate_region(code_immediate = "all",year=2020,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Immediate,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

4.6 Regiões Intermediárias

As regiões geográficas intermediárias assim como as imediatas também constituem a divisão geográfica regional do país, segundo a composição elaborada pelo Instituto Brasileiro de Geografia e Estatística (IBGE).

São agrupamentos de regiões imediatas que são articuladas através da influência de uma metrópole, capital regional ou centro urbano representativo dentro do conjunto.

Foram instituídas em 2017 para a atualização da divisão regional brasileira e correspondem a uma revisão das antigas macrorregiões, que estavam em vigor desde o quadro criado em 1989. Essa configuração deve ser utilizada para fins de planejamento e estimativas.

Intermediate<- read_intermediate_region(code_intermediate = "all",year=2020,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Intermediate,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

4.7 Regiões de Saúde

As Regiões de Saúde são formadas por municípios fronteiriços que compartilham identidades culturais, econômicas e sociais, redes de comunicação e infraestrutura de transportes. A finalidade dessas regiões é integrar a organização, o planejamento e a execução de ações e serviços de saúde.

Mecanismo interfederativo de gestão da saúde, esses territórios vizinhos, de circulação e vivências em comum entre populações, têm entre seus objetivos a garantia do acesso resolutivo da população à saúde, em tempo oportuno e com qualidade, incluindo ações e serviços de promoção, proteção e recuperação, organizados em Redes de Atenção à Saúde (RAS), assegurando a integralidade do SUS.

Dependendo do fenômeno de interesse a ser estudado, as regiões de saúde podem ser utilizadas em duas versões como pode ser visto na sequência:

MicroSaude<- read_health_region(macro=F,year=2013,simplified = T, showProgress = F)
ggplot()+geom_sf(data=MicroSaude,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

MacroSaude<- read_health_region(macro=T,year=2013,simplified = T, showProgress = F)
ggplot()+geom_sf(data=MacroSaude,fill="#2D3E50", color="orange")+ 
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

4.8 Outras Unidades Geográficas

SETORES CENSITÁRIOS DO RIO DE JANEIRO

\[\\[0.1in]\]

REGIÃO SEMIÁRIDA BRASILEIRA

\[\\[0.1in]\]

BIOMAS BRASILEIROS

4.9 Como adicionar uma label

Para escrever alguma informação nos polígonos fechados, basta acrescentar a função geom_sf_text, conforme o exemplo abaixo:

IntermediateRJ<- read_intermediate_region(code_intermediate = 33,year=2020,simplified = T, showProgress = F)
ggplot()+geom_sf(data=IntermediateRJ,fill="#2D3E50", color="orange")+
  geom_sf_text(data = IntermediateRJ, aes(label = name_intermediate),color="black",size=3)+
  theme_bw()+
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank(),
        axis.title.y=element_blank(),
        axis.text.y=element_blank(), 
        axis.ticks.y=element_blank())

5 Atividades

  1. Criar o shapefile dos municípios de Minas Gerais e representar em um mapa.
  2. Criar o shapefile do município de Belo Horizonte e representar em um mapa.
  3. Criar o shapefile do município de Niterói e representar em um mapa.
  4. Criar o shapefile das regiões intermediárias de Minas Gerais e representar em um mapa.
  5. Escolha alguma outra função do pacote geobr e represente seu shapefile.

6 Referências

[1] Druck, S.; Carvalho, M.S.; Câmara, G.; Monteiro, A.V.M. (eds) “Análise Espacial de Dados Geográficos”. Brasília, EMBRAPA, 2004 (ISBN: 85-7383-260-6).

[2] https://cran.r-project.org/web/packages/geobr/index.html