geobr (PARTE I)
1ª ESCOLA DE VERÃO
PROF. GUILHERME AUGUSTO VELOSO
UFF - 20, 22 E 24 DE MARÇO DE 2023
Compreender a distribuição espacial de dados oriundos de fenômenos ocorridos no espaço constitui hoje um grande desafio para a elucidação de questões centrais em diversas áreas do conhecimento, seja em saúde, no meio ambiente, em geologia, em agronomia, entre tantas outras.
Tais estudos vêm se tornando cada vez mais comuns, devido à disponibilidade de sistemas de informação geográfica com interfaces amigáveis.
Estes sistemas permitem a visualização espacial de variáveis como população de indivíduos, índices de qualidade de vida, vendas de empresa numa região ou a mortalidade por uma doença em determinados municípios.
Para tanto, basta dispor de um banco de dados e de uma base geográfica (como um mapa de municípios), e é possível apresentar um mapa colorido permitindo a visualização do padrão espacial do fenômeno.
Além da percepção visual da distribuição espacial do problema, é muito útil traduzir os padrões existentes com considerações objetivas e mensuráveis, como nos seguintes casos:
Epidemiologistas coletam dados sobre ocorrência de doenças: A distribuição dos casos de uma doença forma um padrão no espaço? Existe associação com alguma fonte de poluição? Evidência de contágio?
Deseja-se investigar se existe alguma concentração espacial na distribuição de roubos: Roubos que ocorrem em determinadas áreas estão correlacionados com características sócio-econômicas dessas áreas?
Geólogos desejam estimar a extensão de um depósito mineral em uma região a partir de amostras: Pode-se usar essas amostras para estimar a distribuição do mineral na região?
Deseja-se analisar uma região para fins de zoneamento agrícola: Como escolher as variáveis explicativas — solo, vegetação, geomorfologia — e determinar qual a contribuição de cada uma delas para definir em que local o tipo de cultura é mais adequado?
Todos esses problemas fazem parte da análise espacial de dados geográficos. A ênfase da análise espacial é mensurar propriedades e relacionamentos, levando em conta a localização espacial do fenômeno em estudo de forma explícita. Ou seja, a idéia central é incorporar o espaço à análise que se deseja fazer.
A taxonomia mais utilizada para caracterizar os problemas de análise espacial considera três tipos de dados:
São fenômenos expressos através de ocorrências identificadas como pontos localizados no espaço, denominados processos pontuais. São exemplos:
Nesse tipo de dado espacial, objeto de interesse é a propria localização espacial dos eventos em estudo. Por exemplo, será que a mortalidade por tuberculose, mesmo considerando os fatores de risco conhecidos, varia com o local de residência do paciente?
Os objetivos da análise de processos pontuais são
Como exemplo, a figura abaixo ilustra a aplicação das análises de padrões pontuais para o caso de mortalidade por causas externas em Porto Alegre, com os dados de 1996, realizada por Simone Santos e Christovam Barcellos, da FIOCRUZ.
A localização dos homicídios (vermelho), acidentes de trânsito (amarelo) e suicídios (azul) está mostrada na figura à esquerda. À direita, apresenta-se uma superfície para a intensidade estimada, que pode ser pensada como a “temperatura da violência”.
A superfície interpolada mostra um padrão de distribuição de pontos com uma forte concentração no centro da cidade e decrescendo em direção aos bairros mais afastados.
Estimadas a partir de um conjunto de amostras de campo, que podem estar regularmente ou irregularmente distríbuidas. Usualmente, este tipo de dado é resultante do levantamento de recursos naturais, e que incluem mapas geológicos, topográficos, ecológicos, fitogeográficos e pedológicos.
Para a análise de superfícies, o objetivo é reconstruir a superfície da qual se retirou e mediu as amostras. Como exemplo, considera-se a distribuição de perfis e amostras de solo para o estado de Santa Catarina e áreas próximas, e o mapa de distribuição espacial da variável saturação por bases, produzidos por Simone Bônisch, do INPE, e apresentados abaixo:
Como foi construído este mapa? As cruzes destacadas indicam a localização dos pontos de coleta de amostras do solo; a partir destas medidas, foi estimado um modelo de dependência espacial, que permitiu a interpolação da superfície apresentada no mapa.
Tratam-se de dados associados a levantamentos populacionais, como censos e estatísticas de saúde, e que originalmente se referem a indivíduos localizados em pontos específicos do espaço. Por razões, por exemplo, de confidencialidade, estes dados são agregados em unidades de análise, usualmente delimitadas por polígonos fechados (setores censitários, zonas de endereçamento postal, municípios).
Dentro dos polígonos fechados, supõe-se haver homogeneidade interna, ou seja, mudanças importantes só ocorrem nos limites. Nesse curso, trataremos apenas de dados de área. Nas próximas linhas, serão dados alguns exemplos motivacionais.
A distribuição dos casos de uma doença pode formar um padrão no espaço. Descrever o desenvolvimento de uma epidemia no espaço sugere formas de controlar e combater.
Caracterizando a localização de serviços de saúde: a demanda pelos serviços está sendo atendida adequadamente?
Poderia ser feita uma nova alocação geográfica de recursos que seja mais eficiente?
Há alguma associação entre a localização dos casos de uma doença e a posição de alguma fonte suspeita (rio, estação nuclear, fábrica,..)?
Os indicadores sóciodemográficos evidenciam as múltiplas realidades sociais presentes no País e contribuem para a formulação de políticas e programas que visem à melhoria das desigualdades encontradas, em consonância com as diferenças demográficas, epidemiológicas e socioeconômicas.
\[\\[0.1in]\]
\[\\[0.1in]\]
\[\\[0.1in]\]
A partir da divisão dos tipos de dados espaciais citada anteriormente, verifica-se que os problemas de análise espacial lidam, basicamente, com dados ambientais, socioeconômicos e epidemiológicos.
Em todos os casos, a análise espacial é composta por um conjunto de procedimentos encadeados cuja finalidade é a escolha de um modelo inferencial que considere explicitamente os relacionamentos espaciais presentes no fenômeno.
Em geral, o processo de modelagem é precedido de uma fase de análise descritiva exploratória, associada a apresentação visual dos dados sob forma de gráficos e mapas e a identificação de padrões de dependência espacial no fenômeno em estudo.
O minicurso “Análise descritiva espacial com o pacote
geobr” tem os seguintes objetivos:
Visão geral e funcionalidades do pacote
geobr presente no software
R;
Visualização com o pacote geobr de
diversas unidades geográficas brasileiras disponíveis
como municípios, estados, regiões de saúde, dentre outros;
Construção e customização de mapas coropléticos
com o pacote geobr;
Conceitos importantes de estatística espacial descritiva e exploratória;
Investigação de padrões de dependência espacial com os índices de correlação Moran e Lisa.
geobrUm shapefile é um formato de armazenamento
de dados para armazenar a posição, forma e atributos de feições
geográficas. O geobr é um pacote do R
que permite que os usuários acessem facilmente os
shapefiles do Instituto Brasileiro de
Geografia e Estatística (IBGE) e outros conjuntos oficiais de dados
espaciais do Brasil.
O pacote inclui uma ampla variedade de conjuntos de dados
geográficos como recursos simples, disponíveis em várias
escalas geográficas e por vários anos. O pacote
geobr foi desenvolvido por Rafael Henrique Moraes
Pereira, pesquisador do Instituto de Pesquisa Econômica
Aplicada (IPEA).
Mais informações sobre o pacote geobr podem ser
encontradas no CRAN geobr
ROTEIRO RCLOUD
1- Fazer o cadastro
2- Baixar o arquivo sf
e colocar no CLOUD
3- Instalar os pacotes classInt,DBI,magrittr,Rcpp,s2,units
4- Compilar o código
install.packages("sf_1.0-8.tar.gz",repos=NULL,type="source")
Para a execução da primeira parte desse curso, serão necessários os seguintes pacotes:
geobr: Permite o acesso aos
shapefiles de diferentes unidades geográficas
brasileiras.
ggplot2: Construção e customização
de mapas coropléticos.
Dessa forma, segue o código de instalação dos pacotes citados anteriormente:
if(!require(geobr)){ install.packages("geobr"); require(geobr)}
if(!require(ggplot2)){ install.packages("ggplot2"); require(ggplot2)}
Conforme mencionado, o pacote geobr trabalha com
diferentes unidades geográficas. Para cada unidade
geográfica de interesse, o pacote geobr tem uma
função diferente, dentre as seguintes:
Cada função acima gera o shapefile de uma unidade geográfica
e todas as funções possuem sintaxe similar que podem
ser verificadas com maiores detalhes no CRAN geobr.
Para trabalhar e manipular os dados envolvendo diferentes unidades geográficas brasileiras é extremamente útil codificá-las em números. Por exemplo:
A codificação de cidades e estados pode ser consultada no site IBGE. Já a codificação de regiões intermediárias e imediatas no site WIKIPEDIA
A seguir, seguem algumas unidades geográficas brasileiras e maiores detalhes:
Brasil<-read_country(year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Brasil,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
Regiao<-read_region(year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Regiao,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
Estado<-read_state(code_state="all",year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Estado,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
EstadoRJ<-read_state(code_state=33,year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=EstadoRJ,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
Municipio<- read_municipality(code_muni = "all",year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Municipio,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
MunicipioRJ<- read_municipality(code_muni = 33,year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=MunicipioRJ,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
RioDeJaneiro<- read_municipality(code_muni = 3304557,year=2018,simplified = T, showProgress = F)
ggplot()+geom_sf(data=RioDeJaneiro,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
As regiões geográficas imediatas constituem a divisão geográfica regional do país, segundo a composição elaborada pelo Instituto Brasileiro de Geografia e Estatística (IBGE).
São agrupamentos de municípios que têm como principal referência a rede urbana e possuem um centro urbano local como base, mediante a análise do IBGE.
Para sua elaboração, foram levadas em consideração a conexão de cidades próximas através de relações de dependência e deslocamento da população em busca de bens, prestação de serviços e trabalho.
Foram instituídas em 2017 para a atualização da divisão regional brasileira e correspondem a uma revisão das antigas microrregiões, que estavam em vigor desde o quadro criado em 1989. Essa configuração deve ser utilizada para fins de planejamento e estimativas
Immediate<- read_immediate_region(code_immediate = "all",year=2020,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Immediate,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
As regiões geográficas intermediárias assim como as imediatas também constituem a divisão geográfica regional do país, segundo a composição elaborada pelo Instituto Brasileiro de Geografia e Estatística (IBGE).
São agrupamentos de regiões imediatas que são articuladas através da influência de uma metrópole, capital regional ou centro urbano representativo dentro do conjunto.
Foram instituídas em 2017 para a atualização da divisão regional brasileira e correspondem a uma revisão das antigas macrorregiões, que estavam em vigor desde o quadro criado em 1989. Essa configuração deve ser utilizada para fins de planejamento e estimativas.
Intermediate<- read_intermediate_region(code_intermediate = "all",year=2020,simplified = T, showProgress = F)
ggplot()+geom_sf(data=Intermediate,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
As Regiões de Saúde são formadas por municípios fronteiriços que compartilham identidades culturais, econômicas e sociais, redes de comunicação e infraestrutura de transportes. A finalidade dessas regiões é integrar a organização, o planejamento e a execução de ações e serviços de saúde.
Mecanismo interfederativo de gestão da saúde, esses territórios vizinhos, de circulação e vivências em comum entre populações, têm entre seus objetivos a garantia do acesso resolutivo da população à saúde, em tempo oportuno e com qualidade, incluindo ações e serviços de promoção, proteção e recuperação, organizados em Redes de Atenção à Saúde (RAS), assegurando a integralidade do SUS.
Dependendo do fenômeno de interesse a ser estudado, as regiões de saúde podem ser utilizadas em duas versões como pode ser visto na sequência:
MicroSaude<- read_health_region(macro=F,year=2013,simplified = T, showProgress = F)
ggplot()+geom_sf(data=MicroSaude,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
MacroSaude<- read_health_region(macro=T,year=2013,simplified = T, showProgress = F)
ggplot()+geom_sf(data=MacroSaude,fill="#2D3E50", color="orange")+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
\[\\[0.1in]\]
\[\\[0.1in]\]
BIOMAS BRASILEIROS
Para escrever alguma informação nos polígonos
fechados, basta acrescentar a função geom_sf_text,
conforme o exemplo abaixo:
IntermediateRJ<- read_intermediate_region(code_intermediate = 33,year=2020,simplified = T, showProgress = F)
ggplot()+geom_sf(data=IntermediateRJ,fill="#2D3E50", color="orange")+
geom_sf_text(data = IntermediateRJ, aes(label = name_intermediate),color="black",size=3)+
theme_bw()+
theme(axis.title.x=element_blank(),
axis.text.x=element_blank(),
axis.ticks.x=element_blank(),
axis.title.y=element_blank(),
axis.text.y=element_blank(),
axis.ticks.y=element_blank())
geobr e
represente seu shapefile.[1] Druck, S.; Carvalho, M.S.; Câmara, G.; Monteiro, A.V.M. (eds) “Análise Espacial de Dados Geográficos”. Brasília, EMBRAPA, 2004 (ISBN: 85-7383-260-6).
[2] https://cran.r-project.org/web/packages/geobr/index.html