Distribuição espacial de focos de incêndio por meio de processos pontuais: da teoria à prática no estado de Mato Grosso

Universidade Estadual da Paraíba - UEPB
Centro de Ciências e Tecnologia - CCT
Departamento de Estatística

Lucas Barboza de Araújo
Bolsista de Iniciação Científica - Apoio FAPESQ-PB

Ricardo Alves de Olinda
Orientador de Iniciação Científica - Apoio FAPESQ-PB

Introdução

Os pontos críticos de incêndio correspondem às áreas onde foram registrados focos ao longo do período analisado. A identificação desses pontos permite avaliar sua distribuição no espaço e compreender padrões de concentração ou dispersão.

No estado de Mato Grosso, que abrange porções da Amazônia, do Cerrado e do Pantanal, a análise espacial dos focos possibilita observar como esses registros se distribuem entre diferentes regiões do território. Esse mapeamento constitui uma etapa fundamental para caracterizar a dinâmica espacial dos incêndios no estado.

Dessa forma, o presente estudo concentra-se na localização e na estrutura espacial dos focos detectados, buscando descrever sua configuração e eventuais padrões observados ao longo da área analisada.

Objetivo

Este estudo tem como objetivo investigar os padrões e tendências dos incendios no estado do Mato Grosso no ano de 2025. O objetivo é identificar áreas de risco e compreender as dinamicas que contribuem para o aumento dos incêndios, tendo em conta aspectos ambientais, socioeconômicos e climáticos.

Importação dos pacotes necessários para a análise

Código
pacman::p_load("dplyr",
               "geobr",
               "sp",
               "sf",
               "spatstat",
               "ggplot2",
               "ggspatial",
               "leaflet",
               "leaflet.extras",
               "knitr",
               "kableExtra",
               "rmapshaper")

Base de dados

A base de dados utilizada neste estudo foi obtida a partir do projeto BDQueimadas, mantido pelo Instituto Nacional de Pesquisas Espaciais (INPE). O conjunto de dados contempla todos os focos de incêndio registrados no estado de Mato Grosso entre 1º de janeiro e 21 de novembro de 2025, sendo dividido em dois semestres para fins de análise.

Cada base contém as colunas Município, Latitude e Longitude, correspondentes à localização de cada ocorrência registrada. O primeiro semestre reúne 3.538 observações, enquanto o segundo semestre conta com 7.293 registros.

Baixar dados do 1° semestre | Baixar dados do 2° semestre

Código
semestre1 <- read.csv("dados/semestre_1.csv") %>% 
  select(Municipio, Bioma, Latitude, Longitude)
semestre2 <- read.csv("dados/semestre_2.csv") %>% 
  select(Municipio, Bioma, Latitude, Longitude)

head(semestre1)
Código
head(semestre2)

Região de Estudo

O estado do Mato Grosso é subdividido em 5 regiões intermediárias e possui 141 municípios como visto no mapa a seguir.

Código
shape_mun <- geobr::read_municipality(code_muni = "MT", year = 2022) %>%
  st_transform(crs = 31982) %>%
  st_geometry() %>%
  rmapshaper::ms_simplify(keep = 0.05, keep_shapes = TRUE)
Código
shape_inter <- read_intermediate_region(year = 2020) %>%
  filter(code_state == 51) %>%
  st_transform(crs = 31982)
Código
regs <- unique(shape_inter$name_intermediate)

paleta_inter <- c(
  "#1f77b4",
  "#ff7f0e",
  "#2ca02c",
  "#d62728",
  "#9467bd"
)

names(paleta_inter) <- regs

ggplot() +
  geom_sf(data = shape_inter, lwd = .7, aes(fill = name_intermediate)) +
  geom_sf(data = shape_mun, lwd = 0.1, fill = NA) +
  annotation_scale(location = "bl") +
  annotation_north_arrow(
    location = "tr",
    style = north_arrow_fancy_orienteering
  ) +
  scale_fill_manual(values = paleta_inter, name = "Região Intermediária") +
  theme_void() +
  theme(
    legend.position = "right",
    legend.title = element_text(size = 11),
    legend.text = element_text(size = 9)
  )

Um pouco da história…

Um exemplo pioneiro, onde intuitivamente se incorporou a categoria espaço às análises realizadas, foi realizado no século XIX por John Snow.



Em 1910 Smith estudou a disposição de parcelas no campo, em experimentos de rendimento de variedade de milho.

Em 1913 Montgomery preocupado com o efeito de nitrogênio no rendimento de variedade de trigo, fez um experimento com 224 parcelas, nas quais ele mediu o rendimento de grão.

Em 1930 a era Fisher (estação experimental em Rothamisted - Inglaterra), desprezando assim as coordenadas geográficas do ponto amostral.



Só em 1951, na África do Sul, Krige constatou a presença da dependência espacial trabalhando com dados de concentração de ouro.



Por volta de 1963, Matheron baseando-se nessas observações, desenvolveu um teoria, a qual ele chamou de Teoria das Variáveis Regionalizadas.



Em 1970, Tobler criou um conceito chave na compreensão e análise dos fenômenos espaciais que é a dependência espacial, a qual, é chamada de primeira lei da geografia: todas as coisas são parecidas, no entanto, coisas mais próximas se parecem mais que coisas mais distantes

Arquitetura de Sistemas de Informação Geográfica; Geometrias:

Ponto2D, Amostra e Polígono e Representação Geométrica de Grade Regular



Estatística Espacial

A análise espacial pode ser definida como uma técnica que busca descrever os padrões existentes nos dados espaciais e estabelecer, preferencialmente, de forma quantitativa, os relacionamentos entre as diversas variáveis geográficas.

Em geral, o problema na análise espacial considera três tipos de dados:

Dados de Área: São fenômenos associados aos dados localizados em pontos específicos no espaço. Normalmente, esses dados são agregados em unidades de análises. Ex.: setores censitários, municípios e microregiões.

Taxa do número de casos notificados por Tuberculose no estado da Paraíba

Dados de Superfícies Contínuas: são fenômenos que se distribuem continuamente em uma região. Ex.: medidas de concentração de um elemento químico no solo.



Processos Pontuais

Os processos pontuais são fenômenos que ocorrem em locais específicos, representados por pontos com coordenadas precisas. Eles são utilizados para modelar e analisar a distribuição e a intensidade de eventos em um espaço contínuo, como incêndios ou pontos de doenças. Esses processos se caracterizam pela localização dos pontos e pela relação entre eles, permitindo identificar padrões de comportamento, os quais podem ser agrupados, regulares ou aleatórios. Esses padrões ajudam a compreender a distribuição espacial dos eventos e a identificar fatores que podem influenciar sua ocorrência.

Distribuição dos Focos de Incêndio

A distribuição refere-se à forma como os pontos estão organizados no espaço, representando a ocorrência de focos de incêndio. Cada ponto está vinculado a um local específico (longitude e latitude) no estado do Mato Grosso, onde ocorre um incêndio.

Os incêndios são um problema crítico em algumas regiões do estado do Mato Grosso, com Nova Ubiratã e Nova Maringa como exemplos de municípios que enfrentaram alta concentração de focos ao longo dos dois semestre de 2025.

Estimador de Kolmogorov Smirnov

A intensidade estimada dos pontos, também conhecida como lambda (λ), é o número médio de pontos por unidade de área. Dá uma ideia da densidade de eventos (neste caso, focos de incêndio) distribuídos espacialmente no espaço analisado e é dada pela fórmula geral:

\[ \hat{\lambda}_t(x) = \frac{1}{\tau^2}\sum_{i=1}^{n} k\!\left( \frac{h(x_i,x)}{\tau} \right),\quad h(x_i,x) \le \tau \]

no qual,

  • \(\hat{\lambda}_t(x)\): É a estimativa da intensidade no ponto x no tempo t. A intensidade pode ser interpretada como a densidade esperada de eventos ao redor de x.
  • \(\tau\): Representa o parâmetro de escala (ou largura da janela). Define o limite de distância espacial até o qual os pontos \(x_i\) ao redor do ponto x são considerados na soma. Quanto maior for \(\tau\), maior será a área de influência do ponto x.
  • \(\sum_{i=1}^{n}\): É a soma de todos os n pontos de dados (ou eventos) que estão a uma distância \(\tau\) de x.
  • \(k\left( \frac{h(x_i,x)}{\tau} \right)\): O termo k é a função núcleo, que determina o peso dado a cada ponto \(x_i\) em função de sua distância ao ponto x. A função do núcleo pode ser gaussiana e \(\frac{h(x_i,x)}{\tau}\) ajusta a distância \(h(x_i,x)\) de acordo com o parâmetro de escala \(\tau\).

O teste de Kolmogorov-Smirnov (KS) foi realizado para avaliar se os focos de incêndio em 2025 seguem um processo de Poisson homogêneo, o que implicaria que os eventos se distribuem de forma totalmente aleatória no espaço ao longo das coordenadas ‘x’ e ‘y’.

A seguir, detalham-se as hipóteses a serem testadas:

  • Hipótese nula \((H_0)\): Os focos de incêndio se distribuem aleatoriamente no espaço ao longo da coordenada, seguindo um processo de Poisson homogêneo.
  • Hipótese alternativa \((H_1)\): Os focos de incêndio não se distribuem aleatoriamente no espaço ao longo da coordenada, o que indica a presença de padrões espaciais.

O teste de Kolmogorov-Smirnov aplicados para as coordenadas X e Y em ambos semestres de 2025, com estatísticas D elevadas e p-valores bem inferiores a 0.05, aponta para uma diferença significativa em relação à distribuição aleatória, o que rejeita a hipótese de Aleatoriedade Espacial Completa.

Teste de Quadrantes ou Qui-Quadrado

Dado um padrão de pontos, a primeira pergunta geralmente é se existe alguma evidência que permita rejeitar a hipótese nula de aleatoriedade espacial completa (CSR). Um método simples usado para testar a CSR é o teste \(\chi^2\) baseado em contagens de quadrantes.

O método dos quadrantes divide a região de estudo em \(r\) linhas e \(c\) colunas, que definem \(m = rc\) sub-regiões ou quadrantes não sobrepostos de igual área. Este método se baseia no fato de que, segundo o método CSR, o número esperado de observações dentro de qualquer região de tamanho igual é o mesmo. Seja \(n\) o número de pontos observados, \(m\) o número de quadrantes de igual tamanho e ni o número de pontos no quadrante \(i\). O número esperado de pontos em cada quadrante é \(n* = n/m\). A estatística de teste é calculada como:

\[\chi^2 = \sum_{i=1}^{n} \frac{(observado_i - esperado)^2}{esperado} = \sum_{i=1}^{n} \frac{(n_i - n^*)^2}{n^*}\]

Pode-se demonstrar que, no âmbito da CSR, a estatística \(\chi^2\) tem uma distribuição \(\chi^2\) com \(m−1\) graus de liberdade. O método de quadrantes avalia se a CSR é razoável comparando o valor observado da estatística \(\chi^2\) com a distribuição \(\chi^2\) com \(m−1\) graus de liberdade, onde \(m\) é o número de quadrantes.

A função quadratcount() do spatstat divide a janela que contém o padrão de pontos em \(nx × ny\) quadrados ou mosaicos retangulares de grade de mesmo tamanho e conta a quantidade de pontos em cada quadrado. Se a janela não for um retângulo, os quadrados se intersectam com a janela.

Aqui apresentamos alguns exemplos que utilizam quadrat.test() para testar hipóteses com cada um dos possíveis valores do argumento alternative. Especificamente, utilizamos

  • hipotese alternativa = two.sided testa a hipótese \(H_0: CSR\) vs. \(H_1:\) regular ou agrupado;

  • hipotese alternativa = regular testa a hipótese \(H_0: CSR\) vs. \(H_1: regular\)

  • hipotese alternativa = agrupado testa a hipótese \(H_0: CSR\) vs. \(H_1: agrupado\)

Em cada um dos exemplos, o p-valor é calculado como a probabilidade de se obter uma estatística de teste tão extrema ou mais extrema que a observada na direção da hipótese alternativa, assumindo que a hipótese nula é verdadeira. Se o p-valor calculado for menor que o nível de significância α, rejeitaríamos a hipótese nula. Caso contrário, não poderíamos rejeitar a hipótese nula.

Para testar \(H_0:CSR\) contra \(H_1:regular\), utilizamos a alternativa = “regular”. Se o padrão for regular, a estatística \(\chi^2\) observada estará próxima de 0. Em seguida, o p-valor é calculado como a área à esquerda da \(\chi^2\) observada.

Para testar \(H_0: CSR\) contra \(H_1: agrupado\), utilizamos a alternativa = “agrupado”. Se o padrão estiver agrupado, a estatística \(\chi^2\) observada será grande e o p-valor é calculado como a área à direita do \(\chi^2\) observado.

Por fim, testamos \(H0: CSR\) vs. \(H_1:\) regular ou agrupado usando a alternativa de valor padrão = “two.sided”. Se o padrão for regular ou agrupado, a estatística \(\chi^2\) observada será próxima de 0 ou grande. O p-valor é calculado como 2 vezes o menor entre a área à esquerda da \(\chi^2\) observada e a área à direita da \(\chi^2\) observada.

Função K de Ripley

A função \(K\), também chamada de Função Bivariada de Ripley, é utilizada para analisar a distribuição de pontos em diferentes distâncias, permitindo verificar a uniformidade dessa distribuição. Esta função é especialmente sensível a distâncias maiores. Para realizar essa análise, desenham-se círculos de raio \(h\) em vários locais e calcula-se a média dos pontos que se encontram dentro desses círculos. A fórmula da função \(K\) é expressa da seguinte maneira:

\[ \hat{K}(h) = \frac{A}{n^2} \sum_{i=1}^{n} \sum_{j = 1, j\neq i}^{n} \frac{I_h(d_{ij})}{w_{ij}}\]

no qual,

  • \(A\) representa a área da região analisada;
  • \(I_h(d_{ij})\) é uma função indicadora que assume o valor 1 quando a distância \(d_{ij}\) é menor ou igual a \(h\) e 0 caso contrário;
  • \(w_{ij}\) corresponde à proporção da circunferência dos círculos centrados nos pontos \(i\) que se encontra dentro da área do círculo.

Se a linha estimada estiver acima da linha teórica, significa que os pontos estão agrupados em distâncias menores; se estiver abaixo, os pontos estão mais espalhados.

Os gráficos a seguir sugerem que os pontos (pontos críticos de incêndio) estão significativamente agrupados ao longo de toda a distância analisada. Em outras palavras, há evidências de que os focos de incêndio não se distribuem aleatoriamente, mas sim se concentram em determinadas áreas.

Modelagem dos dados

Mapas Dinâmicos

Código
shape_leaflet <- st_transform(shape_mun, crs = 4326)

Conclusão

Os focos de queimadas no estado de Mato Grosso constituem uma preocupação ambiental recorrente, refletindo a complexa interação entre expansão agropecuária, condições climáticas e gestão dos recursos naturais. Inserido no contexto dos biomas Amazônia, Cerrado e Pantanal, o estado apresenta elevada vulnerabilidade ao fogo, especialmente durante períodos de estiagem prolongada. A prática da queima, ainda utilizada para manejo de áreas agrícolas e renovação de pastagens, exerce impacto direto sobre a biodiversidade, a qualidade do solo e a saúde das populações locais.

No ano de 2025, a análise dos focos de queimadas realizada de forma semestral evidenciou um aumento relevante tanto na frequência quanto na intensidade dos incêndios. Esses eventos estiveram associados não apenas à expansão das atividades agrícolas, mas também à combinação de fatores climáticos adversos, como déficit hídrico persistente e temperaturas elevadas, que aumentam a inflamabilidade da vegetação. A ocorrência de queimadas contribui para a emissão de grandes quantidades de gases de efeito estufa, intensificando o desequilíbrio climático regional e reduzindo a qualidade do ar.

A análise espacial revelou padrões claros de agrupamento de focos de queimadas, indicando que os eventos não ocorreram de forma aleatória, mas concentraram-se em regiões específicas do estado, principalmente áreas de transição entre fronteira agrícola e vegetação nativa. Esse resultado reforça a necessidade de monitoramento direcionado e políticas públicas voltadas para áreas críticas.

Compreender os padrões e determinantes das queimadas é fundamental para aprimorar o monitoramento, a prevenção e o controle desses eventos. Além disso, é essencial promover práticas agropecuárias sustentáveis e ampliar a conscientização da população sobre a importância da conservação ambiental. Tais ações são decisivas para mitigar os impactos das queimadas em Mato Grosso e garantir a integridade dos ecossistemas e das comunidades que deles dependem.

Referências

Grupo de Estudos e Pesquisa em Agricultura de Precisão (GEPAG). Análise de Processos Pontuais Marcados Aplicados às Características Genéticas em Árvores. 2023. Acesso em: 24 set. 2024. Disponível em: https://www.fca.unesp.br/Home/Instituicao/Departamentos/CienciadoSolo/gepag/2.analise-de-processos-pontuais-marcados-aplicados-as-caracteristicas-geneticas-em-arvores.pdf.

BERTOLLA, J. M. et al. Processos pontuais aplicados ao estudo da distribuição espacial de enfermidades na Área urbana da cidade de rio claro, sp. Revista [da Estatística, UFOP], 2021. Acessado em: 24 set. 2024. Disponível em: https://repositorio.unesp.br/server/api/core/bitstreams/4052e41a-fe27-4a92-bdc2-f75ab373b297/content.

VALTER, L. Processos Pontuais. 2018. Acessado em: 24 de setembro de 2024. Disponível em: https://rpubs.com/ValterL/PP01.

Moraga, Paula. (2023). Spatial Statistics for Data Science: Theory and Practice with R. Chapman & Hall/CRC Data Science Series. ISBN 9781032633510