library(moments)    # Pacote usado para cálculo estatístico(assimetria e curtose)
library(ggplot2)    # Cria gráficos mais detalhados
library(tibble)     # Cria tabelas
library(knitr)      # Melhora a visualização das tabelas

data = read.csv("historico_regiao_norte.csv")    # Armazena os dados em "data"
data = data[nchar(data$X) == 4, ]    # Filtra somente os anos, ultizando 4 caracteres
data = data[, !(names(data) %in% c("X", "Ano", "Total"))]    # Removes as colunas que não foram usadas nos calculos feitos

Introdução

Este relatório apresenta uma análise exploratória do banco de dados contendo registros anuais de focos de queimadas na região Norte do Brasil. Os dados foram obtidos a partir de uma base pública e abrangem o período de 1998 a 2025. A fonte original dos dados é o Programa Queimadas do Instituto Nacional de Pesquisas Espaciais (INPE), amplamente utilizado em pesquisas ambientais.

Análise Descritiva:

- Tabela de Valor médio de focos de queimadas no mês.

media = tibble(    # Cria a tabela usando o pacote "tibble"
  Mês = names(data),    # Gera a coluna dos meses
  Média = round(sapply(data, mean, na.rm = TRUE))    # Aplica a função "mean" na coluna de média, arredondando os valores usando "round"
)
kable(media, caption = "- Média por mês (1998 a 2025)")    # Formata a tabela com o "knitr"
- Média por mês (1998 a 2025)
Mês Média
Janeiro 1181
Fevereiro 656
Março 788
Abril 412
Maio 700
Junho 1576
Julho 5362
Agosto 22965
Setembro 27762
Outubro 14030
Novembro 9995
Dezembro 4430

1. Alta temporada de queimadas:

  • Agosto e setembro são os meses com mais focos de queimadas, com médias altíssimas (acima de 22 mil e até 27 mil).
  • Esses meses correspondem ao período mais seco da região Norte, o que favorece queimadas.

2. Meses com menos queimadas:

  • Abril, fevereiro e maio têm as menores médias, com menos de 1.000 focos.
  • Tal fato se dar por serem meses com mais chuvas.

3. Transição:

  • Junho e julho mostram crescimento gradual na média de queimadas, iniciando a estação crítica.
  • Novembro e dezembro ainda mantêm números altos, embora inferiores aos picos.

- Gráfico de média

ordem_meses = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto", "Setembro", "Outubro", "Novembro", "Dezembro")    # Vetor com a ordem correta dos meses

# Tabela usada de base pro gráfico
media = tibble(
  Mes = names(data),
  Media = sapply(data, mean, na.rm = TRUE)
)

# Ultiza o vetor como um fator de ordem 
media$Mes = factor(media$Mes, levels = ordem_meses)

# Gera o gráfico usando "ggplot" com o a tabela "media"
ggplot(media, aes(x = Mes, y = Media)) +    # Define os eixos do gráfico
  geom_col(fill = "blue", color = "black") +    # Palheta de cores
  labs(title = "Média Mensal de Focos de Queimadas",
       x = "Mês", y = "Média de Focos") +    # Define o nome do titulo e dos eixos
  theme_minimal() +    # Tema para melhorar a visualização do gráfico
  theme(axis.text.x = element_text(angle = 45, hjust = 1))    # Ajusta a legenda do gráfico

  • Baixa incidência (menos de 1.000): Fevereiro, Março, Abril, Maio
  • Média incidência (1.000 a 5.000): Janeiro, Junho, Dezembro
  • Alta incidência (acima de 5.000): Julho, Agosto, Setembro, Outubro, Novembro

- Tabela de Desvios Padrão

desvio = tibble(    # Cria a tabela usando o "tibble"
  Mês = names(data),
 `Desvio Padrão` = round(sapply(data, sd, na.rm = TRUE))
  # "na.rm=TRUE para ignorar valores N/A
  # Dessa vez usando a função "sd" para calcular o desvio
)
kable(desvio, caption = "- Desvio padrão por mês (1985 a 2025)")  # Formata a tabela com o "knitr"
- Desvio padrão por mês (1985 a 2025)
Mês Desvio Padrão
Janeiro 978
Fevereiro 529
Março 589
Abril 260
Maio 403
Junho 749
Julho 3433
Agosto 11514
Setembro 13381
Outubro 4757
Novembro 4463
Dezembro 2803

1. Meses com baixa variabilidade:

  • Abril: 260
  • Maio: 403
  • Fevereiro: 529
  • Março: 589

Esses meses apresentam uma quantidade de focos de queimadas mais estável historicamente, com pouca variação de ano para ano.

2. Meses com moderada variabilidade:

  • Junho: 749
  • Janeiro: 978
  • Julho: 3433
  • Dezembro: 2803

Representam um ponto de transição, especialmente junho e julho, onde o desvio começa a aumentar. Julho marca o início do período de maior instabilidade.

3. Meses com alta variabilidade:

  • Agosto: 11.514
  • Setembro: 13.381
  • Outubro: 4757
  • Novembro: 4463

Setembro e agosto são os meses com maior desvio padrão, indicando que os focos de queimadas nesses meses variam muito de um ano para o outro. Isso sugere que fatores climáticos e humanos influenciam fortemente esses meses.

- Gráfico de Desvio Padrão

ordem_meses = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")    # Vetor com ordem dos meses correta 

desvio = tibble(    # Base do gráfico
  Mes = names(data),
  DesvioPadrão = sapply(data, sd, na.rm = TRUE)
)

desvio$Mes = factor(desvio$Mes, levels = ordem_meses)   # Usa o vetor como fator de ordem, para evitar a ordem alfabetica pré definida

ggplot(desvio, aes(x = Mes, y = DesvioPadrão)) +
  geom_col(fill = "blue", color = "black") +
  theme_minimal() +
  labs(
    title = "Desvio Padrão de Focos de Queimada por Mês",
    x = "Mês",
    y = "Desvio Padrão"
  ) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • O gráfico um pico acentuado entre agosto e setembro, coincidindo com o auge da estação seca na região Norte do Brasil, quando as queimadas são mais frequentes.

  • O padrão observado sugere uma sazonalidade intensa, com meses do meio do ano até o início do último trimestre apresentando maior instabilidade.

  • Essa informação é valiosa para políticas públicas e planejamento ambiental, pois mostra os períodos em que a variabilidade e o risco de queimadas são mais altos.

- Tabela de Assimetria

assimetria = tibble(    
  Mês = names(data),
  Assimetria = sapply(data, skewness, na.rm = TRUE)    # A função "skewness" serve para calcular a assimetria, ele vem do pacote "moments".
)

# digits = 2 limita os números da tabela a 2 casas decimais
kable(assimetria, digits = 2, caption = "- Assimetria por mês (1985 a 2025)")
- Assimetria por mês (1985 a 2025)
Mês Assimetria
Janeiro 1.78
Fevereiro 2.15
Março 1.58
Abril 2.12
Maio 0.55
Junho -0.32
Julho 1.26
Agosto 0.71
Setembro 0.57
Outubro -0.13
Novembro 0.01
Dezembro 1.13

1. Meses com alta assimetria positiva:

  • Fevereiro (2.15) e Abril (2.12) apresentam os maiores coeficientes de assimetria positiva.

Isso indica que, nesses meses, os valores de focos de queimadas geralmente são baixos, mas existem alguns picos extremos muito altos.

  • Janeiro (1.78) e Março (1.58) também seguem esse padrão, com distribuições fortemente assimétricas à direita.

2. Meses com assimetria moderada a leve:

  • Julho (1.26), Agosto (0.71), Setembro (0.57) e Dezembro (1.13) indicam distribuições ainda assimétricas, mas em menor grau.

Nesses meses, os dados mostram certa concentração à esquerda, com picos elevados ocasionais.

3. Meses com distribuição quase simétrica ou negativamente assimétrica:

  • Maio (0.55) ainda apresenta leve assimetria positiva, mas se aproxima mais da simetria.

  • Junho (-0.32), Outubro (-0.13) e Novembro (0.01) indicam dados mais simétricos.

Junho, com assimetria negativa, sugere a presença de valores extremos para a esquerda (alguns meses com número muito baixo de queimadas em comparação à média).

- Gráfico de Assimetria

ordem_meses = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")    # Vetor de ordem

# Base do gráfico
assimetria = tibble(
  Mes = names(data),
  Assimetria = sapply(data, skewness, na.rm = TRUE)
)

# Fator de ordem
assimetria$Mes = factor(assimetria$Mes, levels = ordem_meses)

# Gráfico
ggplot(assimetria, aes(x = Mes, y = Assimetria)) +
  geom_col(fill = "blue", color = "black") +
  theme_minimal() +
  labs(
    title = "Assimetria dos Focos de Queimada por Mês",
    x = "Mês",
    y = "Coeficiente de Assimetria"
  ) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Assimetria positiva (> 0): os dados têm cauda mais longa à direita (mais valores baixos e poucos muito altos).

Assimetria negativa (< 0): os dados têm cauda mais longa à esquerda (mais valores altos e poucos muito baixos).

Assimetria próxima de 0: distribuição aproximadamente simétrica.

  • Os meses do início do ano (janeiro-abril) tendem a ter mais variabilidade e distribuições com cauda longa à direita, sugerindo ocorrência esporádica de eventos extremos de queimadas em anos específicos.

  • Os meses do período crítico (agosto-setembro) apresentam maior concentração de valores, mas ainda assim com certo grau de assimetria positiva.

  • O fim do ano (outubro-dezembro) mostra comportamento mais estável, com assimetria próxima de zero, especialmente em novembro.

- Boxplot

Um boxplot é uma forma gráfica de mostrar a distribuição de dados, destacando:

  • A mediana (linha dentro da caixa),
  • O primeiro e o terceiro quartil (limites da caixa),
  • Os “bigodes” (extremos que não são outliers),
  • E os outliers (pontos fora do padrão)
# Cria uma boxplot com dados direto do "data"
boxplot(data, main="Boxplot Mensal de Focos de Queimada", las=2, col=rainbow(12))

Análise do boxplot

  • Meses como agosto e setembro possuem as maiores quantidades de focos, com valores que ultrapassam 50.000 em alguns anos (veja a altura dos boxplots azuis escuros).
  • Julho e outubro também apresentam muitos focos, mas em menor intensidade.
  • Janeiro a maio têm níveis muito baixos, quase insignificantes.
  • Junho começa a apresentar aumento.
  • Novembro e dezembro já mostram queda, indicando o fim do período crítico.

- Resumo dos dados em forma de tabela

# Gera a coluna dos meses direto do "data"
meses = names(data)

tabela = tibble(    # Cria a tabela
  Mês = meses,
  Média = round(sapply(data, mean, na.rm = TRUE)),    # Aplica separadamente as funções
  `Desvio Padrão` = round(sapply(data, sd, na.rm = TRUE)),
  Assimetria = sapply(data, skewness, na.rm = TRUE)
)

# digits = 2 limita os números da tabela a 2 casas decimais
kable(tabela, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
Medidas de Tendência Central e Dispersão por Mês
Mês Média Desvio Padrão Assimetria
Janeiro 1181 978 1.78
Fevereiro 656 529 2.15
Março 788 589 1.58
Abril 412 260 2.12
Maio 700 403 0.55
Junho 1576 749 -0.32
Julho 5362 3433 1.26
Agosto 22965 11514 0.71
Setembro 27762 13381 0.57
Outubro 14030 4757 -0.13
Novembro 9995 4463 0.01
Dezembro 4430 2803 1.13
  1. Média: Valor médio de focos de queimadas no mês.
  2. Desvio padrão: Indica o quanto os dados variam em relação à média. Quanto maior, maior a dispersão.
  3. Assimetria: Mede a simetria da distribuição dos dados.

Conclusão

A análise dos dados evidencia forte variação sazonal nas queimadas, com os meses de agosto e setembro concentrando a maioria dos focos. O desvio padrão elevado indica alta variabilidade interanual. A assimetria positiva na maioria dos meses sugere a ocorrência de anos com queimadas excepcionalmente altas.

Referência Bibliográfica