library(moments)
library(knitr)
library(ggplot2)
library(tibble)
library(tidyr)

data = read.csv("historico_regiao_norte.csv")
data = data[nchar(data$X) == 4, ]        
data$Ano = as.integer(data$X)
data$X = NULL
data = data[, !(names(data) %in% c("Ano", "Total"))]  

Introdução

Este relatório apresenta uma análise exploratória do banco de dados contendo registros anuais de focos de queimadas na região Norte do Brasil. Os dados foram obtidos a partir de uma base pública e abrangem o período de 1998 a 2025.

Especificação da Base de Dados

A base analisada contém o número de focos de queimadas registrados mensalmente em cada ano. A fonte original dos dados é o Programa Queimadas do Instituto Nacional de Pesquisas Espaciais (INPE), amplamente utilizado em pesquisas ambientais.

Análise Descritiva:

- Tabela de Valor médio de focos de queimadas no mês.

media_df = tibble(
  Mês = names(data),
  Média = round(sapply(data, mean, na.rm = TRUE))
)
kable(media_df, caption = "- Média por mês (1998 a 2025)")
- Média por mês (1998 a 2025)
Mês Média
Janeiro 1181
Fevereiro 656
Março 788
Abril 412
Maio 700
Junho 1576
Julho 5362
Agosto 22965
Setembro 27762
Outubro 14030
Novembro 9995
Dezembro 4430

1. Alta temporada de queimadas:

  • Agosto e setembro são os meses com mais focos de queimadas, com médias altíssimas (acima de 22 mil e até 27 mil).
  • Esses meses correspondem ao período mais seco da região Norte, o que favorece queimadas.

2. Meses com menos queimadas:

  • Abril, fevereiro e maio têm as menores médias, com menos de 1.000 focos.
  • Tal fato se dar por serem meses com mais chuvas.

3. Transição:

  • Junho e julho mostram crescimento gradual na média de queimadas, iniciando a estação crítica.
  • Novembro e dezembro ainda mantêm números altos, embora inferiores aos picos.

- Gráfico de média (para uma melhor visualização)

# Gráfico de média
media_df = data.frame(
  Mes = names(data),
  Media = sapply(data, mean, na.rm = TRUE)
)

media_df$Mes = factor(media_df$Mes, levels = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto", "Setembro", "Outubro",                                           "Novembro", "Dezembro"))

ggplot(media_df, aes(x = Mes, y = Media)) +
  geom_col(fill = "blue", color = "black") +
  labs(title = "Média Mensal de Focos de Queimadas",
       x = "Mês", y = "Média de Focos") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • Baixa incidência (menos de 1.000): Fevereiro, Março, Abril, Maio
  • Média incidência (1.000 a 5.000): Janeiro, Junho, Dezembro
  • Alta incidência (acima de 5.000): Julho, Agosto, Setembro, Outubro, Novembro

- Tabela de Desvios Padrão

desvio_df = tibble(
  Mês = names(data),
 `Desvio Padrão` = round(sapply(data, sd, na.rm = TRUE))
)
kable(desvio_df, caption = "- Desvio padrão por mês (1985 a 2025)")
- Desvio padrão por mês (1985 a 2025)
Mês Desvio Padrão
Janeiro 978
Fevereiro 529
Março 589
Abril 260
Maio 403
Junho 749
Julho 3433
Agosto 11514
Setembro 13381
Outubro 4757
Novembro 4463
Dezembro 2803
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))  

desvio_df = data.frame(
  Mês = factor(meses, levels = ordem_meses),
  DesvioPadrão = sapply(data[ , meses], sd, na.rm = TRUE)
)

ggplot(desvio_df, aes(x = Mês, y = DesvioPadrão)) +
  geom_col(fill = "blue", color = "black") +
  theme_minimal() +
  labs(
    title = "Desvio Padrão de Focos de Queimada por Mês",
    x = "Mês",
    y = "Desvio Padrão"
  ) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

- Tabela de Assimetria

desvio_df = tibble(
  Mês = names(data),
  Assimetria = sapply(data, skewness, na.rm = TRUE)
)
kable(desvio_df, digits = 2, caption = "- Assimetria por mês (1985 a 2025)")
- Assimetria por mês (1985 a 2025)
Mês Assimetria
Janeiro 1.78
Fevereiro 2.15
Março 1.58
Abril 2.12
Maio 0.55
Junho -0.32
Julho 1.26
Agosto 0.71
Setembro 0.57
Outubro -0.13
Novembro 0.01
Dezembro 1.13

- Gráfico de Assimetria

ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))

assimetria_df = data.frame(
  Mês = factor(meses, levels = ordem_meses),
  Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)

ggplot(assimetria_df, aes(x = Mês, y = Assimetria)) +
  geom_col(fill = "blue", color = "black") +
  theme_minimal() +
  labs(
    title = "Assimetria dos Focos de Queimada por Mês",
    x = "Mês",
    y = "Coeficiente de Assimetria"
  ) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

- Boxplot

Um boxplot é uma forma gráfica de mostrar a distribuição de dados, destacando:

  • A mediana (linha dentro da caixa),
  • O primeiro e o terceiro quartil (limites da caixa),
  • Os “bigodes” (extremos que não são outliers),
  • E os outliers (pontos fora do padrão)
boxplot(d, main="Boxplot Mensal de Focos de Queimada", las=2, col=rainbow(12))

Análise do boxplot

  • Meses como agosto e setembro possuem as maiores quantidades de focos, com valores que ultrapassam 50.000 em alguns anos (veja a altura dos boxplots azuis escuros).
  • Julho e outubro também apresentam muitos focos, mas em menor intensidade.
  • Janeiro a maio têm níveis muito baixos, quase insignificantes.
  • Junho começa a apresentar aumento.
  • Novembro e dezembro já mostram queda, indicando o fim do período crítico.

- Resumo dos dados em forma de tabela

ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho","Julho", "Agosto", "Setembro", "Outubro", "Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))

tabela_medidas = tibble(
  Mês = meses,
  Média = round(sapply(data[ , meses], mean, na.rm = TRUE)),
  Mediana = round(sapply(data[ , meses], median, na.rm = TRUE)),
  `Desvio Padrão` = round(sapply(data[ , meses], sd, na.rm = TRUE)),
  Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)

kable(tabela_medidas, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
Medidas de Tendência Central e Dispersão por Mês
Mês Média Mediana Desvio Padrão Assimetria
Janeiro 1181 893 978 1.78
Fevereiro 656 515 529 2.15
Março 788 610 589 1.58
Abril 412 400 260 2.12
Maio 700 674 403 0.55
Junho 1576 1688 749 -0.32
Julho 5362 5129 3433 1.26
Agosto 22965 20742 11514 0.71
Setembro 27762 24135 13381 0.57
Outubro 14030 13977 4757 -0.13
Novembro 9995 10130 4463 0.01
Dezembro 4430 3826 2803 1.13
  1. Média: Valor médio de focos de queimadas no mês.
  2. Mediana: Valor central quando os dados são ordenados.
  3. Desvio padrão: Indica o quanto os dados variam em relação à média. Quanto maior, maior a dispersão.
  4. Assimetria: Mede a simetria da distribuição dos dados.

Conclusão

A análise dos dados evidencia forte variação sazonal nas queimadas, com os meses de agosto e setembro concentrando a maioria dos focos. O desvio padrão elevado indica alta variabilidade interanual. A assimetria positiva na maioria dos meses sugere a ocorrência de anos com queimadas excepcionalmente altas.

Referência Bibliográfica