library(moments)
library(knitr)
library(ggplot2)
library(tibble)


data = read.csv("historico_regiao_norte.csv")
data = data[nchar(data$X) == 4, ]        
data$Ano = as.integer(data$X)
data$X = NULL
data = data[, !(names(data) %in% c("Ano", "Total"))]  

Introdução

Este relatório apresenta uma análise exploratória do banco de dados contendo registros anuais de focos de queimadas na região Norte do Brasil. Os dados foram obtidos a partir de uma base pública e abrangem o período de 1998 a 2025.

Especificação da Base de Dados

A base analisada contém o número de focos de queimadas registrados mensalmente em cada ano. A fonte original dos dados é o Programa Queimadas do Instituto Nacional de Pesquisas Espaciais (INPE), amplamente utilizado em pesquisas ambientais.

Análise Descritiva:

- Tabela de Valor médio de focos de queimadas no mês.

media_df = tibble(
  Mês = names(data),
  Média = round(sapply(data, mean, na.rm = TRUE))
)
kable(media_df, caption = "- Média por mês (1998 a 2025)")
- Média por mês (1998 a 2025)
Mês Média
Janeiro 1181
Fevereiro 656
Março 788
Abril 412
Maio 700
Junho 1576
Julho 5362
Agosto 22965
Setembro 27762
Outubro 14030
Novembro 9995
Dezembro 4430

1. Alta temporada de queimadas:

  • Agosto e setembro são os meses com mais focos de queimadas, com médias altíssimas (acima de 22 mil e até 27 mil).
  • Esses meses correspondem ao período mais seco da região Norte, o que favorece queimadas.

2. Meses com menos queimadas:

  • Abril, fevereiro e maio têm as menores médias, com menos de 1.000 focos.
  • Tal fato se dar por serem meses com mais chuvas.

3. Transição:

  • Junho e julho mostram crescimento gradual na média de queimadas, iniciando a estação crítica.
  • Novembro e dezembro ainda mantêm números altos, embora inferiores aos picos.

- Gráfico de média

media_df = data.frame(
  Mes = names(data),
  Media = sapply(data, mean, na.rm = TRUE)
)

media_df$Mes = factor(media_df$Mes, levels = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto", "Setembro", "Outubro",                                           "Novembro", "Dezembro"))

ggplot(media_df, aes(x = Mes, y = Media)) +
  geom_col(fill = "blue", color = "black") +
  labs(title = "Média Mensal de Focos de Queimadas",
       x = "Mês", y = "Média de Focos") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • Baixa incidência (menos de 1.000): Fevereiro, Março, Abril, Maio
  • Média incidência (1.000 a 5.000): Janeiro, Junho, Dezembro
  • Alta incidência (acima de 5.000): Julho, Agosto, Setembro, Outubro, Novembro

- Tabela de Desvios Padrão

desvio_df = tibble(
  Mês = names(data),
 `Desvio Padrão` = round(sapply(data, sd, na.rm = TRUE))
)
kable(desvio_df, caption = "- Desvio padrão por mês (1985 a 2025)")
- Desvio padrão por mês (1985 a 2025)
Mês Desvio Padrão
Janeiro 978
Fevereiro 529
Março 589
Abril 260
Maio 403
Junho 749
Julho 3433
Agosto 11514
Setembro 13381
Outubro 4757
Novembro 4463
Dezembro 2803

1. Meses com baixa variabilidade:

  • Abril: 260
  • Maio: 403
  • Fevereiro: 529
  • Março: 589

Esses meses apresentam uma quantidade de focos de queimadas mais estável historicamente, com pouca variação de ano para ano.

2. Meses com moderada variabilidade:

  • Junho: 749
  • Janeiro: 978
  • Julho: 3433
  • Dezembro: 2803

Representam um ponto de transição, especialmente junho e julho, onde o desvio começa a aumentar. Julho marca o início do período de maior instabilidade.

3. Meses com alta variabilidade:

  • Agosto: 11.514
  • Setembro: 13.381
  • Outubro: 4757
  • Novembro: 4463

Setembro e agosto são os meses com maior desvio padrão, indicando que os focos de queimadas nesses meses variam muito de um ano para o outro. Isso sugere que fatores climáticos e humanos influenciam fortemente esses meses.

- Gráfico de Desvio Padrão

ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))  

desvio_df = data.frame(
  Mês = factor(meses, levels = ordem_meses),
  DesvioPadrão = sapply(data[ , meses], sd, na.rm = TRUE)
)

ggplot(desvio_df, aes(x = Mês, y = DesvioPadrão)) +
  geom_col(fill = "blue", color = "black") +
  theme_minimal() +
  labs(
    title = "Desvio Padrão de Focos de Queimada por Mês",
    x = "Mês",
    y = "Desvio Padrão"
  ) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

  • O gráfico um pico acentuado entre agosto e setembro, coincidindo com o auge da estação seca na região Norte do Brasil, quando as queimadas são mais frequentes.

  • O padrão observado sugere uma sazonalidade intensa, com meses do meio do ano até o início do último trimestre apresentando maior instabilidade.

  • Essa informação é valiosa para políticas públicas e planejamento ambiental, pois mostra os períodos em que a variabilidade e o risco de queimadas são mais altos.

- Tabela de Assimetria

desvio_df = tibble(
  Mês = names(data),
  Assimetria = sapply(data, skewness, na.rm = TRUE)
)
kable(desvio_df, digits = 2, caption = "- Assimetria por mês (1985 a 2025)")
- Assimetria por mês (1985 a 2025)
Mês Assimetria
Janeiro 1.78
Fevereiro 2.15
Março 1.58
Abril 2.12
Maio 0.55
Junho -0.32
Julho 1.26
Agosto 0.71
Setembro 0.57
Outubro -0.13
Novembro 0.01
Dezembro 1.13

1. Meses com alta assimetria positiva:

  • Fevereiro (2.15) e Abril (2.12) apresentam os maiores coeficientes de assimetria positiva.

Isso indica que, nesses meses, os valores de focos de queimadas geralmente são baixos, mas existem alguns picos extremos muito altos.

  • Janeiro (1.78) e Março (1.58) também seguem esse padrão, com distribuições fortemente assimétricas à direita.

2. Meses com assimetria moderada a leve:

  • Julho (1.26), Agosto (0.71), Setembro (0.57) e Dezembro (1.13) indicam distribuições ainda assimétricas, mas em menor grau.

Nesses meses, os dados mostram certa concentração à esquerda, com picos elevados ocasionais.

3. Meses com distribuição quase simétrica ou negativamente assimétrica:

  • Maio (0.55) ainda apresenta leve assimetria positiva, mas se aproxima mais da simetria.

  • Junho (-0.32), Outubro (-0.13) e Novembro (0.01) indicam dados mais simétricos.

Junho, com assimetria negativa, sugere a presença de valores extremos para a esquerda (alguns meses com número muito baixo de queimadas em comparação à média).

- Gráfico de Assimetria

ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))

assimetria_df = data.frame(
  Mês = factor(meses, levels = ordem_meses),
  Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)

ggplot(assimetria_df, aes(x = Mês, y = Assimetria)) +
  geom_col(fill = "blue", color = "black") +
  theme_minimal() +
  labs(
    title = "Assimetria dos Focos de Queimada por Mês",
    x = "Mês",
    y = "Coeficiente de Assimetria"
  ) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Assimetria positiva (> 0): os dados têm cauda mais longa à direita (mais valores baixos e poucos muito altos). Assimetria negativa (< 0): os dados têm cauda mais longa à esquerda (mais valores altos e poucos muito baixos). Assimetria próxima de 0: distribuição aproximadamente simétrica.

  • Os meses do início do ano (janeiro-abril) tendem a ter mais variabilidade e distribuições com cauda longa à direita, sugerindo ocorrência esporádica de eventos extremos de queimadas em anos específicos.

  • Os meses do período crítico (agosto-setembro) apresentam maior concentração de valores, mas ainda assim com certo grau de assimetria positiva.

  • O fim do ano (outubro-dezembro) mostra comportamento mais estável, com assimetria próxima de zero, especialmente em novembro.

- Boxplot

Um boxplot é uma forma gráfica de mostrar a distribuição de dados, destacando:

  • A mediana (linha dentro da caixa),
  • O primeiro e o terceiro quartil (limites da caixa),
  • Os “bigodes” (extremos que não são outliers),
  • E os outliers (pontos fora do padrão)
boxplot(d, main="Boxplot Mensal de Focos de Queimada", las=2, col=rainbow(12))

Análise do boxplot

  • Meses como agosto e setembro possuem as maiores quantidades de focos, com valores que ultrapassam 50.000 em alguns anos (veja a altura dos boxplots azuis escuros).
  • Julho e outubro também apresentam muitos focos, mas em menor intensidade.
  • Janeiro a maio têm níveis muito baixos, quase insignificantes.
  • Junho começa a apresentar aumento.
  • Novembro e dezembro já mostram queda, indicando o fim do período crítico.

- Resumo dos dados em forma de tabela

ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho","Julho", "Agosto", "Setembro", "Outubro", "Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))

tabela_medidas = tibble(
  Mês = meses,
  Média = round(sapply(data[ , meses], mean, na.rm = TRUE)),
  Mediana = round(sapply(data[ , meses], median, na.rm = TRUE)),
  `Desvio Padrão` = round(sapply(data[ , meses], sd, na.rm = TRUE)),
  Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)

kable(tabela_medidas, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
Medidas de Tendência Central e Dispersão por Mês
Mês Média Mediana Desvio Padrão Assimetria
Janeiro 1181 893 978 1.78
Fevereiro 656 515 529 2.15
Março 788 610 589 1.58
Abril 412 400 260 2.12
Maio 700 674 403 0.55
Junho 1576 1688 749 -0.32
Julho 5362 5129 3433 1.26
Agosto 22965 20742 11514 0.71
Setembro 27762 24135 13381 0.57
Outubro 14030 13977 4757 -0.13
Novembro 9995 10130 4463 0.01
Dezembro 4430 3826 2803 1.13
  1. Média: Valor médio de focos de queimadas no mês.
  2. Mediana: Valor central quando os dados são ordenados.
  3. Desvio padrão: Indica o quanto os dados variam em relação à média. Quanto maior, maior a dispersão.
  4. Assimetria: Mede a simetria da distribuição dos dados.

Conclusão

A análise dos dados evidencia forte variação sazonal nas queimadas, com os meses de agosto e setembro concentrando a maioria dos focos. O desvio padrão elevado indica alta variabilidade interanual. A assimetria positiva na maioria dos meses sugere a ocorrência de anos com queimadas excepcionalmente altas.

Referência Bibliográfica