library(moments)
library(knitr)
library(ggplot2)
library(tibble)
library(tidyr)
library(e1071)
## 
## Anexando pacote: 'e1071'
## Os seguintes objetos são mascarados por 'package:moments':
## 
##     kurtosis, moment, skewness
data = read.csv("historico_regiao_norte.csv")
data = data[nchar(data$X) == 4, ]        
data$Ano = as.integer(data$X)
data$X = NULL
data = data[, !(names(data) %in% c("Ano", "Total"))]  

Introdução

Este relatório apresenta uma análise exploratória do banco de dados contendo registros anuais de focos de queimadas na região Norte do Brasil. Os dados foram obtidos a partir de uma base pública e abrangem o período de 1998 a 2025.

Especificação da Base de Dados

A base analisada contém o número de focos de queimadas registrados mensalmente em cada ano. A fonte original dos dados é o Programa Queimadas do Instituto Nacional de Pesquisas Espaciais (INPE), amplamente utilizado em pesquisas ambientais.

Descrição das Variáveis

Análise Descritiva

ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho","Julho", "Agosto", "Setembro", "Outubro", "Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))

tabela_medidas = tibble(
  Mês = meses,
  Média = round(sapply(data[ , meses], mean, na.rm = TRUE)),
  Mediana = round(sapply(data[ , meses], median, na.rm = TRUE)),
  `Desvio Padrão` = round(sapply(data[ , meses], sd, na.rm = TRUE)),
  Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)

kable(tabela_medidas, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
Medidas de Tendência Central e Dispersão por Mês
Mês Média Mediana Desvio Padrão Assimetria
Janeiro 1181 893 978 1.69
Fevereiro 656 515 529 2.04
Março 788 610 589 1.49
Abril 412 400 260 2.00
Maio 700 674 403 0.52
Junho 1576 1688 749 -0.31
Julho 5362 5129 3433 1.19
Agosto 22965 20742 11514 0.67
Setembro 27762 24135 13381 0.54
Outubro 14030 13977 4757 -0.12
Novembro 9995 10130 4463 0.01
Dezembro 4430 3826 2803 1.07
  1. Média: Valor médio de focos de queimadas no mês.
  2. Mediana: Valor central quando os dados são ordenados.
  3. Desvio padrão: Indica o quanto os dados variam em relação à média. Quanto maior, maior a dispersão.
  4. Assimetria: Mede a simetria da distribuição dos dados.

Tabela de Valor médio de focos de queimadas no mês.

media_df = tibble(
  Mês = names(data),
  Média = sapply(data, mean, na.rm = TRUE)
)
kable(media_df, caption = "- Média por mês (1998 a 2025)")
- Média por mês (1998 a 2025)
Mês Média
Janeiro 1181.0741
Fevereiro 656.0000
Março 787.5926
Abril 411.5926
Maio 699.8148
Junho 1575.6667
Julho 5362.0370
Agosto 22964.5556
Setembro 27762.0741
Outubro 14030.4815
Novembro 9994.5185
Dezembro 4430.1852

1. Alta temporada de queimadas:

  • Agosto e setembro são os meses com mais focos de queimadas, com médias altíssimas (acima de 22 mil e até 27 mil).
  • Esses meses correspondem ao período mais seco da região Norte, o que favorece queimadas.

2. Meses com menos queimadas:

  • Abril, fevereiro e maio têm as menores médias, com menos de 1.000 focos.
  • Tal fato se dar por serem meses com mais chuvas.

3. Transição:

  • Junho e julho mostram crescimento gradual na média de queimadas, iniciando a estação crítica.
  • Novembro e dezembro ainda mantêm números altos, embora inferiores aos picos.

Gráfico de média (para uma melhor visualização)

# Gráfico de média
media_df = data.frame(
  Mes = names(data),
  Media = sapply(data, mean, na.rm = TRUE)
)

media_df$Mes = factor(media_df$Mes, levels = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto", "Setembro", "Outubro",                                           "Novembro", "Dezembro"))

ggplot(media_df, aes(x = Mes, y = Media)) +
  geom_col(fill = "blue", color = "black") +
  labs(title = "Média Mensal de Focos de Queimadas",
       x = "Mês", y = "Média de Focos") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Tabela de Desvios Padrão

desvio_df = tibble(
  Mês = names(data),
  Desvio_Padrão = sapply(data, sd, na.rm = TRUE)
)
kable(desvio_df, caption = "- Desvio padrão por mês (1985 a 2025)")
- Desvio padrão por mês (1985 a 2025)
Mês Desvio_Padrão
Janeiro 978.1042
Fevereiro 529.1220
Março 589.1563
Abril 260.2190
Maio 403.2839
Junho 749.0276
Julho 3433.2400
Agosto 11513.7766
Setembro 13380.7701
Outubro 4757.4294
Novembro 4463.3148
Dezembro 2802.6272
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))  

desvio_df = data.frame(
  Mês = factor(meses, levels = ordem_meses),
  DesvioPadrão = sapply(data[ , meses], sd, na.rm = TRUE)
)

ggplot(desvio_df, aes(x = Mês, y = DesvioPadrão)) +
  geom_col(fill = "blue", color = "black") +
  theme_minimal() +
  labs(
    title = "Desvio Padrão de Focos de Queimada por Mês",
    x = "Mês",
    y = "Desvio Padrão"
  ) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Tabela de Assimetria

desvio_df = tibble(
  Mês = names(data),
  Desvio_Padrão = sapply(data, skewness, na.rm = TRUE)
)
kable(desvio_df, digits = 2, caption = "- Assimetria por mês (1985 a 2025)")
- Assimetria por mês (1985 a 2025)
Mês Desvio_Padrão
Janeiro 1.69
Fevereiro 2.04
Março 1.49
Abril 2.00
Maio 0.52
Junho -0.31
Julho 1.19
Agosto 0.67
Setembro 0.54
Outubro -0.12
Novembro 0.01
Dezembro 1.07

Gráfico de Assimetria

ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
                 "Julho", "Agosto", "Setembro", "Outubro", "Novembro", "Dezembro")

meses = intersect(ordem_meses, names(data))

assimetria_df = data.frame(
  Mês = factor(meses, levels = ordem_meses),
  Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)

ggplot(assimetria_df, aes(x = Mês, y = Assimetria)) +
  geom_col(fill = "blue", color = "black") +
  theme_minimal() +
  labs(
    title = "Assimetria dos Focos de Queimada por Mês",
    x = "Mês",
    y = "Coeficiente de Assimetria"
  ) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Boxplot

Um boxplot é uma forma gráfica de mostrar a distribuição de dados, destacando:

boxplot(d, main="Boxplot Mensal de Focos de Queimada", las=2, col=rainbow(12))

Análise do boxplot

  • Meses como agosto e setembro possuem as maiores quantidades de focos, com valores que ultrapassam 50.000 em alguns anos (veja a altura dos boxplots azuis escuros).
  • Julho e outubro também apresentam muitos focos, mas em menor intensidade.
  • Janeiro a maio têm níveis muito baixos, quase insignificantes.
  • Junho começa a apresentar aumento.
  • Novembro e dezembro já mostram queda, indicando o fim do período crítico.

Resumo dos dados em forma de tabela

ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho","Julho", "Agosto", "Setembro", "Outubro", "Novembro","Dezembro")

meses = intersect(ordem_meses, names(data))

tabela_medidas = tibble(
  Mês = meses,
  Média = round(sapply(data[ , meses], mean, na.rm = TRUE)),
  Mediana = round(sapply(data[ , meses], median, na.rm = TRUE)),
  `Desvio Padrão` = round(sapply(data[ , meses], sd, na.rm = TRUE)),
  Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)

kable(tabela_medidas, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
Medidas de Tendência Central e Dispersão por Mês
Mês Média Mediana Desvio Padrão Assimetria
Janeiro 1181 893 978 1.69
Fevereiro 656 515 529 2.04
Março 788 610 589 1.49
Abril 412 400 260 2.00
Maio 700 674 403 0.52
Junho 1576 1688 749 -0.31
Julho 5362 5129 3433 1.19
Agosto 22965 20742 11514 0.67
Setembro 27762 24135 13381 0.54
Outubro 14030 13977 4757 -0.12
Novembro 9995 10130 4463 0.01
Dezembro 4430 3826 2803 1.07
  1. Média: Valor médio de focos de queimadas no mês.
  2. Mediana: Valor central quando os dados são ordenados.
  3. Desvio padrão: Indica o quanto os dados variam em relação à média. Quanto maior, maior a dispersão.
  4. Assimetria: Mede a simetria da distribuição dos dados.

Conclusão

A análise dos dados evidencia forte variação sazonal nas queimadas, com os meses de agosto e setembro concentrando a maioria dos focos. O desvio padrão elevado indica alta variabilidade interanual. A assimetria positiva na maioria dos meses sugere a ocorrência de anos com queimadas excepcionalmente altas.

Referência Bibliográfica