library(moments) # Pacote usado para cálculo estatístico(assimetria e curtose)
library(ggplot2) # Cria gráficos mais detalhados
library(tibble) # Cria tabelas
library(knitr) # Melhora a visualização das tabelas
data = read.csv("historico_regiao_norte.csv") # Armazena os dados em "data"
data = data[nchar(data$X) == 4, ] # Filtra somente os anos, ultizando 4 caracteres
data = data[, !(names(data) %in% c("X", "Ano", "Total"))] # Removes as colunas que não foram usadas nos calculos feitos
Este relatório apresenta uma análise exploratória do banco de dados contendo registros anuais de focos de queimadas na região Norte do Brasil. Os dados foram obtidos a partir de uma base pública e abrangem o período de 1998 a 2025. A fonte original dos dados é o Programa Queimadas do Instituto Nacional de Pesquisas Espaciais (INPE), amplamente utilizado em pesquisas ambientais.
media = tibble( # Cria a tabela usando o pacote "tibble"
Mês = names(data), # Gera a coluna dos meses
Média = round(sapply(data, mean, na.rm = TRUE)) # Aplica a função "mean" na coluna de média, arredondando os valores usando "round"
)
kable(media, caption = "- Média por mês (1998 a 2025)") # Formata a tabela com o "knitr"
| Mês | Média |
|---|---|
| Janeiro | 1181 |
| Fevereiro | 656 |
| Março | 788 |
| Abril | 412 |
| Maio | 700 |
| Junho | 1576 |
| Julho | 5362 |
| Agosto | 22965 |
| Setembro | 27762 |
| Outubro | 14030 |
| Novembro | 9995 |
| Dezembro | 4430 |
ordem_meses = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto", "Setembro", "Outubro", "Novembro", "Dezembro") # Vetor com a ordem correta dos meses
# Tabela usada de base pro gráfico
media = tibble(
Mes = names(data),
Media = sapply(data, mean, na.rm = TRUE)
)
# Ultiza o vetor como um fator de ordem
media$Mes = factor(media$Mes, levels = ordem_meses)
# Gera o gráfico usando "ggplot" com o a tabela "media"
ggplot(media, aes(x = Mes, y = Media)) + # Define os eixos do gráfico
geom_col(fill = "blue", color = "black") + # Palheta de cores
labs(title = "Média Mensal de Focos de Queimadas",
x = "Mês", y = "Média de Focos") + # Define o nome do titulo e dos eixos
theme_minimal() + # Tema para melhorar a visualização do gráfico
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Ajusta a legenda do gráfico
desvio = tibble( # Cria a tabela usando o "tibble"
Mês = names(data),
`Desvio Padrão` = round(sapply(data, sd, na.rm = TRUE))
# "na.rm=TRUE para ignorar valores N/A
# Dessa vez usando a função "sd" para calcular o desvio
)
kable(desvio, caption = "- Desvio padrão por mês (1985 a 2025)") # Formata a tabela com o "knitr"
| Mês | Desvio Padrão |
|---|---|
| Janeiro | 978 |
| Fevereiro | 529 |
| Março | 589 |
| Abril | 260 |
| Maio | 403 |
| Junho | 749 |
| Julho | 3433 |
| Agosto | 11514 |
| Setembro | 13381 |
| Outubro | 4757 |
| Novembro | 4463 |
| Dezembro | 2803 |
Esses meses apresentam uma quantidade de focos de queimadas mais estável historicamente, com pouca variação de ano para ano.
Representam um ponto de transição, especialmente junho e julho, onde o desvio começa a aumentar. Julho marca o início do período de maior instabilidade.
Setembro e agosto são os meses com maior desvio padrão, indicando que os focos de queimadas nesses meses variam muito de um ano para o outro. Isso sugere que fatores climáticos e humanos influenciam fortemente esses meses.
ordem_meses = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto","Setembro","Outubro","Novembro","Dezembro") # Vetor com ordem dos meses correta
desvio = tibble( # Base do gráfico
Mes = names(data),
DesvioPadrão = sapply(data, sd, na.rm = TRUE)
)
desvio$Mes = factor(desvio$Mes, levels = ordem_meses) # Usa o vetor como fator de ordem, para evitar a ordem alfabetica pré definida
ggplot(desvio, aes(x = Mes, y = DesvioPadrão)) +
geom_col(fill = "blue", color = "black") +
theme_minimal() +
labs(
title = "Desvio Padrão de Focos de Queimada por Mês",
x = "Mês",
y = "Desvio Padrão"
) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
O gráfico um pico acentuado entre agosto e setembro, coincidindo com o auge da estação seca na região Norte do Brasil, quando as queimadas são mais frequentes.
O padrão observado sugere uma sazonalidade intensa, com meses do meio do ano até o início do último trimestre apresentando maior instabilidade.
Essa informação é valiosa para políticas públicas e planejamento ambiental, pois mostra os períodos em que a variabilidade e o risco de queimadas são mais altos.
assimetria = tibble(
Mês = names(data),
Assimetria = sapply(data, skewness, na.rm = TRUE) # A função "skewness" serve para calcular a assimetria, ele vem do pacote "moments".
)
# digits = 2 limita os números da tabela a 2 casas decimais
kable(assimetria, digits = 2, caption = "- Assimetria por mês (1985 a 2025)")
| Mês | Assimetria |
|---|---|
| Janeiro | 1.78 |
| Fevereiro | 2.15 |
| Março | 1.58 |
| Abril | 2.12 |
| Maio | 0.55 |
| Junho | -0.32 |
| Julho | 1.26 |
| Agosto | 0.71 |
| Setembro | 0.57 |
| Outubro | -0.13 |
| Novembro | 0.01 |
| Dezembro | 1.13 |
Isso indica que, nesses meses, os valores de focos de queimadas geralmente são baixos, mas existem alguns picos extremos muito altos.
Nesses meses, os dados mostram certa concentração à esquerda, com picos elevados ocasionais.
Maio (0.55) ainda apresenta leve assimetria positiva, mas se aproxima mais da simetria.
Junho (-0.32), Outubro (-0.13) e Novembro (0.01) indicam dados mais simétricos.
Junho, com assimetria negativa, sugere a presença de valores extremos para a esquerda (alguns meses com número muito baixo de queimadas em comparação à média).
ordem_meses = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto","Setembro","Outubro","Novembro","Dezembro") # Vetor de ordem
# Base do gráfico
assimetria = tibble(
Mes = names(data),
Assimetria = sapply(data, skewness, na.rm = TRUE)
)
# Fator de ordem
assimetria$Mes = factor(assimetria$Mes, levels = ordem_meses)
# Gráfico
ggplot(assimetria, aes(x = Mes, y = Assimetria)) +
geom_col(fill = "blue", color = "black") +
theme_minimal() +
labs(
title = "Assimetria dos Focos de Queimada por Mês",
x = "Mês",
y = "Coeficiente de Assimetria"
) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Assimetria positiva (> 0): os dados têm cauda mais longa à direita (mais valores baixos e poucos muito altos).
Assimetria negativa (< 0): os dados têm cauda mais longa à esquerda (mais valores altos e poucos muito baixos).
Assimetria próxima de 0: distribuição aproximadamente simétrica.
Os meses do início do ano (janeiro-abril) tendem a ter mais variabilidade e distribuições com cauda longa à direita, sugerindo ocorrência esporádica de eventos extremos de queimadas em anos específicos.
Os meses do período crítico (agosto-setembro) apresentam maior concentração de valores, mas ainda assim com certo grau de assimetria positiva.
O fim do ano (outubro-dezembro) mostra comportamento mais estável, com assimetria próxima de zero, especialmente em novembro.
Um boxplot é uma forma gráfica de mostrar a distribuição de dados, destacando:
# Cria uma boxplot com dados direto do "data"
boxplot(data, main="Boxplot Mensal de Focos de Queimada", las=2, col=rainbow(12))
# Gera a coluna dos meses direto do "data"
meses = names(data)
tabela = tibble( # Cria a tabela
Mês = meses,
Média = round(sapply(data, mean, na.rm = TRUE)), # Aplica separadamente as funções
`Desvio Padrão` = round(sapply(data, sd, na.rm = TRUE)),
Assimetria = sapply(data, skewness, na.rm = TRUE)
)
# digits = 2 limita os números da tabela a 2 casas decimais
kable(tabela, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
| Mês | Média | Desvio Padrão | Assimetria |
|---|---|---|---|
| Janeiro | 1181 | 978 | 1.78 |
| Fevereiro | 656 | 529 | 2.15 |
| Março | 788 | 589 | 1.58 |
| Abril | 412 | 260 | 2.12 |
| Maio | 700 | 403 | 0.55 |
| Junho | 1576 | 749 | -0.32 |
| Julho | 5362 | 3433 | 1.26 |
| Agosto | 22965 | 11514 | 0.71 |
| Setembro | 27762 | 13381 | 0.57 |
| Outubro | 14030 | 4757 | -0.13 |
| Novembro | 9995 | 4463 | 0.01 |
| Dezembro | 4430 | 2803 | 1.13 |
A análise dos dados evidencia forte variação sazonal nas queimadas, com os meses de agosto e setembro concentrando a maioria dos focos. O desvio padrão elevado indica alta variabilidade interanual. A assimetria positiva na maioria dos meses sugere a ocorrência de anos com queimadas excepcionalmente altas.