library(moments)
library(knitr)
library(ggplot2)
library(tibble)
data = read.csv("historico_regiao_norte.csv")
data = data[nchar(data$X) == 4, ]
data$Ano = as.integer(data$X)
data$X = NULL
data = data[, !(names(data) %in% c("Ano", "Total"))]
Este relatório apresenta uma análise exploratória do banco de dados contendo registros anuais de focos de queimadas na região Norte do Brasil. Os dados foram obtidos a partir de uma base pública e abrangem o período de 1998 a 2025.
A base analisada contém o número de focos de queimadas registrados mensalmente em cada ano. A fonte original dos dados é o Programa Queimadas do Instituto Nacional de Pesquisas Espaciais (INPE), amplamente utilizado em pesquisas ambientais.
media_df = tibble(
Mês = names(data),
Média = round(sapply(data, mean, na.rm = TRUE))
)
kable(media_df, caption = "- Média por mês (1998 a 2025)")
| Mês | Média |
|---|---|
| Janeiro | 1181 |
| Fevereiro | 656 |
| Março | 788 |
| Abril | 412 |
| Maio | 700 |
| Junho | 1576 |
| Julho | 5362 |
| Agosto | 22965 |
| Setembro | 27762 |
| Outubro | 14030 |
| Novembro | 9995 |
| Dezembro | 4430 |
media_df = data.frame(
Mes = names(data),
Media = sapply(data, mean, na.rm = TRUE)
)
media_df$Mes = factor(media_df$Mes, levels = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto", "Setembro", "Outubro", "Novembro", "Dezembro"))
ggplot(media_df, aes(x = Mes, y = Media)) +
geom_col(fill = "blue", color = "black") +
labs(title = "Média Mensal de Focos de Queimadas",
x = "Mês", y = "Média de Focos") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
desvio_df = tibble(
Mês = names(data),
`Desvio Padrão` = round(sapply(data, sd, na.rm = TRUE))
)
kable(desvio_df, caption = "- Desvio padrão por mês (1985 a 2025)")
| Mês | Desvio Padrão |
|---|---|
| Janeiro | 978 |
| Fevereiro | 529 |
| Março | 589 |
| Abril | 260 |
| Maio | 403 |
| Junho | 749 |
| Julho | 3433 |
| Agosto | 11514 |
| Setembro | 13381 |
| Outubro | 4757 |
| Novembro | 4463 |
| Dezembro | 2803 |
Esses meses apresentam uma quantidade de focos de queimadas mais estável historicamente, com pouca variação de ano para ano.
Representam um ponto de transição, especialmente junho e julho, onde o desvio começa a aumentar. Julho marca o início do período de maior instabilidade.
Setembro e agosto são os meses com maior desvio padrão, indicando que os focos de queimadas nesses meses variam muito de um ano para o outro. Isso sugere que fatores climáticos e humanos influenciam fortemente esses meses.
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")
meses = intersect(ordem_meses, names(data))
desvio_df = data.frame(
Mês = factor(meses, levels = ordem_meses),
DesvioPadrão = sapply(data[ , meses], sd, na.rm = TRUE)
)
ggplot(desvio_df, aes(x = Mês, y = DesvioPadrão)) +
geom_col(fill = "blue", color = "black") +
theme_minimal() +
labs(
title = "Desvio Padrão de Focos de Queimada por Mês",
x = "Mês",
y = "Desvio Padrão"
) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
O gráfico um pico acentuado entre agosto e setembro, coincidindo com o auge da estação seca na região Norte do Brasil, quando as queimadas são mais frequentes.
O padrão observado sugere uma sazonalidade intensa, com meses do meio do ano até o início do último trimestre apresentando maior instabilidade.
Essa informação é valiosa para políticas públicas e planejamento ambiental, pois mostra os períodos em que a variabilidade e o risco de queimadas são mais altos.
desvio_df = tibble(
Mês = names(data),
Assimetria = sapply(data, skewness, na.rm = TRUE)
)
kable(desvio_df, digits = 2, caption = "- Assimetria por mês (1985 a 2025)")
| Mês | Assimetria |
|---|---|
| Janeiro | 1.78 |
| Fevereiro | 2.15 |
| Março | 1.58 |
| Abril | 2.12 |
| Maio | 0.55 |
| Junho | -0.32 |
| Julho | 1.26 |
| Agosto | 0.71 |
| Setembro | 0.57 |
| Outubro | -0.13 |
| Novembro | 0.01 |
| Dezembro | 1.13 |
Isso indica que, nesses meses, os valores de focos de queimadas geralmente são baixos, mas existem alguns picos extremos muito altos.
Nesses meses, os dados mostram certa concentração à esquerda, com picos elevados ocasionais.
Maio (0.55) ainda apresenta leve assimetria positiva, mas se aproxima mais da simetria.
Junho (-0.32), Outubro (-0.13) e Novembro (0.01) indicam dados mais simétricos.
Junho, com assimetria negativa, sugere a presença de valores extremos para a esquerda (alguns meses com número muito baixo de queimadas em comparação à média).
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")
meses = intersect(ordem_meses, names(data))
assimetria_df = data.frame(
Mês = factor(meses, levels = ordem_meses),
Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)
ggplot(assimetria_df, aes(x = Mês, y = Assimetria)) +
geom_col(fill = "blue", color = "black") +
theme_minimal() +
labs(
title = "Assimetria dos Focos de Queimada por Mês",
x = "Mês",
y = "Coeficiente de Assimetria"
) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Assimetria positiva (> 0): os dados têm cauda mais longa à direita (mais valores baixos e poucos muito altos). Assimetria negativa (< 0): os dados têm cauda mais longa à esquerda (mais valores altos e poucos muito baixos). Assimetria próxima de 0: distribuição aproximadamente simétrica.
Os meses do início do ano (janeiro-abril) tendem a ter mais variabilidade e distribuições com cauda longa à direita, sugerindo ocorrência esporádica de eventos extremos de queimadas em anos específicos.
Os meses do período crítico (agosto-setembro) apresentam maior concentração de valores, mas ainda assim com certo grau de assimetria positiva.
O fim do ano (outubro-dezembro) mostra comportamento mais estável, com assimetria próxima de zero, especialmente em novembro.
Um boxplot é uma forma gráfica de mostrar a distribuição de dados, destacando:
boxplot(d, main="Boxplot Mensal de Focos de Queimada", las=2, col=rainbow(12))
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho","Julho", "Agosto", "Setembro", "Outubro", "Novembro","Dezembro")
meses = intersect(ordem_meses, names(data))
tabela_medidas = tibble(
Mês = meses,
Média = round(sapply(data[ , meses], mean, na.rm = TRUE)),
Mediana = round(sapply(data[ , meses], median, na.rm = TRUE)),
`Desvio Padrão` = round(sapply(data[ , meses], sd, na.rm = TRUE)),
Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)
kable(tabela_medidas, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
| Mês | Média | Mediana | Desvio Padrão | Assimetria |
|---|---|---|---|---|
| Janeiro | 1181 | 893 | 978 | 1.78 |
| Fevereiro | 656 | 515 | 529 | 2.15 |
| Março | 788 | 610 | 589 | 1.58 |
| Abril | 412 | 400 | 260 | 2.12 |
| Maio | 700 | 674 | 403 | 0.55 |
| Junho | 1576 | 1688 | 749 | -0.32 |
| Julho | 5362 | 5129 | 3433 | 1.26 |
| Agosto | 22965 | 20742 | 11514 | 0.71 |
| Setembro | 27762 | 24135 | 13381 | 0.57 |
| Outubro | 14030 | 13977 | 4757 | -0.13 |
| Novembro | 9995 | 10130 | 4463 | 0.01 |
| Dezembro | 4430 | 3826 | 2803 | 1.13 |
A análise dos dados evidencia forte variação sazonal nas queimadas, com os meses de agosto e setembro concentrando a maioria dos focos. O desvio padrão elevado indica alta variabilidade interanual. A assimetria positiva na maioria dos meses sugere a ocorrência de anos com queimadas excepcionalmente altas.