library(moments)
library(knitr)
library(ggplot2)
library(tibble)
library(tidyr)
data = read.csv("historico_regiao_norte.csv")
data = data[nchar(data$X) == 4, ]
data$Ano = as.integer(data$X)
data$X = NULL
data = data[, !(names(data) %in% c("Ano", "Total"))]
Este relatório apresenta uma análise exploratória do banco de dados contendo registros anuais de focos de queimadas na região Norte do Brasil. Os dados foram obtidos a partir de uma base pública e abrangem o período de 1998 a 2025.
A base analisada contém o número de focos de queimadas registrados mensalmente em cada ano. A fonte original dos dados é o Programa Queimadas do Instituto Nacional de Pesquisas Espaciais (INPE), amplamente utilizado em pesquisas ambientais.
media_df = tibble(
Mês = names(data),
Média = round(sapply(data, mean, na.rm = TRUE))
)
kable(media_df, caption = "- Média por mês (1998 a 2025)")
| Mês | Média |
|---|---|
| Janeiro | 1181 |
| Fevereiro | 656 |
| Março | 788 |
| Abril | 412 |
| Maio | 700 |
| Junho | 1576 |
| Julho | 5362 |
| Agosto | 22965 |
| Setembro | 27762 |
| Outubro | 14030 |
| Novembro | 9995 |
| Dezembro | 4430 |
# Gráfico de média
media_df = data.frame(
Mes = names(data),
Media = sapply(data, mean, na.rm = TRUE)
)
media_df$Mes = factor(media_df$Mes, levels = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto", "Setembro", "Outubro", "Novembro", "Dezembro"))
ggplot(media_df, aes(x = Mes, y = Media)) +
geom_col(fill = "blue", color = "black") +
labs(title = "Média Mensal de Focos de Queimadas",
x = "Mês", y = "Média de Focos") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
desvio_df = tibble(
Mês = names(data),
`Desvio Padrão` = round(sapply(data, sd, na.rm = TRUE))
)
kable(desvio_df, caption = "- Desvio padrão por mês (1985 a 2025)")
| Mês | Desvio Padrão |
|---|---|
| Janeiro | 978 |
| Fevereiro | 529 |
| Março | 589 |
| Abril | 260 |
| Maio | 403 |
| Junho | 749 |
| Julho | 3433 |
| Agosto | 11514 |
| Setembro | 13381 |
| Outubro | 4757 |
| Novembro | 4463 |
| Dezembro | 2803 |
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")
meses = intersect(ordem_meses, names(data))
desvio_df = data.frame(
Mês = factor(meses, levels = ordem_meses),
DesvioPadrão = sapply(data[ , meses], sd, na.rm = TRUE)
)
ggplot(desvio_df, aes(x = Mês, y = DesvioPadrão)) +
geom_col(fill = "blue", color = "black") +
theme_minimal() +
labs(
title = "Desvio Padrão de Focos de Queimada por Mês",
x = "Mês",
y = "Desvio Padrão"
) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
desvio_df = tibble(
Mês = names(data),
Assimetria = sapply(data, skewness, na.rm = TRUE)
)
kable(desvio_df, digits = 2, caption = "- Assimetria por mês (1985 a 2025)")
| Mês | Assimetria |
|---|---|
| Janeiro | 1.78 |
| Fevereiro | 2.15 |
| Março | 1.58 |
| Abril | 2.12 |
| Maio | 0.55 |
| Junho | -0.32 |
| Julho | 1.26 |
| Agosto | 0.71 |
| Setembro | 0.57 |
| Outubro | -0.13 |
| Novembro | 0.01 |
| Dezembro | 1.13 |
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")
meses = intersect(ordem_meses, names(data))
assimetria_df = data.frame(
Mês = factor(meses, levels = ordem_meses),
Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)
ggplot(assimetria_df, aes(x = Mês, y = Assimetria)) +
geom_col(fill = "blue", color = "black") +
theme_minimal() +
labs(
title = "Assimetria dos Focos de Queimada por Mês",
x = "Mês",
y = "Coeficiente de Assimetria"
) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Um boxplot é uma forma gráfica de mostrar a distribuição de dados, destacando:
boxplot(d, main="Boxplot Mensal de Focos de Queimada", las=2, col=rainbow(12))
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho","Julho", "Agosto", "Setembro", "Outubro", "Novembro","Dezembro")
meses = intersect(ordem_meses, names(data))
tabela_medidas = tibble(
Mês = meses,
Média = round(sapply(data[ , meses], mean, na.rm = TRUE)),
Mediana = round(sapply(data[ , meses], median, na.rm = TRUE)),
`Desvio Padrão` = round(sapply(data[ , meses], sd, na.rm = TRUE)),
Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)
kable(tabela_medidas, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
| Mês | Média | Mediana | Desvio Padrão | Assimetria |
|---|---|---|---|---|
| Janeiro | 1181 | 893 | 978 | 1.78 |
| Fevereiro | 656 | 515 | 529 | 2.15 |
| Março | 788 | 610 | 589 | 1.58 |
| Abril | 412 | 400 | 260 | 2.12 |
| Maio | 700 | 674 | 403 | 0.55 |
| Junho | 1576 | 1688 | 749 | -0.32 |
| Julho | 5362 | 5129 | 3433 | 1.26 |
| Agosto | 22965 | 20742 | 11514 | 0.71 |
| Setembro | 27762 | 24135 | 13381 | 0.57 |
| Outubro | 14030 | 13977 | 4757 | -0.13 |
| Novembro | 9995 | 10130 | 4463 | 0.01 |
| Dezembro | 4430 | 3826 | 2803 | 1.13 |
A análise dos dados evidencia forte variação sazonal nas queimadas, com os meses de agosto e setembro concentrando a maioria dos focos. O desvio padrão elevado indica alta variabilidade interanual. A assimetria positiva na maioria dos meses sugere a ocorrência de anos com queimadas excepcionalmente altas.