library(moments)
library(knitr)
library(ggplot2)
library(tibble)
library(tidyr)
library(e1071)
##
## Anexando pacote: 'e1071'
## Os seguintes objetos são mascarados por 'package:moments':
##
## kurtosis, moment, skewness
data = read.csv("historico_regiao_norte.csv")
data = data[nchar(data$X) == 4, ]
data$Ano = as.integer(data$X)
data$X = NULL
data = data[, !(names(data) %in% c("Ano", "Total"))]
Introdução
Este relatório apresenta uma análise exploratória do banco de dados
contendo registros anuais de focos de queimadas na região Norte do
Brasil. Os dados foram obtidos a partir de uma base pública e abrangem o
período de 1998 a 2025.
Especificação da Base de Dados
A base analisada contém o número de focos de queimadas registrados
mensalmente em cada ano. A fonte original dos dados é o Programa
Queimadas do Instituto Nacional de Pesquisas Espaciais (INPE),
amplamente utilizado em pesquisas ambientais.
Descrição das Variáveis
Ano: Ano de registro
Janeiro a Dezembro: Quantidade de focos de
queimadas por mês
Total: Total anual de focos de queimadas
Análise Descritiva
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho","Julho", "Agosto", "Setembro", "Outubro", "Novembro","Dezembro")
meses = intersect(ordem_meses, names(data))
tabela_medidas = tibble(
Mês = meses,
Média = round(sapply(data[ , meses], mean, na.rm = TRUE)),
Mediana = round(sapply(data[ , meses], median, na.rm = TRUE)),
`Desvio Padrão` = round(sapply(data[ , meses], sd, na.rm = TRUE)),
Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)
kable(tabela_medidas, digits = 2, caption = "Medidas de Tendência Central e Dispersão por Mês")
Medidas de Tendência Central e Dispersão por Mês
| Janeiro |
1181 |
893 |
978 |
1.69 |
| Fevereiro |
656 |
515 |
529 |
2.04 |
| Março |
788 |
610 |
589 |
1.49 |
| Abril |
412 |
400 |
260 |
2.00 |
| Maio |
700 |
674 |
403 |
0.52 |
| Junho |
1576 |
1688 |
749 |
-0.31 |
| Julho |
5362 |
5129 |
3433 |
1.19 |
| Agosto |
22965 |
20742 |
11514 |
0.67 |
| Setembro |
27762 |
24135 |
13381 |
0.54 |
| Outubro |
14030 |
13977 |
4757 |
-0.12 |
| Novembro |
9995 |
10130 |
4463 |
0.01 |
| Dezembro |
4430 |
3826 |
2803 |
1.07 |
- Média: Valor médio de focos de queimadas
no mês.
- Mediana: Valor central quando os dados são
ordenados.
- Desvio padrão: Indica o quanto os dados
variam em relação à média. Quanto maior, maior a dispersão.
- Assimetria: Mede a simetria da
distribuição dos dados.
Tabela de Valor médio de focos de queimadas no mês.
media_df = tibble(
Mês = names(data),
Média = sapply(data, mean, na.rm = TRUE)
)
kable(media_df, caption = "- Média por mês (1998 a 2025)")
- Média por mês (1998 a 2025)
| Janeiro |
1181.0741 |
| Fevereiro |
656.0000 |
| Março |
787.5926 |
| Abril |
411.5926 |
| Maio |
699.8148 |
| Junho |
1575.6667 |
| Julho |
5362.0370 |
| Agosto |
22964.5556 |
| Setembro |
27762.0741 |
| Outubro |
14030.4815 |
| Novembro |
9994.5185 |
| Dezembro |
4430.1852 |
1. Alta temporada de queimadas:
- Agosto e setembro são os meses com mais focos de queimadas, com
médias altíssimas (acima de 22 mil e até 27 mil).
- Esses meses correspondem ao período mais seco da região Norte, o que
favorece queimadas.
3. Transição:
- Junho e julho mostram crescimento gradual na média de queimadas,
iniciando a estação crítica.
- Novembro e dezembro ainda mantêm números altos, embora inferiores
aos picos.
Gráfico de média (para uma melhor visualização)
# Gráfico de média
media_df = data.frame(
Mes = names(data),
Media = sapply(data, mean, na.rm = TRUE)
)
media_df$Mes = factor(media_df$Mes, levels = c("Janeiro","Fevereiro","Março","Abril","Maio","Junho","Julho","Agosto", "Setembro", "Outubro", "Novembro", "Dezembro"))
ggplot(media_df, aes(x = Mes, y = Media)) +
geom_col(fill = "blue", color = "black") +
labs(title = "Média Mensal de Focos de Queimadas",
x = "Mês", y = "Média de Focos") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

- Baixa incidência (menos de 1.000): Fevereiro, Março, Abril,
Maio
- Média incidência (1.000 a 5.000): Janeiro, Junho,
Dezembro
- Alta incidência (acima de 5.000): Julho, Agosto, Setembro,
Outubro, Novembro
Tabela de Desvios Padrão
desvio_df = tibble(
Mês = names(data),
Desvio_Padrão = sapply(data, sd, na.rm = TRUE)
)
kable(desvio_df, caption = "- Desvio padrão por mês (1985 a 2025)")
- Desvio padrão por mês (1985 a 2025)
| Janeiro |
978.1042 |
| Fevereiro |
529.1220 |
| Março |
589.1563 |
| Abril |
260.2190 |
| Maio |
403.2839 |
| Junho |
749.0276 |
| Julho |
3433.2400 |
| Agosto |
11513.7766 |
| Setembro |
13380.7701 |
| Outubro |
4757.4294 |
| Novembro |
4463.3148 |
| Dezembro |
2802.6272 |
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho","Agosto","Setembro","Outubro","Novembro","Dezembro")
meses = intersect(ordem_meses, names(data))
desvio_df = data.frame(
Mês = factor(meses, levels = ordem_meses),
DesvioPadrão = sapply(data[ , meses], sd, na.rm = TRUE)
)
ggplot(desvio_df, aes(x = Mês, y = DesvioPadrão)) +
geom_col(fill = "blue", color = "black") +
theme_minimal() +
labs(
title = "Desvio Padrão de Focos de Queimada por Mês",
x = "Mês",
y = "Desvio Padrão"
) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

Tabela de Assimetria
desvio_df = tibble(
Mês = names(data),
Desvio_Padrão = sapply(data, skewness, na.rm = TRUE)
)
kable(desvio_df, digits = 2, caption = "- Assimetria por mês (1985 a 2025)")
- Assimetria por mês (1985 a 2025)
| Janeiro |
1.69 |
| Fevereiro |
2.04 |
| Março |
1.49 |
| Abril |
2.00 |
| Maio |
0.52 |
| Junho |
-0.31 |
| Julho |
1.19 |
| Agosto |
0.67 |
| Setembro |
0.54 |
| Outubro |
-0.12 |
| Novembro |
0.01 |
| Dezembro |
1.07 |
Gráfico de Assimetria
ordem_meses = c("Janeiro", "Fevereiro", "Março", "Abril", "Maio", "Junho",
"Julho", "Agosto", "Setembro", "Outubro", "Novembro", "Dezembro")
meses = intersect(ordem_meses, names(data))
assimetria_df = data.frame(
Mês = factor(meses, levels = ordem_meses),
Assimetria = sapply(data[ , meses], skewness, na.rm = TRUE)
)
ggplot(assimetria_df, aes(x = Mês, y = Assimetria)) +
geom_col(fill = "blue", color = "black") +
theme_minimal() +
labs(
title = "Assimetria dos Focos de Queimada por Mês",
x = "Mês",
y = "Coeficiente de Assimetria"
) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

Boxplot
Um boxplot é uma forma gráfica de mostrar a distribuição de dados,
destacando:
- A mediana (linha dentro da caixa),
- O primeiro e o terceiro quartil (limites da caixa),
- Os “bigodes” (extremos que não são outliers),
- E os outliers (pontos fora do padrão)
boxplot(d, main="Boxplot Mensal de Focos de Queimada", las=2, col=rainbow(12))

Análise do boxplot
- Meses como agosto e setembro possuem as maiores quantidades
de focos, com valores que ultrapassam 50.000 em alguns anos (veja a
altura dos boxplots azuis escuros).
- Julho e outubro também apresentam muitos focos, mas em
menor intensidade.
- Janeiro a maio têm níveis muito baixos, quase
insignificantes.
- Junho começa a apresentar aumento.
- Novembro e dezembro já mostram queda, indicando o fim do
período crítico.
Conclusão
A análise dos dados evidencia forte variação sazonal nas queimadas,
com os meses de agosto e setembro concentrando a maioria dos focos. O
desvio padrão elevado indica alta variabilidade interanual. A assimetria
positiva na maioria dos meses sugere a ocorrência de anos com queimadas
excepcionalmente altas.