Este relatório consiste em analisar os dados de desmatamento pelo Brasil. Dado que a emergência climática é um dos dilemas do século XXI, este relatório busca um panorama do desmatamento em um intervalo de 20 anos.

0. Bibliotecas utilizadas

pacman::p_load(rio, tidyverse, janitor, scales, geobr)

# mapas
pacman::p_load(terra, ggspatial, mapview, geobr, terra)

# manipulacao de strins
pacman::p_load(tidytext, tm, abjutils)

# retirar notacao cientifica
options(scipen = 999)

1. Base de dados sobre desmatamento

Ao analisar a base dados, é vísivel que ela possui uma estrutura razoavelmente simples. Dividida em 5 variáveis, destrinchando a quantidade de queimadas por mes em cada ano de cada estado brasileiro.

# base de dados provém do site de datasets kaggle

dados_desmatamento <- import('amazon.csv')

# visualização inicial
dados_desmatamento %>% 
  slice(1:5)
##   year state   month number       date
## 1 1998  Acre Janeiro      0 1998-01-01
## 2 1999  Acre Janeiro      0 1999-01-01
## 3 2000  Acre Janeiro      0 2000-01-01
## 4 2001  Acre Janeiro      0 2001-01-01
## 5 2002  Acre Janeiro      0 2002-01-01
# tipo de dado
glimpse(dados_desmatamento)
## Rows: 6,454
## Columns: 5
## $ year   <int> 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, 2007, 200…
## $ state  <chr> "Acre", "Acre", "Acre", "Acre", "Acre", "Acre", "Acre", "Acre",…
## $ month  <chr> "Janeiro", "Janeiro", "Janeiro", "Janeiro", "Janeiro", "Janeiro…
## $ number <dbl> 0, 0, 0, 0, 0, 10, 0, 12, 4, 0, 0, 0, 1, 0, 0, 0, 0, 1, 12, 0, …
## $ date   <IDate> 1998-01-01, 1999-01-01, 2000-01-01, 2001-01-01, 2002-01-01, 2…

1.1 Análise dos intervalos que a base possui

Veremos agora os extremos das estatísticas dessa base, para guiar o nosso relatório. Os anos da base de dados varia entre 01/01/1998 e 01/01/2017. 0 número de queimadas no mês varia de 0 até 998 por estado brasileiro.

# usando a funcao summary
summary(dados_desmatamento)
##       year         state              month               number     
##  Min.   :1998   Length:6454        Length:6454        Min.   :  0.0  
##  1st Qu.:2002   Class :character   Class :character   1st Qu.:  3.0  
##  Median :2007   Mode  :character   Mode  :character   Median : 24.0  
##  Mean   :2007                                         Mean   :108.3  
##  3rd Qu.:2012                                         3rd Qu.:113.0  
##  Max.   :2017                                         Max.   :998.0  
##       date           
##  Min.   :1998-01-01  
##  1st Qu.:2002-01-01  
##  Median :2007-01-01  
##  Mean   :2007-06-18  
##  3rd Qu.:2012-01-01  
##  Max.   :2017-01-01
# a partir daqui, visualizamos se a base de dados está completa para todos os estados

# observe-aqui que os meses para certos estados estão se repetindo. Por exemplo no estado de matogrosso, possui duas obervações distinstas para a mesma data.
tabyl(dados_desmatamento$month)
##  dados_desmatamento$month   n    percent
##                     Abril 540 0.08366904
##                    Agosto 540 0.08366904
##                  Dezembro 513 0.07948559
##                 Fevereiro 540 0.08366904
##                   Janeiro 541 0.08382399
##                     Julho 540 0.08366904
##                     Junho 540 0.08366904
##                      Maio 540 0.08366904
##                  Mar\xe7o 540 0.08366904
##                  Novembro 540 0.08366904
##                   Outubro 540 0.08366904
##                  Setembro 540 0.08366904
tabyl(dados_desmatamento$state)
##  dados_desmatamento$state   n    percent
##                      Acre 239 0.03703130
##                   Alagoas 240 0.03718624
##                     Amapa 239 0.03703130
##                  Amazonas 239 0.03703130
##                     Bahia 239 0.03703130
##                     Ceara 239 0.03703130
##          Distrito Federal 239 0.03703130
##            Espirito Santo 239 0.03703130
##                     Goias 239 0.03703130
##                  Maranhao 239 0.03703130
##               Mato Grosso 478 0.07406260
##              Minas Gerais 239 0.03703130
##                   Paraiba 478 0.07406260
##                   Par\xe1 239 0.03703130
##                Pernambuco 239 0.03703130
##                      Piau 239 0.03703130
##                       Rio 717 0.11109390
##                  Rondonia 239 0.03703130
##                   Roraima 239 0.03703130
##            Santa Catarina 239 0.03703130
##                 Sao Paulo 239 0.03703130
##                   Sergipe 239 0.03703130
##                 Tocantins 239 0.03703130
mato_grosso <- dados_desmatamento %>% 
  filter(state == 'Mato Grosso')  

# Era para ter apenas 20 observações de fevereiro para matogrosso, existe o dobro.
mato_grosso %>% 
  filter(month == 'Fevereiro')
##    year       state     month number       date
## 1  1998 Mato Grosso Fevereiro   0.00 1998-01-01
## 2  1999 Mato Grosso Fevereiro  28.00 1999-01-01
## 3  2000 Mato Grosso Fevereiro  35.00 2000-01-01
## 4  2001 Mato Grosso Fevereiro  54.00 2001-01-01
## 5  2002 Mato Grosso Fevereiro  22.00 2002-01-01
## 6  2003 Mato Grosso Fevereiro 592.00 2003-01-01
## 7  2004 Mato Grosso Fevereiro 272.00 2004-01-01
## 8  2005 Mato Grosso Fevereiro 871.00 2005-01-01
## 9  2006 Mato Grosso Fevereiro 383.00 2006-01-01
## 10 2007 Mato Grosso Fevereiro 213.00 2007-01-01
## 11 2008 Mato Grosso Fevereiro 180.00 2008-01-01
## 12 2009 Mato Grosso Fevereiro 248.00 2009-01-01
## 13 2010 Mato Grosso Fevereiro 431.00 2010-01-01
## 14 2011 Mato Grosso Fevereiro 119.00 2011-01-01
## 15 2012 Mato Grosso Fevereiro 193.00 2012-01-01
## 16 2013 Mato Grosso Fevereiro 375.00 2013-01-01
## 17 2014 Mato Grosso Fevereiro 199.00 2014-01-01
## 18 2015 Mato Grosso Fevereiro 542.00 2015-01-01
## 19 2016 Mato Grosso Fevereiro   1.05 2016-01-01
## 20 2017 Mato Grosso Fevereiro 337.00 2017-01-01
## 21 1998 Mato Grosso Fevereiro   0.00 1998-01-01
## 22 1999 Mato Grosso Fevereiro  69.00 1999-01-01
## 23 2000 Mato Grosso Fevereiro  81.00 2000-01-01
## 24 2001 Mato Grosso Fevereiro  89.00 2001-01-01
## 25 2002 Mato Grosso Fevereiro  98.00 2002-01-01
## 26 2003 Mato Grosso Fevereiro 108.00 2003-01-01
## 27 2004 Mato Grosso Fevereiro 169.00 2004-01-01
## 28 2005 Mato Grosso Fevereiro 221.00 2005-01-01
## 29 2006 Mato Grosso Fevereiro 104.00 2006-01-01
## 30 2007 Mato Grosso Fevereiro 111.00 2007-01-01
## 31 2008 Mato Grosso Fevereiro  78.00 2008-01-01
## 32 2009 Mato Grosso Fevereiro 164.00 2009-01-01
## 33 2010 Mato Grosso Fevereiro 157.00 2010-01-01
## 34 2011 Mato Grosso Fevereiro  61.00 2011-01-01
## 35 2012 Mato Grosso Fevereiro 112.00 2012-01-01
## 36 2013 Mato Grosso Fevereiro 100.00 2013-01-01
## 37 2014 Mato Grosso Fevereiro 139.00 2014-01-01
## 38 2015 Mato Grosso Fevereiro 148.00 2015-01-01
## 39 2016 Mato Grosso Fevereiro 187.00 2016-01-01
## 40 2017 Mato Grosso Fevereiro 165.00 2017-01-01

1.2. Tratando as strings dos estados

Os caracteres estão em caracteres especiais. Isso pode acarretar em erro na analise. Por exemplo um estado estava com o seguinte caractere ‘Par/xe1’, o que impedia a plotacao do gráfico

dados_desmatamento <- dados_desmatamento %>% 
  mutate(state = ifelse(state == 'Par\xe1', 'Pará', state),
         state = ifelse(state == 'Rio', 'Rio de Janeiro', state))

1.3. Corrigindo os estados com os dados duplicados

Estados como rio de janeiro e Matogrosos possuem mais observações do que o limite estabelecido que é 239 observações por ente federativo. Iremos somar o número de incendios de todas as datas duplicadas

# somando o total_incendios nas datas duplicadas
desmatamento_edit <- dados_desmatamento %>% 
  group_by(year, state, month, date) %>% 
  mutate(total_incendios = sum(number))

# aqui filtramos todos os dados duplicados, eliminando os dados duplos de um mesmo mes e ano.
desmatamento_edit_2 <- desmatamento_edit %>% 
  filter(!(duplicated(total_incendios)))

2. Estados com mais queimadas

Ao analisar o total de queimadas durante o periodo, é fato que o Mato Grosso disparadamente possui maior registro de ocorrencias de queimadas. Logo após vem Paraiba e São Paulo.

desmatamento_edit_2 %>% 
  group_by(state) %>% 
  summarise(total_queimadas_periodo = sum(total_incendios)) %>% 
  ggplot(aes(x = reorder(state, total_queimadas_periodo), y = total_queimadas_periodo)) +
  geom_bar(stat = 'identity', color = 'black') +
  coord_flip() +
  theme_bw() +
  labs(title = 'Estados com maior ocorrencia de queimadas',
       x = '',
       y = '')

3. Boxplot dos estados com mais queimadas

Para analisar os estados com mais queimadas, teremos que criar a cate

3.1. Criando as categorias regionais

desmatamento_edit_2 %>% 
  tabyl(state)
##             state   n    percent
##              Acre 239 0.04347826
##           Alagoas 239 0.04347826
##             Amapa 239 0.04347826
##          Amazonas 239 0.04347826
##             Bahia 239 0.04347826
##             Ceara 239 0.04347826
##  Distrito Federal 239 0.04347826
##    Espirito Santo 239 0.04347826
##             Goias 239 0.04347826
##          Maranhao 239 0.04347826
##       Mato Grosso 239 0.04347826
##      Minas Gerais 239 0.04347826
##           Paraiba 239 0.04347826
##              Pará 239 0.04347826
##        Pernambuco 239 0.04347826
##              Piau 239 0.04347826
##    Rio de Janeiro 239 0.04347826
##          Rondonia 239 0.04347826
##           Roraima 239 0.04347826
##    Santa Catarina 239 0.04347826
##         Sao Paulo 239 0.04347826
##           Sergipe 239 0.04347826
##         Tocantins 239 0.04347826
# criando as categorias regionais para os estados
desmatamento_edit_2 <-  desmatamento_edit_2 %>% 
  mutate(regiao = case_when(state %in% c('Acre', 'Amazonas', 'Amapa', 'Rondonia', 'Roraima', 'Pará') ~ 'norte',
                            state %in% c('Sao Paulo', 'Rio de Janeiro', 'Espirito Santo', 'Minas Gerais') ~ 'sudeste',
                            state %in% c('Tocantins', 'Sergipe', 'Piau', 'Pernambuco', 'Maranhao', 'Ceara', 'Bahia', 'Alagoas', 'Paraiba')~ 'nordeste',
                            state == 'Santa Catarina' ~ 'sul',
                            state %in% c('Mato Grosso', 'Goias', 'Distrito Federal') ~ 'centro oeste'))

3.2. Criando o boxplot

3.2.1 Distribuição assimétrica do total de incendios

Ao analisar a distribuição do total de incendios, a maioria dos meses para grande parte dos estados não possuem ocorrencias de queimadas. Devido a isso, a nossa distribuição é assimétrica como demonstra o gráfico abaixo

desmatamento_edit_2 %>% 
  ggplot(aes(x = total_incendios)) +
  geom_histogram(aes(y = ..density..), color = 'black') +
  geom_density(linewidth = .7) +
  theme_bw() +
  labs(title = 'Distribuição de incendios por estado a cada mês',
       x = '',
       y = '') +
  theme(plot.title = element_text(face = 'bold', hjust = .5))
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

3.2.2. Criando boxplot usando o log(total_incendios)

Já que analisamos que a distribuicao de total de incendios é assimétrica, usaremos no boxplot o log(total_incendios) para visualizar melhor a distribuição.

desmatamento_edit_2 %>% 
  filter(total_incendios != 0) %>% 
  ggplot(aes(y = log(total_incendios), fill = regiao)) +
  geom_boxplot() +
  facet_wrap(~regiao, labeller = as_labeller(c(
    "norte" = "Norte",
    "nordeste" = "Nordeste",
    "centro oeste" = "Centro-Oeste",
    "sudeste" = "Sudeste",
    "sul" = "Sul"
  ))) +
  theme_bw() +
  scale_fill_brewer(palette = 'Dark2') +
  labs(title = 'Distribuição dos incêndios por região do Brasil',
       y = 'Ocorrências de incêndio',
       fill = '') +
  theme(plot.title = element_text(face = 'bold', hjust = .5),
        legend.position = 'bottom')

4. Evolução do desmatamento dos estados do Centro-Oeste

Analisando o gráfico de barras com mais desmatamentos e o boxplot, é fato que a regiao do centro oeste possui maior ocorrencia de queimadas. Devido a isso, vale a pena analisar a evolução do desmatamento ao longo do tempo dessa regiao por estado.

4.1. Criando um novo objeto para o centro oeste

Nesse objeto criado criamos a categoria total_incend_ano, que soma o total de incendios que determinado estado teve no ano. Tal medida é necessária dado que nossa base possui registros de incendios para todos os meses do ano.

centro_oeste <- desmatamento_edit_2 %>% 
  filter(regiao == 'centro oeste') %>% 
  group_by(state, year) %>% 
  mutate(total_incend_ano = sum(total_incendios))

4.2. Criando a evolucao das queimadas entre os anos

Analisando as queimadas no centro oeste, é predominante o estado do mato grosso com a maior quantidade de queimadas disparadamente. Aliás, analisando a evolução das queimadas ao longo dos anos, o ano de 2009 ocorre um aumento abrupto de queimadas em Goias e Mato Grosso.

Outro ano com aumento abrupto de ocorrencias foi em 2003, com um crescimento vertiginoso também no estado do Maro Grosso.

centro_oeste %>% 
  filter(!(duplicated(total_incend_ano))) %>% 
  ggplot(aes(x = year, y = total_incend_ano, color = state)) +
  geom_line(linewidth = .9) +
  theme_bw() +
  scale_x_continuous(n.breaks = 11) +
  labs(title = 'Evolucao das queimadas na região do Centro-Oeste',
       x = '',
       y = '',
       color = '') +
  theme(plot.title = element_text(face = 'bold', hjust = .5),
        legend.position = 'bottom')

5. O ano de 2009

5.1. Para visualizar o ano de 2009, usaremos um novo objeto para esse ano dos estados do centro oeste.

centro_oeste_2009 <- desmatamento_edit_2 %>% 
  filter(regiao == 'centro oeste',
         year == 2009)

# 12 ocorrencias para cada estado, correspondente a cada mes do ano
centro_oeste_2009 %>% 
  slice(1:15)
## # A tibble: 36 × 7
## # Groups:   year, state, month, date [36]
##     year state            month     number date       total_incendios regiao    
##    <int> <chr>            <chr>      <dbl> <IDate>              <dbl> <chr>     
##  1  2009 Distrito Federal Abril          0 2009-01-01               0 centro oe…
##  2  2009 Distrito Federal Agosto        37 2009-01-01              37 centro oe…
##  3  2009 Distrito Federal Dezembro       0 2009-01-01               0 centro oe…
##  4  2009 Distrito Federal Fevereiro      0 2009-01-01               0 centro oe…
##  5  2009 Distrito Federal Janeiro        1 2009-01-01               1 centro oe…
##  6  2009 Distrito Federal Julho         33 2009-01-01              33 centro oe…
##  7  2009 Distrito Federal Junho          4 2009-01-01               4 centro oe…
##  8  2009 Distrito Federal Maio           9 2009-01-01               9 centro oe…
##  9  2009 Distrito Federal Mar�o          0 2009-01-01               0 centro oe…
## 10  2009 Distrito Federal Novembro       0 2009-01-01               0 centro oe…
## # ℹ 26 more rows

5.2. A progressão do desmatamento no ano de 2009

Ao analisar a progressao do desmatamento no ano de 2009, verifica-se que os meses mais secos do ano (junho, julho, agosto) foram os que Goias teve mais incendio, ou seja, pode ser explicado pela estação seca do ano. Porém no Mato Grosso há uma subida abrupta no mes de abril para maio e setembro para outubro, sendo que a estação mais seca teve queda na incidencia de incendios

5.2.1 Tratando a variavel meses

# aqui é vísivel que março aparece como 'Mar\xe7o'
glimpse(centro_oeste_2009)
## Rows: 36
## Columns: 7
## Groups: year, state, month, date [36]
## $ year            <int> 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, 2009, …
## $ state           <chr> "Distrito Federal", "Distrito Federal", "Distrito Fede…
## $ month           <chr> "Janeiro", "Fevereiro", "Mar\xe7o", "Abril", "Maio", "…
## $ number          <dbl> 1, 0, 0, 0, 9, 4, 33, 37, 5, 3, 0, 0, 30, 29, 32, 11, …
## $ date            <IDate> 2009-01-01, 2009-01-01, 2009-01-01, 2009-01-01, 2009…
## $ total_incendios <dbl> 1, 0, 0, 0, 9, 4, 33, 37, 5, 3, 0, 0, 30, 29, 32, 11, …
## $ regiao          <chr> "centro oeste", "centro oeste", "centro oeste", "centr…
# convertendo esse caracter em Março
centro_oeste_2009 <- centro_oeste_2009 %>%
  mutate(month = ifelse(month == 'Mar\xe7o', 'Março', month))

5.2.2. Tratando os meses como categorias

Os seres humanos reconhecem a ordem dos meses: janeiro, fevereiro, março etc. Porém o R não reconhece automaticamente, necessitando direcioná-lo a ordem.

# transformando a variavel meses em factor
centro_oeste_2009 <- centro_oeste_2009 %>% 
  mutate(month = as.factor(month))

# criando os niveis
centro_oeste_2009 <- centro_oeste_2009 %>% 
  mutate(month = forcats::fct_relevel(month, 'Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio', 'Junho', 'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro'))

Analisando o desmatamento em 2009, é fato que grande parte do aumento no estado de Goias se deve ao fato da estação seca da regiao, que aumenta naturalmente a ocorrencia de queimadas. Por outro lado, o fato de o Mato Grosso tiver um aumento abrupto já no mes de abril para maio abre espaço para que os fatores para esse estado sejam outros.

5.2.2. Progresão do desmatamento em 2009

centro_oeste_2009 %>% 
  ggplot(aes(x = month, y = total_incendios, colour = state, group = state)) +
  geom_line(linewidth = .9) +
  theme_bw() +
  labs(title = 'Evolucao do desmatamento no ano de 2009',
       subtitle = 'Região Centro Oeste',
       x = '',
       y = '',
       colour = '') +
  theme(plot.title = element_text(face = 'bold', hjust = .5),
        plot.subtitle = element_text(hjust = .5),
        legend.position = 'bottom')

6. Mapa do desmatamento em 2009

Já que possuimos dados de desmatamento por estados, é possível criar um mapa dos estados brasileiros, preenchidos pela ocorrencia de incendios;

6.1. Baixando dados geográficos do geobr

library(geobr)
# puxando os estados brasileiros com as suas coordenadas
estados <- read_state(year = 2010, showProgress = T)
## Using year/date 2010
##   |                                                                              |                                                                      |   0%  |                                                                              |===                                                                   |   4%  |                                                                              |=====                                                                 |   7%  |                                                                              |========                                                              |  11%  |                                                                              |==========                                                            |  15%  |                                                                              |=============                                                         |  19%  |                                                                              |================                                                      |  22%  |                                                                              |==================                                                    |  26%  |                                                                              |=====================                                                 |  30%  |                                                                              |=======================                                               |  33%  |                                                                              |==========================                                            |  37%  |                                                                              |=============================                                         |  41%  |                                                                              |===============================                                       |  44%  |                                                                              |==================================                                    |  48%  |                                                                              |====================================                                  |  52%  |                                                                              |=======================================                               |  56%  |                                                                              |=========================================                             |  59%  |                                                                              |============================================                          |  63%  |                                                                              |===============================================                       |  67%  |                                                                              |=================================================                     |  70%  |                                                                              |====================================================                  |  74%  |                                                                              |======================================================                |  78%  |                                                                              |=========================================================             |  81%  |                                                                              |============================================================          |  85%  |                                                                              |==============================================================        |  89%  |                                                                              |=================================================================     |  93%  |                                                                              |===================================================================   |  96%  |                                                                              |======================================================================| 100%
glimpse(desmatamento_edit_2)
## Rows: 5,497
## Columns: 7
## Groups: year, state, month, date [5,497]
## $ year            <int> 1998, 1999, 2000, 2001, 2002, 2003, 2004, 2005, 2006, …
## $ state           <chr> "Acre", "Acre", "Acre", "Acre", "Acre", "Acre", "Acre"…
## $ month           <chr> "Janeiro", "Janeiro", "Janeiro", "Janeiro", "Janeiro",…
## $ number          <dbl> 0, 0, 0, 0, 0, 10, 0, 12, 4, 0, 0, 0, 1, 0, 0, 0, 0, 1…
## $ date            <IDate> 1998-01-01, 1999-01-01, 2000-01-01, 2001-01-01, 2002…
## $ total_incendios <dbl> 0, 0, 0, 0, 0, 10, 0, 12, 4, 0, 0, 0, 1, 0, 0, 0, 0, 1…
## $ regiao          <chr> "norte", "norte", "norte", "norte", "norte", "norte", …
tabyl(desmatamento_edit_2$state)
##  desmatamento_edit_2$state   n    percent
##                       Acre 239 0.04347826
##                    Alagoas 239 0.04347826
##                      Amapa 239 0.04347826
##                   Amazonas 239 0.04347826
##                      Bahia 239 0.04347826
##                      Ceara 239 0.04347826
##           Distrito Federal 239 0.04347826
##             Espirito Santo 239 0.04347826
##                      Goias 239 0.04347826
##                   Maranhao 239 0.04347826
##                Mato Grosso 239 0.04347826
##               Minas Gerais 239 0.04347826
##                    Paraiba 239 0.04347826
##                       Pará 239 0.04347826
##                 Pernambuco 239 0.04347826
##                       Piau 239 0.04347826
##             Rio de Janeiro 239 0.04347826
##                   Rondonia 239 0.04347826
##                    Roraima 239 0.04347826
##             Santa Catarina 239 0.04347826
##                  Sao Paulo 239 0.04347826
##                    Sergipe 239 0.04347826
##                  Tocantins 239 0.04347826

6.2. Criando uma variável em comum para ambas as bases (desmatamento e dados geograficos)

A variavel em comum sera os estados, sendo necessario retirar a pontuação de ambos e alterar um estado ali ou aqui.

6.2.1 Tratando a base (estados)

Renomearemos a variavel name_state para state. Além disso, removeremos os accentos da variavel para evitar erros bobos de identificação. Alias ambas as colunas tem que estar no mesmo formato de dados. Dessa forma, deixarei ambas em factor.

# deixando ambas as colunas com o nome 'state'
estados <- estados %>% 
  rename(state = name_state)

# transformando o nome dos estados em factor
estados <- estados %>% 
  mutate(state = as.factor(state))

library(tm)
# removendo os acentos
estados <- estados %>% 
  mutate(state = rm_accent(state))

tabyl(estados$state)
##        estados$state n    percent
##                 Acre 1 0.03703704
##              Alagoas 1 0.03703704
##                Amapa 1 0.03703704
##             Amazonas 1 0.03703704
##                Bahia 1 0.03703704
##                Ceara 1 0.03703704
##     Distrito Federal 1 0.03703704
##       Espirito Santo 1 0.03703704
##                Goias 1 0.03703704
##             Maranhao 1 0.03703704
##          Mato Grosso 1 0.03703704
##   Mato Grosso Do Sul 1 0.03703704
##         Minas Gerais 1 0.03703704
##                 Para 1 0.03703704
##              Paraiba 1 0.03703704
##               Parana 1 0.03703704
##           Pernambuco 1 0.03703704
##                Piaui 1 0.03703704
##       Rio De Janeiro 1 0.03703704
##  Rio Grande Do Norte 1 0.03703704
##    Rio Grande Do Sul 1 0.03703704
##             Rondonia 1 0.03703704
##              Roraima 1 0.03703704
##       Santa Catarina 1 0.03703704
##            Sao Paulo 1 0.03703704
##              Sergipe 1 0.03703704
##            Tocantins 1 0.03703704

6.2.2. Tratando a base (desmatamento_edit_2)

Removendo acentos e alterando o factor Piau para Piaui. Além disso, tranformando tambem em factor.

# removendo acentos
desmatamento_edit_2 <- desmatamento_edit_2 %>% 
  mutate(state = rm_accent(state))

# Piau é na verdade Piaui
desmatamento_edit_2 <- desmatamento_edit_2 %>% 
  mutate(state = ifelse(state == 'Piau', 'Piaui', state))

# em factor
desmatamento_edit_2 <- desmatamento_edit_2 %>% 
    mutate(state = as.factor(state))

tabyl(desmatamento_edit_2$state)
##  desmatamento_edit_2$state   n    percent
##                       Acre 239 0.04347826
##                    Alagoas 239 0.04347826
##                      Amapa 239 0.04347826
##                   Amazonas 239 0.04347826
##                      Bahia 239 0.04347826
##                      Ceara 239 0.04347826
##           Distrito Federal 239 0.04347826
##             Espirito Santo 239 0.04347826
##                      Goias 239 0.04347826
##                   Maranhao 239 0.04347826
##                Mato Grosso 239 0.04347826
##               Minas Gerais 239 0.04347826
##                       Para 239 0.04347826
##                    Paraiba 239 0.04347826
##                 Pernambuco 239 0.04347826
##                      Piaui 239 0.04347826
##             Rio de Janeiro 239 0.04347826
##                   Rondonia 239 0.04347826
##                    Roraima 239 0.04347826
##             Santa Catarina 239 0.04347826
##                  Sao Paulo 239 0.04347826
##                    Sergipe 239 0.04347826
##                  Tocantins 239 0.04347826

6.3. Juntando as bases por leftjoin

Aqui juntaremos os dados geográficos dos estados com os dados de desmatamento. A variavel em comum é a variavel state.

# selecionando o que quero importar da variavel estados
estados <- estados %>% 
  select(state, geom)


desmatamento_edit_2 <- desmatamento_edit_2 %>% 
  left_join(estados, by = 'state')

6.4. Criando a variavel total de incendios por ano por estado

Agrupamos por estado e por ano e somamos o total de incendios de cada mes para formar o total do ano.

desmatamento_edit_2 <- desmatamento_edit_2 %>%
  group_by(state, year) %>% 
  mutate(total_incend_ano = sum(total_incendios))

# visualizandoo
desmatamento_edit_2 %>% 
  select(state, year, month, total_incendios, total_incend_ano) %>% 
  filter(year == 2000) %>% 
  print(n = 12)
## # A tibble: 276 × 5
## # Groups:   state, year [23]
##    state  year month     total_incendios total_incend_ano
##    <chr> <int> <chr>               <dbl>            <dbl>
##  1 Acre   2000 Janeiro                 0              434
##  2 Acre   2000 Fevereiro               0              434
##  3 Acre   2000 Mar�o                  11              434
##  4 Acre   2000 Abril                   1              434
##  5 Acre   2000 Maio                    1              434
##  6 Acre   2000 Junho                   1              434
##  7 Acre   2000 Julho                   1              434
##  8 Acre   2000 Agosto                136              434
##  9 Acre   2000 Setembro              265              434
## 10 Acre   2000 Outubro                18              434
## 11 Acre   2000 Novembro                0              434
## 12 Acre   2000 Dezembro                0              434
## # ℹ 264 more rows

6.5. Mapa desmatamento de 2009

Analisando o mapa do desmatamento, é fato que em 2009 a região do Centro Oeste teve ocorrencias muito acima da média comparada à outras regiões. Sendo a única em uma cor vibrante, reflete como o estado sofreu com os incendios durante esse ano.

desmatamento_edit_2 %>% 
  filter(year == 2009) %>% 
  ggplot() +
  geom_sf(aes(fill = total_incend_ano, geometry = geom)) +
  facet_wrap(~ regiao, labeller = labeller(regiao = c('centro oeste' = 'Centro Oeste', 
                                                       'nordeste' = 'Nordeste', 
                                                       'norte' = 'Norte',
                                                       'sudeste' = 'Sudeste', 
                                                       'sul' = 'Sul'))) +
  scale_fill_distiller(direction = 1, palette = 'Reds') +
  labs(title = 'Distribuição dos incendios por regiao em 2009',
       fill = '' ) +
  theme_bw() +
  theme(plot.title = element_text(face = 'bold', hjust = .5))

7. Conclusao

Por fim, analisamos uma serie de categorias que permite visualizar de diferentes maneiras os efeitos do desmatamento nos estados brasileiros. Embora tenhamos focado no problema mais analitacamente, sem analisar os fatores que culminaram a maior incidencia de desmatamentos em certos estados, tal estudo permite que outros teóricos tenham a ciencia dessas ferramentas para futuras análises sobre desmatamento pelo Brasil.