Essa análise tem como base os dados da semana 15 do projeto TidyTuesday, que consiste na análise colaborativa de dados por parte dos usuários de R. O tema dessa semana é o desmatamento global ao longo dos anos, com cinco bases distintas estando disponíveis:
Nível de conversão das áreas de floresta
Percentual da área de floresta global dos países e regiões
Composição do desmatamento de florestas no Brasil
Produção de soja e uso por cada país
Produção de óleo vegetal por tipo de cultura
# Carregando os dados
forest <- readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-04-06/forest.csv')
forest_area <- readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-04-06/forest_area.csv')
brazil_loss <- readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-04-06/brazil_loss.csv')
soybean_use <- readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-04-06/soybean_use.csv')
vegetable_oil <- readr::read_csv('https://raw.githubusercontent.com/rfordatascience/tidytuesday/master/data/2021/2021-04-06/vegetable_oil.csv')
# Carregando pacotes
library(tidyverse)
library(extrafont)
loadfonts(device = "win")
library(RColorBrewer)
library(scales)
# Definindo padrão de gráfica
theme_set(theme_light())
A proposta inicial é observar, ao longo dos anos, como se alterou a ordem de países quanto a questões como área de floresta (em escala global) e como saldo de preservação, que é o plantio descontado do desmatamento.
# Analisando países com maior área de floresta ao longo do tempo
net_and_area <- forest %>%
filter(entity != "World") %>%
left_join(forest_area, by = c("entity", "year")) %>%
slice_max(order_by = forest_area, n = 25) %>%
select(-c(code.x, code.y)) %>%
mutate(forest_area = forest_area/100)
ggplot(net_and_area, aes(year, forest_area, color = entity, group = entity)) +
geom_line(size = 0.75) +
geom_point() +
scale_color_brewer(palette = "Dark2") +
scale_y_continuous(labels = scales::percent_format()) +
labs(title = "Percentual de Florestas (mundial)",
color = "País") +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black"),
axis.text.y = element_text(color = "black"),
panel.grid = element_blank())
ggplot(net_and_area, aes(year, net_forest_conversion, color = entity, group = entity)) +
geom_line(size = 1) +
geom_point() +
geom_hline(yintercept = 0, linetype = "dashed", color = "red", size = 1) +
scale_color_brewer(palette = "Dark2") +
scale_y_continuous(labels = scales::label_comma()) +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black"),
axis.text.y = element_text(color = "black"),
panel.grid = element_blank()) +
labs(color = "País",
title = "Saldo da Área de Floresta (hectares)")
Uma análise dos gráficos acima nos permite inferir que, como era de se esperar, os países com as maiores dimensões territoriais também acabam sendo, em geral, os países com as maiores áreas de floresta no mundo. Porém, é válido ressaltar a existência de tendências dessa métrica ao longo dos anos, sendo exemplificada principalmeente pela queda do percentual do Brasil e pelo crescimento de Rússia e de China, que ocupam a primeira e a quinta posições no quesito de área de floresta, respectivamente. De certa maneira, o gráfico que apresenta o saldo da área de floresta é uma explicação para as tendências previamente observadas no gráfico anterior, posto que a posição da China de país que mais aumentou sua proporção de áreas de floresta e a postura oposta do Brasil tornam-se nítidas.
A agricultura, segundo texto do site Our World in Data, é a razão de no mínimo 75% da perda de hectares de áreas de floresta. Áreas de plantio já correspondem a metade das terras habitáveis disponíveis, muitas delas ligadas ao cultivo de culturas como a soja. Nesse contexto, busca-se ver o volume produtivo por cultura de oléo vegetal ao longo do tempo a nível mundial. Além disso, é de interesse analisar essa composição no Brasil e na China, pólos opostos em quesito de preservação recente, agrupando tanto por culturas de óleo vegetal quanto pelo plantio de soja.
# qual óleo vegetal foi o mais produzido?
vegetable_oil %>%
na.omit() %>%
group_by(year, crop_oil) %>%
summarise(production = sum(production)) %>%
ungroup() %>%
ggplot(aes(year, production, color = crop_oil, group = crop_oil)) +
geom_line(size = 0.75) +
facet_wrap(vars(crop_oil)) +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black", angle = 90),
axis.text.y = element_text(color = "black")) +
scale_y_log10(labels = scales::comma_format()) +
scale_x_continuous(breaks = round(seq(min(vegetable_oil$year), max(vegetable_oil$year), by = 12),1)) +
labs(title = "Produção de Óleo Vegetal por Tipo de Cultura",
subtitle = "Medida em toneladas",
color = "Cultura")
Observando a produção das culturas de óleo vegetal ao longo do tempo vê-se uma tendência de crescimento mundial do cultivo de palm oil (óleo que origina o azeite de dendê), rapeseed (colza), soybean (soja) e sunflower (girassol). Em contrapartida, culturas como linseed (linhaça) apresentam uma estagnação na quantidade produzida ao longo do tempo.
# observando a produção de óleo em Brasil e China (extremos de preservação LÍQUIDA ao longo do tempo)
vegetable_oil %>%
filter(entity == "Brazil") %>%
na.omit() %>%
group_by(year, crop_oil) %>%
summarise(production = sum(production)) %>%
ungroup() %>%
ggplot(aes(year, production, color = crop_oil, group = crop_oil)) +
geom_line(size = 0.75) +
facet_wrap(vars(crop_oil)) +
scale_y_log10(labels = scales::comma_format()) +
scale_x_continuous(breaks = round(seq(min(vegetable_oil$year), max(vegetable_oil$year), by = 12),1)) +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black", angle = 90),
axis.text.y = element_text(color = "black")) +
labs(title = "Produção de Óleo Vegetal por Tipo de Cultura no Brasil",
subtitle = "Medida em toneladas",
color = "Cultura")
vegetable_oil %>%
filter(entity == "China") %>%
na.omit() %>%
group_by(year, crop_oil) %>%
summarise(production = sum(production)) %>%
ungroup() %>%
ggplot(aes(year, production, color = crop_oil, group = crop_oil)) +
geom_line(size = 0.75) +
facet_wrap(vars(crop_oil)) +
scale_y_log10(labels = scales::comma_format()) +
scale_x_continuous(breaks = round(seq(min(vegetable_oil$year), max(vegetable_oil$year), by = 12),1)) +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black", angle = 90),
axis.text.y = element_text(color = "black"),
) +
labs(title = "Produção de Óleo Vegetal por Tipo de Cultura na China",
subtitle = "Medida em toneladas",
color = "Cultura")
Um aprofundamento nos dados disponíveis permite comparativamente ver como Brasil e China produziram tipos diferentes de óleo vegetal ao longo do tempo. Não tendo como objetivo fazer inferências sobre o impacto de um cultivo específico no desmatamento, busca-se somente a existência de tendências agrícolas em cada território. No Brasil a soja é a cultura mais produzida quanto aos óleos vegetais, experimentando um crescimento significativo no país durante os anos 1960. Além disso, durante os anos 1970 é possível ver o início do plantio da cultura rapeseed (colza) no país, provavelmente utilizado na produção de biodiesel. Na China, por sua vez, colza e soja também apresentam um protagonismo, chegando a ser produzidas a partir de 2010 aproximadamente 10 milhões de toneladas por ano. Cabe ressaltar, entretanto, que a China também apresenta relevância na produção de óleos de cottonseed (algodão) e groundnut (amendoim).
# vendo a composição da soja no Brasil e na China
soybean_use %>%
filter(entity %in% c("Brazil", "China") & year %in% c(1970, 1980,
1990, 2000, 2010)) %>%
pivot_longer(human_food:processed, names_to = "use", values_to = "quantity") %>%
ggplot(aes(year, quantity, fill = use)) +
geom_bar(stat = "identity", position = "fill") +
facet_wrap(vars(entity)) +
scale_y_continuous(labels = scales::percent_format(), breaks =
seq(0, 1, by = .1)) +
scale_fill_discrete(name = "Uso",labels = c("Alimento animal", "Alimento humano", "Processada")) +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black"),
axis.text.y = element_text(color = "black")) +
labs(title = "Composição da Produção de Soja")
Por fim, almeja-se compreender as formas de utilização da crescente produção da soja nesses dois países. Nesse sentido, dois padrões distintos podem ser observados. A soja brasileira, ao longo das décadas, foi majoritariamente processada, sempre acima de 90% do volume total. No ano de 2010 esse valor ultrapassou os 95%, em um indício de uma especialização quase que completa. Quanto à China, vê-se uma reversão de uma produção voltada para a alimentação humana em direção a um nível maior de processamento. Além disso, é nítido o recentemente crescimento da produção voltada para a alimentação de animais. De certa maneira, a produção visando o alimento humano perdeu importância quase que absoluta, tornando-se a menor fonte de utilização.
Nesta terceira análise a atenção é voltada para a base de dados que contém quantos hectares cada causa distinta contribuiu para o desmatamento de florestas no Brasil ao longo dos anos. Dentre as razões incluídas estão: colheita agrícola, inundações em função de barragens, catástrofes naturais, pastagem, exploração madereira, queimadas, mineração, estradas, desmatamento de pequena escala, dentre outros.
# analisando o impacto de cada tópico na perda de floresta do Brasil
brazil_loss %>%
pivot_longer(commercial_crops:small_scale_clearing, names_to = "cause",
values_to = "amount") %>%
mutate(cause = fct_lump(cause, n = 5, w = amount)) %>%
mutate(cause = fct_reorder(cause, amount)) %>%
ggplot(aes(year, amount, fill = cause)) +
geom_bar(position = "fill", stat = "identity") +
scale_y_continuous(labels = scales::percent_format(), breaks =
seq(0,1, by = 0.1)) +
scale_x_continuous(breaks = seq(min(brazil_loss$year), max(brazil_loss$year))) +
scale_fill_discrete(name = "Causa") +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black"),
axis.text.y = element_text(color = "black")) +
labs(title = "Composição do Desmatamento das Florestas Brasileiras")
O primeiro gráfico trata sobre como, de maneira proporcional, cada causa contribuiu para o desmatamento das florestas. A grande maioria do desmatamento ao longo dos anos é atribuído às pastagens, com índices predominantemente acima dos 40% do total. Destaque também é conferido para as queimadas, que aparentam ter um efeito esporádico considerável, como pode ser visto no ano de 2010. Além disso, a abertura de terrenos em pequena escala é um fator que figura dentre os mais danosos, apresentando um caráter negativo quando tomado em termos acumulados.
brazil_loss %>%
pivot_longer(commercial_crops:small_scale_clearing, names_to = "cause",
values_to = "amount") %>%
mutate(cause = fct_lump(cause, n = 5, w = amount)) %>%
mutate(cause = fct_reorder(cause, amount)) %>%
ggplot(aes(year, amount, fill = cause)) +
geom_bar(stat = "identity") +
scale_y_continuous(labels = scales::comma_format()) +
scale_x_continuous(breaks = round(seq(min(brazil_loss$year), max(brazil_loss$year), by = 1),1)) +
scale_fill_discrete(name = "Causa") +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black"),
axis.text.y = element_text(color = "black")) +
labs(title = "Desmatamento Absoluto das Florestas Brasileiras",
subtitle = "Medida em Hectares")
A análise do desmatamento em termos absolutos vai indicar uma tendência de queda expressiva do desmatamento no Brasil a partir de 2006, o que todavia não é um motivo de grande comemoração, visto que comparativamente com os demais países da base de dados o nível de desmatamento ainda é expressivo, mesmo quando comparado com países com extensão territorial semelhante. A redução do desmatamento em função do plantio agrícola também necessita ser ressaltada, dado que foi uma das causas que mais diminuiu ao longo dos anos observados.
Dada a proeminência da produção de óleo de soja em anos recentes vista nas análises da parte 2, busca-se nessa análise ver como a produção mundial da soja se alterou em termos de volume, considerando também a destinação da soja produzida.
# existe uma tendência "Go Vegan"?
soybean_use %>%
na.omit() %>%
select(-code) %>%
pivot_longer(human_food:processed, names_to = "use", values_to = "quantity") %>%
group_by(use, year) %>%
summarise(total = sum(quantity)) %>%
ggplot(aes(year, total, group = use, color = use)) +
geom_line(size = 1) +
geom_vline(xintercept = 2003, size = 0.5, linetype = "dashed") +
scale_y_log10(labels = scales::comma_format()) +
scale_x_continuous(breaks = seq(min(soybean_use$year), max(soybean_use$year), by = 5)) +
scale_color_discrete(name = "Uso", labels = c("Alimento animal", "Alimento humano", "Processada")) +
annotate(geom = "text", label = "Ano: 2003", x = 1996, y = 30000000) +
geom_segment(aes(x = 1996, y = 25000000, xend = 2001, yend = 20000000),
arrow = arrow(length = unit(0.5, "cm")), color = "black") +
theme(plot.title = element_text(hjust = 0.5),
text = element_text(family = "Segoe UI"),
axis.title.x = element_blank(),
axis.title.y = element_blank(),
axis.text.x = element_text(color = "black"),
axis.text.y = element_text(color = "black")) +
labs(title = "Qual a Composição Mundial da Soja?")
O gráfico acima apresenta um padrão parecido com o visto na destinação da soja produzida na China: a soja processada é a maioria do volume produzido e o uso como alimento animal vem ganhando terreno frente à destinação para alimentação humana. É destacado o ano de 2003, o ponto de partida a partir do qual a destinação para alimentação animal tornou-se o segundo maior destino da soja produzida.