library(gtrendsR)
library(ggplot2)
library(dplyr)
library(patchwork)

O Google Trends foi utilizado para responder a questões relacionadas ao Brasil em diferentes aspectos (cultural, político, ambiental, esportivo), visualizar quais os países que mais mais interessados sobre o Brasil e o que é mais buscado no mundo sobre o país.

brasil = gtrends(c('brazil'), time = "all")
ggplot(brasil$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('Brazil'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = 'LimeGreen') + 
  scale_x_date(NULL, date_labels = "%b/%Y", breaks = seq.Date(from = as.Date('2006-06-01'), to = as.Date('2020-06-01'), by = '4 year')) +
  theme_minimal()

Pelo grĂ¡fico de linha acima foi possĂ­vel perceber que os picos de busca pela palavra chave brazil coincidiram com os anos de copa do mundo, com destaque para a copa de 2014 sediada no paĂ­s.

brasil.copa = gtrends(c("brazil", 'brazil world cup'), time = "all") 

brasil.copa = brasil.copa$interest_over_time %>% 
  mutate(hits = as.numeric(hits), date = as.Date(date)) %>% 
  filter(!is.na(hits))
ggplot(brasil.copa, aes(x = date, y = hits, group=keyword)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('Brazil') , ' e ', italic('Brazil world cup'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = c('LimeGreen', 'blue')) + 
  scale_x_date(NULL, date_labels = "%b/%Y", breaks = seq.Date(from = as.Date('2006-06-01'), to = as.Date('2020-06-01'), by = '4 year')) +
  theme_minimal()

Ao visualizar o grĂ¡fico de linha com as duas palavras chave brazil e brazil world cup, percebeu-se que os perĂ­odos de maior busca por brazil realmente coindiram com os de maior busca por brasil world cup.

topicos = brasil$related_topics %>% 
  filter(related_topics == 'top', subject > 0, value != 'Brazil') %>% 
  mutate(value = factor(value, 
                        levels = value[order(as.numeric(subject))])) %>% 
  ggplot(aes(x = as.numeric(subject), y = value)) +
  geom_bar(fill = 'LimeGreen', stat = "identity") +
  labs(title = 'TĂ³picos Relacionados Ă  busca sobre Brazil', x = NULL, y = NULL) +
  theme_minimal() +
  theme(axis.text.y = element_text(size=12)) 

queries = brasil$related_queries %>% 
  filter(related_queries == 'top', subject > 0, value != 'Brazil') %>%
  mutate(value = factor(value, 
                        levels = value[order(as.numeric(subject))])) %>% 
  ggplot(aes(x = as.numeric(subject), y = value)) +
  geom_bar(fill = 'LimeGreen', stat = "identity") +
  labs(title = 'Perguntas (queries) Relacionadas Ă  busca sobre Brazil', x = NULL, y = NULL) +
  theme_minimal() +
  theme(axis.text.y = element_text(size=12)) 

(topicos + queries)

A visualizaĂ§Ă£o acima confirmou a indicaĂ§Ă£o do primeiro grĂ¡fico que as buscas por brazil estĂ£o relacionadas a futebol e copa do mundo.

brasil$interest_by_country %>% 
  mutate(hits = as.numeric(hits)) %>% 
  filter(hits > 20) %>% 
  arrange(desc(hits)) %>% 
  select(location, hits) %>% 
  mutate(location = factor(location, 
                        levels = location[order(hits, decreasing = TRUE)],
                        ordered=TRUE)) %>% 
  ggplot(aes(x = location, y = hits)) +
  geom_col(fill = 'LimeGreen') + 
  labs(title = expression(paste('Interesse por paĂ­s na palavra chave ', italic('Brazil'))), x = 'PaĂ­s', y = 'Interesse') + 
  theme_minimal() +
  theme(axis.text.x = element_text(angle=30, size = 11))

Pelo grĂ¡fico de colunas acima, verificou-se que os paĂ­ses do continente africano foram os mais interessados sobre o Brazil.

cultura = ggplot(gtrends(c('brazilian culture'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('brazilian culture'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = 'gold') + 
  scale_x_date(date_labels = "%b/%Y", date_breaks = "2 year") +
  theme_minimal() +
  theme(legend.position = 'bottom')

carnaval = ggplot(gtrends(c('brazilian carnival'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('brazilian carnival'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = 'orange') + 
  scale_x_date(NULL, breaks = seq.Date(from = as.Date('2004-02-01'), to = as.Date('2020-02-01'), by = '2 year'), date_labels = "%b/%Y") + 
  theme_minimal() +
  theme(legend.position = 'bottom')

cultura / carnaval

musica.danca = ggplot(gtrends(c('brazilian dance', 'brazilian music'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('brazilian dance') , ' e ', italic('brazilian music'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = c('blue', 'magenta')) + 
  scale_x_date(NULL, date_labels = "%b/%Y", date_breaks = "2 year") +
  theme_minimal() +
  theme(legend.position = 'bottom')

film.tv = ggplot(gtrends(c('brazilian film', 'brazilian soap opera'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('brazilian film'), ' e ', italic('soap opera'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = c('DarkSlateGray', 'red')) + 
  scale_x_date(NULL, date_labels = "%b/%Y", date_breaks = "2 year") +
  theme_minimal() +
  theme(legend.position = 'bottom')

musica.danca/film.tv

Os quatro grĂ¡ficos de linha mostraram que o interesse pela cultura e produções brasileiras caĂ­ram ao longo do tempo, tendo sido mais altas, em geral, atĂ© 2010.

Pelo grĂ¡fico de interesse por brazilian dance e brazilian music, percebeu-se que o interesse pela mĂºsica foi consideravelmente superior atĂ© 2010, enquanto o interesse pela dança foi mais constante com pequenas oscilações, tendo algumas vezes superado a mĂºsica de 2011 a 2016.

Em relaĂ§Ă£o ao interesse pelo carnaval, apesar de ter seguido a tendĂªncia decrescente das demais palavras chave, o interesse oscilou periodicamente, com as maiores buscas tendo sido realizadas no mĂªs de fevereiro.

JĂ¡ o interesse pelas produções cinematogrĂ¡ficas e de novelas, a visualizaĂ§Ă£o mostrou que o interesse pelos filmes brasileiros foi superior, em todos os anos, ao interesse pelas novelas.

floresta = ggplot(gtrends(c('amazon rainforest'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('amazon rainforest'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = c('ForestGreen')) + 
  scale_x_date(NULL, date_labels = "%b/%y", date_breaks = "2 year") +
  theme_minimal() + 
  theme(legend.position = 'bottom')

brazilian.amazon = gtrends(c('brazilian amazon rainforest'), time = "all")
brasil.floresta = ggplot(brazilian.amazon$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('brazilian amazon rainforest'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = c('ForestGreen')) + 
  scale_x_date(NULL, date_labels = "%b/%y", date_breaks = "2 year") +
  theme_minimal() +
  theme(legend.position = 'bottom')

queimada.floresta = ggplot(gtrends(c('brazil burning'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('brazil burning'), ' e ', italic('brazilian amazon rainforest'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = c('brown', 'ForestGreen')) + 
  scale_x_date(NULL, date_labels = "%b/%Y", date_breaks = "2 year") +
  theme_minimal() +
  theme(legend.position = 'bottom')

(floresta + brasil.floresta)/queimada.floresta

AtravĂ©s da visualizaĂ§Ă£o da busca pela palavra chave amazon rainforest, percebeu-se que o interesse pela floresta amazĂ´nica foi mĂ¡ximo no ano de 2019 devido Ă s fortes queimadas, que chamaram a atenĂ§Ă£o do mundo, registradas no ano.

No entanto, a busca pela floresta amazĂ´nica especificamente brasileira nĂ£o acompanhou proporcionalmente o interesse geral pela floresta amazĂ´nica mostrada no primeiro grĂ¡fico. Apesar do ano de 2019 tambĂ©m ter apresentado uma elevaĂ§Ă£o nas buscas, foi no perĂ­odo de 2004 a 2008 que a busca por brazilian amazon rainforest foi mais alta.

A palavra chave brazilian burning apresentou um grĂ¡fico de interesse prĂ³ximo do encontrado ao utilizar amazon rainforest, com pico de buscas no ano de 2019. Entretanto, altos valores tambĂ©m foram registrados mais constantemente atĂ© o ano de 2007, com pico isolado em 2014 e mĂ¡ximo valor em 2019. Deve-se salientar, que a palavra chave de busca Ă© subjetiva: burning pode ter sido utilizado no sentido literal nĂ£o sĂ³ para queimadas em floresta, mas em casos de grandes incĂªndios, por exemplo, ou no sentido figurado como sinĂ´nimo de inquietaĂ§Ă£o, manifestaĂ§Ă£o, possivelmente de cunho polĂ­tico.

brazilian.amazon$interest_by_country %>% 
  filter(hits > 1)
##         location hits                     keyword   geo gprop
## 1 United Kingdom  100 brazilian amazon rainforest world   web
## 2  United States   35 brazilian amazon rainforest world   web

Ao verificar quais paĂ­ses apresentaram maior interesse na busca sobre floresta amazĂ´nica brasileira, a funĂ§Ă£o gtrends mostrou que somente os Estados Unidos fizeram esta busca.

brazilian.amazon$related_topics %>% 
  filter(related_topics == 'top', subject > 0) %>%
  mutate(value = factor(value, 
                        levels = value[order(as.numeric(subject))])) %>% 
  ggplot(aes(x = as.numeric(subject), y = value)) +
  geom_bar(fill = 'ForestGreen', stat = "identity") +
  labs(title = 'TĂ³picos Relacionados Ă  busca sobre a Floresta amazĂ´nica brasileira', x = NULL, y = NULL) +
  theme_minimal() +
  theme(axis.text.y = element_text(size=12)) 

Dentre os tĂ³picos relacionados Ă  busca pela floresta amazĂ´nica brasileira (brazilian amazon rainforest), os mais buscados sĂ£o termos presentes na palavra chave, como amazon rainforest, brazil, brazilians, rainforest, mas o quinto tĂ³pico (Amazon.com) se trata do site de e-commerce. No entanto, os tĂ³picos mais interessantes sĂ£o aqueles que demostram a preocupaĂ§Ă£o com a floresta e sua destruiĂ§Ă£o como Animal, River, Government, Climate e Food.

corrupcao.brasil = gtrends(c('corrupĂ§Ă£o'), geo = c('BR'), time = "all")

corrupcao = ggplot(corrupcao.brasil$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('corrupĂ§Ă£o'), ' no Brasil')), x = NULL, y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = c('Chocolate')) + 
  scale_x_date(breaks = seq.Date(from = as.Date('2004-01-01'), to = as.Date('2021-01-01'), by = '1 year'), date_labels = "%b/%y") +
  theme_minimal() +
  theme(legend.position = 'bottom')

corruption = ggplot(gtrends(c('brazilian corruption'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('brazilian corruption'), ' no mundo')), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_color_manual(values = c('Chocolate')) + 
  scale_x_date(breaks = seq.Date(from = as.Date('2004-01-01'), to = as.Date('2021-01-01'), by = '1 year'), date_labels = "%b/%y") +
  theme_minimal() +
  theme(legend.position = 'bottom')

corrupcao / corruption

Ao visualizar o interesse pela palavra corrupĂ§Ă£o no Brasil, foi possĂ­vel perceber um padrĂ£o de picos e vales: os vales (quedas) foram registrados de maneira padrĂ£o no Ă­nicio (janeiro), meio (junho) e final do ano (dezembro). Estes trĂªs meses coincidem com o perĂ­odo de fĂ©rias no Brasil, podendo entĂ£o ser um grande indicador para perda de interesse sobre corrupĂ§Ă£o nestes meses.

O mesmo padrĂ£o nĂ£o foi observado no grĂ¡fico do interesse pela corrupĂ§Ă£o brasileira pelos paĂ­ses. A tendĂªncia de busca pela palavra diminuiu ao longo do tempo com maior interesse entre 2005 e 2009.

corrupcao.brasil$interest_by_region %>% 
  mutate(location = gsub('State of ', '', location),
         location = gsub('ĂƒÂ£', 'Ă£', location),
         location = gsub('ĂƒÂ¡', 'Ă¡', location),
         location = gsub('ĂƒÂ´', 'Ă´', location),
         location = gsub('Ăƒ', 'Ă­', location),
         location = factor(location, levels = location[order(hits)])) %>% 
  ggplot(aes(x = hits, y = location)) +
  geom_bar(fill = 'chocolate', stat = "identity") +
  labs(title = expression(paste('Estados brasileiros com maior interesse na palavra chave ', italic('corrupĂ§Ă£o'))), x = NULL, y = NULL) +
  theme_minimal() +
  theme(axis.text.y = element_text(size=11)) 

Os estados das regiões norte e nordeste, com exceĂ§Ă£o do Distrito Federal, foram os que mais buscaram sobre a palavra corrupĂ§Ă£o durante o perĂ­odo de 2004 a 2020.

gtrends(c('brazilian election', 'brazilian president'), time = "all")$interest_over_time %>% 
  mutate(hits = as.numeric(hits)) %>% 
  filter(!is.na(hits)) %>% 
ggplot(aes(x = as.Date(date), y = hits)) +
  geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
  labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('brazilian election'), ' e ', italic('brazilian president'), ' no mundo')), x = 'Ano', y = 'Interesse', col = 'Busca') +
  scale_x_date(breaks = seq.Date(from = as.Date('2004-01-01'), to = as.Date('2021-01-01'), by = '1 year'), date_labels = "%Y") +
  theme_minimal() +
  theme(legend.position = 'bottom')