library(gtrendsR)
library(ggplot2)
library(dplyr)
library(patchwork)
O Google Trends foi utilizado para responder a questões relacionadas ao Brasil em diferentes aspectos (cultural, polĂtico, ambiental, esportivo), visualizar quais os paĂses que mais mais interessados sobre o Brasil e o que Ă© mais buscado no mundo sobre o paĂs.
brasil = gtrends(c('brazil'), time = "all")
ggplot(brasil$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('Brazil'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = 'LimeGreen') +
scale_x_date(NULL, date_labels = "%b/%Y", breaks = seq.Date(from = as.Date('2006-06-01'), to = as.Date('2020-06-01'), by = '4 year')) +
theme_minimal()
Pelo grĂ¡fico de linha acima foi possĂvel perceber que os picos de busca pela palavra chave brazil coincidiram com os anos de copa do mundo, com destaque para a copa de 2014 sediada no paĂs.
brasil.copa = gtrends(c("brazil", 'brazil world cup'), time = "all")
brasil.copa = brasil.copa$interest_over_time %>%
mutate(hits = as.numeric(hits), date = as.Date(date)) %>%
filter(!is.na(hits))
ggplot(brasil.copa, aes(x = date, y = hits, group=keyword)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('Brazil') , ' e ', italic('Brazil world cup'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = c('LimeGreen', 'blue')) +
scale_x_date(NULL, date_labels = "%b/%Y", breaks = seq.Date(from = as.Date('2006-06-01'), to = as.Date('2020-06-01'), by = '4 year')) +
theme_minimal()
Ao visualizar o grĂ¡fico de linha com as duas palavras chave brazil e brazil world cup, percebeu-se que os perĂodos de maior busca por brazil realmente coindiram com os de maior busca por brasil world cup.
topicos = brasil$related_topics %>%
filter(related_topics == 'top', subject > 0, value != 'Brazil') %>%
mutate(value = factor(value,
levels = value[order(as.numeric(subject))])) %>%
ggplot(aes(x = as.numeric(subject), y = value)) +
geom_bar(fill = 'LimeGreen', stat = "identity") +
labs(title = 'TĂ³picos Relacionados Ă busca sobre Brazil', x = NULL, y = NULL) +
theme_minimal() +
theme(axis.text.y = element_text(size=12))
queries = brasil$related_queries %>%
filter(related_queries == 'top', subject > 0, value != 'Brazil') %>%
mutate(value = factor(value,
levels = value[order(as.numeric(subject))])) %>%
ggplot(aes(x = as.numeric(subject), y = value)) +
geom_bar(fill = 'LimeGreen', stat = "identity") +
labs(title = 'Perguntas (queries) Relacionadas Ă busca sobre Brazil', x = NULL, y = NULL) +
theme_minimal() +
theme(axis.text.y = element_text(size=12))
(topicos + queries)
A visualizaĂ§Ă£o acima confirmou a indicaĂ§Ă£o do primeiro grĂ¡fico que as buscas por brazil estĂ£o relacionadas a futebol e copa do mundo.
brasil$interest_by_country %>%
mutate(hits = as.numeric(hits)) %>%
filter(hits > 20) %>%
arrange(desc(hits)) %>%
select(location, hits) %>%
mutate(location = factor(location,
levels = location[order(hits, decreasing = TRUE)],
ordered=TRUE)) %>%
ggplot(aes(x = location, y = hits)) +
geom_col(fill = 'LimeGreen') +
labs(title = expression(paste('Interesse por paĂs na palavra chave ', italic('Brazil'))), x = 'PaĂs', y = 'Interesse') +
theme_minimal() +
theme(axis.text.x = element_text(angle=30, size = 11))
Pelo grĂ¡fico de colunas acima, verificou-se que os paĂses do continente africano foram os mais interessados sobre o Brazil.
cultura = ggplot(gtrends(c('brazilian culture'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('brazilian culture'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = 'gold') +
scale_x_date(date_labels = "%b/%Y", date_breaks = "2 year") +
theme_minimal() +
theme(legend.position = 'bottom')
carnaval = ggplot(gtrends(c('brazilian carnival'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('brazilian carnival'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = 'orange') +
scale_x_date(NULL, breaks = seq.Date(from = as.Date('2004-02-01'), to = as.Date('2020-02-01'), by = '2 year'), date_labels = "%b/%Y") +
theme_minimal() +
theme(legend.position = 'bottom')
cultura / carnaval
musica.danca = ggplot(gtrends(c('brazilian dance', 'brazilian music'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('brazilian dance') , ' e ', italic('brazilian music'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = c('blue', 'magenta')) +
scale_x_date(NULL, date_labels = "%b/%Y", date_breaks = "2 year") +
theme_minimal() +
theme(legend.position = 'bottom')
film.tv = ggplot(gtrends(c('brazilian film', 'brazilian soap opera'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('brazilian film'), ' e ', italic('soap opera'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = c('DarkSlateGray', 'red')) +
scale_x_date(NULL, date_labels = "%b/%Y", date_breaks = "2 year") +
theme_minimal() +
theme(legend.position = 'bottom')
musica.danca/film.tv
Os quatro grĂ¡ficos de linha mostraram que o interesse pela cultura e produções brasileiras caĂram ao longo do tempo, tendo sido mais altas, em geral, atĂ© 2010.
Pelo grĂ¡fico de interesse por brazilian dance e brazilian music, percebeu-se que o interesse pela mĂºsica foi consideravelmente superior atĂ© 2010, enquanto o interesse pela dança foi mais constante com pequenas oscilações, tendo algumas vezes superado a mĂºsica de 2011 a 2016.
Em relaĂ§Ă£o ao interesse pelo carnaval, apesar de ter seguido a tendĂªncia decrescente das demais palavras chave, o interesse oscilou periodicamente, com as maiores buscas tendo sido realizadas no mĂªs de fevereiro.
JĂ¡ o interesse pelas produções cinematogrĂ¡ficas e de novelas, a visualizaĂ§Ă£o mostrou que o interesse pelos filmes brasileiros foi superior, em todos os anos, ao interesse pelas novelas.
floresta = ggplot(gtrends(c('amazon rainforest'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('amazon rainforest'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = c('ForestGreen')) +
scale_x_date(NULL, date_labels = "%b/%y", date_breaks = "2 year") +
theme_minimal() +
theme(legend.position = 'bottom')
brazilian.amazon = gtrends(c('brazilian amazon rainforest'), time = "all")
brasil.floresta = ggplot(brazilian.amazon$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('brazilian amazon rainforest'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = c('ForestGreen')) +
scale_x_date(NULL, date_labels = "%b/%y", date_breaks = "2 year") +
theme_minimal() +
theme(legend.position = 'bottom')
queimada.floresta = ggplot(gtrends(c('brazil burning'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('brazil burning'), ' e ', italic('brazilian amazon rainforest'))), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = c('brown', 'ForestGreen')) +
scale_x_date(NULL, date_labels = "%b/%Y", date_breaks = "2 year") +
theme_minimal() +
theme(legend.position = 'bottom')
(floresta + brasil.floresta)/queimada.floresta
AtravĂ©s da visualizaĂ§Ă£o da busca pela palavra chave amazon rainforest, percebeu-se que o interesse pela floresta amazĂ´nica foi mĂ¡ximo no ano de 2019 devido Ă s fortes queimadas, que chamaram a atenĂ§Ă£o do mundo, registradas no ano.
No entanto, a busca pela floresta amazĂ´nica especificamente brasileira nĂ£o acompanhou proporcionalmente o interesse geral pela floresta amazĂ´nica mostrada no primeiro grĂ¡fico. Apesar do ano de 2019 tambĂ©m ter apresentado uma elevaĂ§Ă£o nas buscas, foi no perĂodo de 2004 a 2008 que a busca por brazilian amazon rainforest foi mais alta.
A palavra chave brazilian burning apresentou um grĂ¡fico de interesse prĂ³ximo do encontrado ao utilizar amazon rainforest, com pico de buscas no ano de 2019. Entretanto, altos valores tambĂ©m foram registrados mais constantemente atĂ© o ano de 2007, com pico isolado em 2014 e mĂ¡ximo valor em 2019. Deve-se salientar, que a palavra chave de busca Ă© subjetiva: burning pode ter sido utilizado no sentido literal nĂ£o sĂ³ para queimadas em floresta, mas em casos de grandes incĂªndios, por exemplo, ou no sentido figurado como sinĂ´nimo de inquietaĂ§Ă£o, manifestaĂ§Ă£o, possivelmente de cunho polĂtico.
brazilian.amazon$interest_by_country %>%
filter(hits > 1)
## location hits keyword geo gprop
## 1 United Kingdom 100 brazilian amazon rainforest world web
## 2 United States 35 brazilian amazon rainforest world web
Ao verificar quais paĂses apresentaram maior interesse na busca sobre floresta amazĂ´nica brasileira, a funĂ§Ă£o gtrends mostrou que somente os Estados Unidos fizeram esta busca.
brazilian.amazon$related_topics %>%
filter(related_topics == 'top', subject > 0) %>%
mutate(value = factor(value,
levels = value[order(as.numeric(subject))])) %>%
ggplot(aes(x = as.numeric(subject), y = value)) +
geom_bar(fill = 'ForestGreen', stat = "identity") +
labs(title = 'TĂ³picos Relacionados Ă busca sobre a Floresta amazĂ´nica brasileira', x = NULL, y = NULL) +
theme_minimal() +
theme(axis.text.y = element_text(size=12))
Dentre os tĂ³picos relacionados Ă busca pela floresta amazĂ´nica brasileira (brazilian amazon rainforest), os mais buscados sĂ£o termos presentes na palavra chave, como amazon rainforest, brazil, brazilians, rainforest, mas o quinto tĂ³pico (Amazon.com) se trata do site de e-commerce. No entanto, os tĂ³picos mais interessantes sĂ£o aqueles que demostram a preocupaĂ§Ă£o com a floresta e sua destruiĂ§Ă£o como Animal, River, Government, Climate e Food.
corrupcao.brasil = gtrends(c('corrupĂ§Ă£o'), geo = c('BR'), time = "all")
corrupcao = ggplot(corrupcao.brasil$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('corrupĂ§Ă£o'), ' no Brasil')), x = NULL, y = 'Interesse', col = 'Busca') +
scale_color_manual(values = c('Chocolate')) +
scale_x_date(breaks = seq.Date(from = as.Date('2004-01-01'), to = as.Date('2021-01-01'), by = '1 year'), date_labels = "%b/%y") +
theme_minimal() +
theme(legend.position = 'bottom')
corruption = ggplot(gtrends(c('brazilian corruption'), time = "all")$interest_over_time, aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pela palavra chave ', italic('brazilian corruption'), ' no mundo')), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_color_manual(values = c('Chocolate')) +
scale_x_date(breaks = seq.Date(from = as.Date('2004-01-01'), to = as.Date('2021-01-01'), by = '1 year'), date_labels = "%b/%y") +
theme_minimal() +
theme(legend.position = 'bottom')
corrupcao / corruption
Ao visualizar o interesse pela palavra corrupĂ§Ă£o no Brasil, foi possĂvel perceber um padrĂ£o de picos e vales: os vales (quedas) foram registrados de maneira padrĂ£o no Ănicio (janeiro), meio (junho) e final do ano (dezembro). Estes trĂªs meses coincidem com o perĂodo de fĂ©rias no Brasil, podendo entĂ£o ser um grande indicador para perda de interesse sobre corrupĂ§Ă£o nestes meses.
O mesmo padrĂ£o nĂ£o foi observado no grĂ¡fico do interesse pela corrupĂ§Ă£o brasileira pelos paĂses. A tendĂªncia de busca pela palavra diminuiu ao longo do tempo com maior interesse entre 2005 e 2009.
corrupcao.brasil$interest_by_region %>%
mutate(location = gsub('State of ', '', location),
location = gsub('ĂƒÂ£', 'Ă£', location),
location = gsub('ĂƒÂ¡', 'Ă¡', location),
location = gsub('ĂƒÂ´', 'Ă´', location),
location = gsub('Ăƒ', 'Ă', location),
location = factor(location, levels = location[order(hits)])) %>%
ggplot(aes(x = hits, y = location)) +
geom_bar(fill = 'chocolate', stat = "identity") +
labs(title = expression(paste('Estados brasileiros com maior interesse na palavra chave ', italic('corrupĂ§Ă£o'))), x = NULL, y = NULL) +
theme_minimal() +
theme(axis.text.y = element_text(size=11))
Os estados das regiões norte e nordeste, com exceĂ§Ă£o do Distrito Federal, foram os que mais buscaram sobre a palavra corrupĂ§Ă£o durante o perĂodo de 2004 a 2020.
gtrends(c('brazilian election', 'brazilian president'), time = "all")$interest_over_time %>%
mutate(hits = as.numeric(hits)) %>%
filter(!is.na(hits)) %>%
ggplot(aes(x = as.Date(date), y = hits)) +
geom_line(aes(col = paste(keyword, '-', geo)), size = 1.25) +
labs(title = expression(paste('Interesse ao longo do tempo pelas palavras chave ', italic('brazilian election'), ' e ', italic('brazilian president'), ' no mundo')), x = 'Ano', y = 'Interesse', col = 'Busca') +
scale_x_date(breaks = seq.Date(from = as.Date('2004-01-01'), to = as.Date('2021-01-01'), by = '1 year'), date_labels = "%Y") +
theme_minimal() +
theme(legend.position = 'bottom')