library(gtrendsR)
library(ggplot2)
library(ggthemes)
library(patchwork)
library(RColorBrewer)
library(magrittr)
library(dplyr)
library(gridExtra)\[ \star \]
O Google Trends é uma ferramenta do google que mostra o volume de pesquisa de determinadas palavras em relação ao total de pesquisa. O resultado é um Ãndice de 0 a 100 e quanto mais próximo de 100, maior o interesse pela palavra.
Nesse exemplo, vamos ver o interesse por áreas de ciência de dados e inteligência artificial, nos últimos 10 anos.
#A busca em inglês de algumas palavras foram mais significativas.
teste <- gtrends(c("Data Science", "Machine Learning", "Deep Learning", "Inteligência Artificial"),
geo = c("BR"),
time = "2010-01-01 2020-10-19")time_trend <-teste$interest_over_time
g1 <-ggplot(data=time_trend,
aes(x=date, y=hits, group=keyword, col=keyword)) +
geom_line(size = .9, alpha = .75) +
xlab("Tempo") +
ylab("Interesse relativo") +
theme_clean(base_size = 14, base_family = "mono") +
theme(legend.title = element_blank(),
legend.position = "bottom",
legend.text = element_text(size=9)) +
ggtitle("Volume de Busca no Google") +
scale_color_brewer(palette = "Dark2")
g1\[ \cdots \]
Nesse exemplo a comparação do interesse em esportes internacionais, no caso MMA (com a principal franquia do esporte sendo o UFC) e NBA, liga de basquete americana. O que chama a atenção é que após brasileiros não estarem disputando as principais lutas no UFC e ter menos publicidade na TV aberta, o interesse pelo esporte indica uma dimuição. No caso da NBA, percebemos um caráter cÃclico do gráfico, o que caberia uma maior investigação sobre o tema. Uma hipótese seria que os times realizam muitos jogos na NBA, e os jogos que costumam ter maior audiência com o público brasileiro são a partir dos playoffs, que são realizados no término da temporada regular.
teste2 <- gtrends(c("NBA", "UFC"),
geo = c("BR"),
time = "2010-01-01 2020-10-19")
time_trend2 <-teste2$interest_over_time
g2 <-ggplot(data=time_trend2,
aes(x=date, y=hits, group=keyword, col=keyword)) +
geom_line(size = .9) +
xlab("Tempo") +
ylab("Interesse relativo") +
theme_clean(base_size = 14, base_family = "mono") +
theme(legend.title = element_blank(),
legend.position = "bottom",
legend.text = element_text(size=12)) +
ggtitle("Volume de Busca no Google") +
scale_color_brewer(palette = "Accent")
g2\[ \cdots \]
Nesse exemplo, a comparação de buscas por duas linguagens de programação muito utilizadas, que é o python, e javascript.
teste4 <- gtrends(c("python", "javascript"),
geo = c("BR"),
time = "2010-01-01 2020-10-19")
time_trend4 <-teste4$interest_over_time
g4 <-ggplot(data=time_trend4,
aes(x=date, y=hits, group=keyword, col=keyword)) +
geom_line(size = .9) +
xlab("Tempo") +
ylab("Interesse relativo") +
theme_clean(base_size = 14, base_family = "mono") +
theme(legend.title = element_blank(),
legend.position = "bottom",
legend.text = element_text(size=12)) +
ggtitle("Volume de Busca no Google") +
scale_color_brewer(palette = "Set2")
g4\[ \cdots \]
Nesse exemplo, possÃveis impactos de publicidade, principalmente em vÃdeos no YouTube.
Com muitas propagandas no YouTube e valorização do Ãndice Ibovespa em 2019, o interesse e buscas por essa área de investimentos em ações aumentou radicalmente.
teste5 <- gtrends(c("trader"),
geo = c("BR"),
time = "2010-01-01 2020-10-19")
time_trend5 <-teste5$interest_over_time
g5 <-ggplot(data=time_trend5,
aes(x=date, y=hits, group=keyword, col=keyword)) +
geom_line(size = 1, alpha = 0.65) +
xlab("Tempo") +
ylab("Interesse relativo") +
theme_clean(base_size = 14, base_family = "mono") +
theme(legend.title = element_blank(),
legend.position = "bottom",
legend.text = element_text(size=12)) +
ggtitle("Volume de Busca no Google") +
scale_colour_wsj()
g5\[ \cdots \]
Também com muitas propagandas no YouTube, o interesse e as buscas por essa área aumentaram consideravelmente.
teste3 <- gtrends(c("coach"),
geo = c("BR"),
time = "2010-01-01 2020-10-19")
time_trend3 <-teste3$interest_over_time
g3 <-ggplot(data=time_trend3,
aes(x=date, y=hits, group=keyword, col=keyword)) +
geom_line(size = 1, alpha = 0.65) +
xlab("Tempo") +
ylab("Interesse relativo") +
theme_clean(base_size = 14, base_family = "mono") +
theme(legend.title = element_blank(),
legend.position = "bottom",
legend.text = element_text(size=12)) +
ggtitle("Volume de Busca no Google") +
scale_colour_wsj()
g3\[ \cdots \]
Esse tipo de mÃdia, antes muito nichada, teve um enorme crescimento. Também com muita divulgação com publicidade em vÃdeos e portais de notÃcias.
teste1 <- gtrends(c("podcast"),
geo = c("BR"),
time = "2010-01-01 2020-10-19")
time_trend1 <-teste1$interest_over_time
g9 <-ggplot(data=time_trend1,
aes(x=date, y=hits, group=keyword, col=keyword)) +
geom_line(size = 1, alpha = 0.65) +
xlab("Tempo") +
ylab("Interesse relativo") +
theme_clean(base_size = 14, base_family = "mono") +
theme(legend.title = element_blank(),
legend.position = "bottom",
legend.text = element_text(size=12)) +
ggtitle("Volume de Busca no Google") +
scale_colour_wsj()
g9\[ \cdots \]
Nesse exemplo a disputa para prefeitura na cidade de São Paulo com os candidatos mais bem avaliados nas pesquisas eleitorais.
teste6 <- gtrends(c("Bruno Covas", "Celso Russomanno", "Guilherme Boulos"),
geo = c("BR"),
time = "2020-09-01 2020-10-28")
time_trend6 <-teste6$interest_over_time
g6 <-ggplot(data=time_trend6,
aes(x=date, y=hits, group=keyword, col=keyword)) +
geom_line(size = .9) +
xlab("Tempo") +
ylab("Interesse relativo") +
theme_clean(base_size = 14, base_family = "mono") +
theme(legend.title = element_blank(),
legend.position = "bottom",
legend.text = element_text(size=12)) +
ggtitle("Volume de Busca no Google nos últimos 2 meses") +
scale_color_brewer(palette = "Set2")
g6\[ \cdots \]
Nesse exemplo o impacto do novo coronavÃrus na busca por cultura e lazer: cinema, parque, bar e academia.
plot_trend <- function(keyword_string) {
data <- gtrends(c(keyword_string), time= "2020-01-01 2020-10-14", geo = "BR")
time_trend <- data$interest_over_time %>%
mutate(hits=ifelse(hits=="<1",0.5,hits),
date=as.Date(date),
keyword=factor(keyword, levels = keyword_string))
plot <- ggplot(data=time_trend, aes(x=date, y=as.numeric(hits), colour=keyword)) +
geom_line(size = .9) +
geom_vline(xintercept = as.numeric(as.Date("2020-03-10")),
color = "dark gray",
linetype = "dashed",
size = 1.0) +
xlab("Tempo") +
ylab("Interesse relativo") +
theme_clean(base_size = 10, base_family = "mono") +
theme(legend.position = "bottom",
legend.title = element_blank(),
legend.text=element_text(size=9)) +
ggtitle("Volume de Busca no Google") +
scale_color_brewer(palette = "Set2")
return(plot)
}
cinema_plot <- plot_trend(keyword_string = c( "cinema"))
parque_plot <- plot_trend(keyword_string = c("parque"))
academia_plot <- plot_trend(keyword_string = c( "academia"))
bar_plot <- plot_trend(keyword_string = c("bar"))
grid.arrange(cinema_plot, academia_plot, parque_plot, bar_plot, ncol=2,
top = "Busca virtual por entretenimento e lazer em 2020: como a covid-19 afetou a indústria.")\[ \star \]