Pacotes usados nesses exemplos

library(gtrendsR)
library(ggplot2)
library(ggthemes)
library(patchwork)
library(RColorBrewer)
library(magrittr)
library(dplyr)
library(gridExtra)

\[ \star \]

Exemplo 1

O Google Trends é uma ferramenta do google que mostra o volume de pesquisa de determinadas palavras em relação ao total de pesquisa. O resultado é um índice de 0 a 100 e quanto mais próximo de 100, maior o interesse pela palavra.

Nesse exemplo, vamos ver o interesse por áreas de ciência de dados e inteligência artificial, nos últimos 10 anos.

#A busca em inglês de algumas palavras foram mais significativas. 
teste <- gtrends(c("Data Science", "Machine Learning", "Deep Learning", "Inteligência Artificial"),
                 geo = c("BR"),
                 time = "2010-01-01 2020-10-19")
time_trend <-teste$interest_over_time

g1 <-ggplot(data=time_trend,
            aes(x=date, y=hits, group=keyword, col=keyword)) +
        geom_line(size = .9, alpha = .75) + 
        xlab("Tempo") +
        ylab("Interesse relativo") +
        theme_clean(base_size = 14, base_family = "mono") +
        theme(legend.title = element_blank(),
              legend.position = "bottom",
              legend.text = element_text(size=9)) + 
        ggtitle("Volume de Busca no Google") +
        scale_color_brewer(palette = "Dark2")
g1

\[ \cdots \]

Exemplo 2

Nesse exemplo a comparação do interesse em esportes internacionais, no caso MMA (com a principal franquia do esporte sendo o UFC) e NBA, liga de basquete americana. O que chama a atenção é que após brasileiros não estarem disputando as principais lutas no UFC e ter menos publicidade na TV aberta, o interesse pelo esporte indica uma dimuição. No caso da NBA, percebemos um caráter cíclico do gráfico, o que caberia uma maior investigação sobre o tema. Uma hipótese seria que os times realizam muitos jogos na NBA, e os jogos que costumam ter maior audiência com o público brasileiro são a partir dos playoffs, que são realizados no término da temporada regular.

teste2 <- gtrends(c("NBA", "UFC"),
                 geo = c("BR"),
                 time = "2010-01-01 2020-10-19")

time_trend2 <-teste2$interest_over_time

g2 <-ggplot(data=time_trend2,
            aes(x=date, y=hits, group=keyword, col=keyword)) +
        geom_line(size = .9) + 
        xlab("Tempo") +
        ylab("Interesse relativo") +
        theme_clean(base_size = 14, base_family = "mono") +
        theme(legend.title = element_blank(),
              legend.position = "bottom",
              legend.text = element_text(size=12)) + 
        ggtitle("Volume de Busca no Google") +
        scale_color_brewer(palette = "Accent")
g2

\[ \cdots \]

Exemplo 3

Nesse exemplo, a comparação de buscas por duas linguagens de programação muito utilizadas, que é o python, e javascript.

teste4 <- gtrends(c("python", "javascript"),
                 geo = c("BR"),
                 time = "2010-01-01 2020-10-19")

time_trend4 <-teste4$interest_over_time

g4 <-ggplot(data=time_trend4,
            aes(x=date, y=hits, group=keyword, col=keyword)) +
        geom_line(size = .9) + 
        xlab("Tempo") +
        ylab("Interesse relativo") +
        theme_clean(base_size = 14, base_family = "mono") +
        theme(legend.title = element_blank(),
              legend.position = "bottom",
              legend.text = element_text(size=12)) + 
        ggtitle("Volume de Busca no Google") +
        scale_color_brewer(palette = "Set2")
g4

\[ \cdots \]

Exemplo 4

Nesse exemplo, possíveis impactos de publicidade, principalmente em vídeos no YouTube.

Trader

Com muitas propagandas no YouTube e valorização do índice Ibovespa em 2019, o interesse e buscas por essa área de investimentos em ações aumentou radicalmente.

teste5 <- gtrends(c("trader"),
                 geo = c("BR"),
                 time = "2010-01-01 2020-10-19")

time_trend5 <-teste5$interest_over_time

g5 <-ggplot(data=time_trend5,
            aes(x=date, y=hits, group=keyword, col=keyword)) +
        geom_line(size = 1, alpha = 0.65) + 
        xlab("Tempo") +
        ylab("Interesse relativo") +
        theme_clean(base_size = 14, base_family = "mono") +
        theme(legend.title = element_blank(),
              legend.position = "bottom",
              legend.text = element_text(size=12)) + 
        ggtitle("Volume de Busca no Google") +
        scale_colour_wsj()
g5

\[ \cdots \]

Coach

Também com muitas propagandas no YouTube, o interesse e as buscas por essa área aumentaram consideravelmente.

teste3 <- gtrends(c("coach"),
                 geo = c("BR"),
                 time = "2010-01-01 2020-10-19")

time_trend3 <-teste3$interest_over_time

g3 <-ggplot(data=time_trend3,
            aes(x=date, y=hits, group=keyword, col=keyword)) +
        geom_line(size = 1, alpha = 0.65) + 
        xlab("Tempo") +
        ylab("Interesse relativo") +
        theme_clean(base_size = 14, base_family = "mono") +
        theme(legend.title = element_blank(),
              legend.position = "bottom",
              legend.text = element_text(size=12)) + 
        ggtitle("Volume de Busca no Google") +
        scale_colour_wsj()
g3

\[ \cdots \]

Podcast

Esse tipo de mídia, antes muito nichada, teve um enorme crescimento. Também com muita divulgação com publicidade em vídeos e portais de notícias.

teste1 <- gtrends(c("podcast"),
                 geo = c("BR"),
                 time = "2010-01-01 2020-10-19")

time_trend1 <-teste1$interest_over_time

g9 <-ggplot(data=time_trend1,
            aes(x=date, y=hits, group=keyword, col=keyword)) +
        geom_line(size = 1, alpha = 0.65) + 
        xlab("Tempo") +
        ylab("Interesse relativo") +
        theme_clean(base_size = 14, base_family = "mono") +
        theme(legend.title = element_blank(),
              legend.position = "bottom",
              legend.text = element_text(size=12)) + 
        ggtitle("Volume de Busca no Google") +
        scale_colour_wsj()
g9

\[ \cdots \]

Exemplo 5

Nesse exemplo a disputa para prefeitura na cidade de São Paulo com os candidatos mais bem avaliados nas pesquisas eleitorais.

teste6 <- gtrends(c("Bruno Covas", "Celso Russomanno", "Guilherme Boulos"),
                 geo = c("BR"),
                 time = "2020-09-01 2020-10-28")

time_trend6 <-teste6$interest_over_time

g6 <-ggplot(data=time_trend6,
            aes(x=date, y=hits, group=keyword, col=keyword)) +
        geom_line(size = .9) + 
        xlab("Tempo") +
        ylab("Interesse relativo") +
        theme_clean(base_size = 14, base_family = "mono") +
        theme(legend.title = element_blank(),
              legend.position = "bottom",
              legend.text = element_text(size=12)) + 
        ggtitle("Volume de Busca no Google nos últimos 2 meses") +
        scale_color_brewer(palette = "Set2")
g6

\[ \cdots \]

Exemplo 6

Nesse exemplo o impacto do novo coronavírus na busca por cultura e lazer: cinema, parque, bar e academia.

plot_trend <- function(keyword_string) {
    
    data <- gtrends(c(keyword_string), time= "2020-01-01 2020-10-14", geo = "BR")
    
    time_trend <- data$interest_over_time %>%
        mutate(hits=ifelse(hits=="<1",0.5,hits),
            date=as.Date(date),
            keyword=factor(keyword, levels = keyword_string))

    plot <- ggplot(data=time_trend, aes(x=date, y=as.numeric(hits), colour=keyword)) +
        geom_line(size = .9) +
        geom_vline(xintercept = as.numeric(as.Date("2020-03-10")),
                   color = "dark gray",
                   linetype = "dashed",
                   size = 1.0) +
        xlab("Tempo") +
        ylab("Interesse relativo") +
        theme_clean(base_size = 10, base_family = "mono") +
        theme(legend.position = "bottom",
            legend.title = element_blank(),
            legend.text=element_text(size=9)) +
        ggtitle("Volume de Busca no Google") +
        scale_color_brewer(palette = "Set2")

    return(plot)
}

cinema_plot <- plot_trend(keyword_string = c( "cinema"))
parque_plot <- plot_trend(keyword_string = c("parque"))
academia_plot <- plot_trend(keyword_string = c( "academia"))
bar_plot <- plot_trend(keyword_string = c("bar"))
grid.arrange(cinema_plot, academia_plot, parque_plot, bar_plot, ncol=2,
             top = "Busca virtual por entretenimento e lazer em 2020: como a covid-19 afetou a indústria.")

\[ \star \]

Referências