if(!require("pacman")) install.packages("pacman")
pacman::p_load(twitteR,
tidyverse,
wordcloud2,
httr,
tm,
lexiconPT,
tidytext,
wordcloud)
# consumerKey <- "abc123"
# consumerSecret <- "abc123"
# accessToken <- "abc123"
# accessTokenSecret <- "abc123"
setup_twitter_oauth(consumerKey, consumerSecret, accessToken, accessTokenSecret)
## [1] "Using direct authentication"
bozo_tweets <- userTimeline("jairbolsonaro", n=3200, includeRts = T)
bozo_tweets_df <- tbl_df(map_df(bozo_tweets, as.data.frame))
#BozoData <- twListToDF(bozo_tweets)
#Bozo.df <- data.frame(BozoData)
#tweets <- data.frame()
#tweets <- Bozo.df
tweets <- bozo_tweets_df
Bozo <- subset(tweets, screenName=="jairbolsonaro", select= text)
clean_tweet = gsub("&", "", Bozo)
clean_tweet = gsub("(RT|via)((?:\\b\\W*@\\w+)+)", "", clean_tweet)
clean_tweet = gsub("@\\w+", "", clean_tweet)
clean_tweet = gsub("[[:punct:]]", "", clean_tweet)
clean_tweet = gsub("[[:digit:]]", "", clean_tweet)
clean_tweet = gsub("[[ā¦]]", "", clean_tweet)
clean_tweet = gsub("http\\w+", "", clean_tweet)
clean_tweet = gsub("[ \t]{2,}", "", clean_tweet)
clean_tweet = gsub("ā¦\n", "", clean_tweet)
Bozo = gsub("^\\s+|\\s+$", "", clean_tweet)
Bozo <- Corpus(VectorSource(Bozo))
Bozo <- tm_map(Bozo, removeNumbers)
Bozo <- tm_map(Bozo, content_transformer(tolower))
Bozo <-
tm_map(
Bozo,
removeWords,
c(
"link","ā¦"))
Bozo <- tm_map(Bozo, removeWords, stopwords("pt"))
Bozo <- tm_map(Bozo, removePunctuation)
Bozo <- tm_map(Bozo, stripWhitespace)
dtm <- TermDocumentMatrix(Bozo)
findFreqTerms(dtm, lowfreq = 50)
## [1] "aƧƵes" "brasil" "combate" "covid" "dia"
## [6] "federal" "governo" "hoje" "nacional" "obras"
## [11] "presidente" "programa" "recursos" "semana" "sobre"
## [16] "todo" "todos" "trabalho"
findAssocs(dtm, terms = "presidente", corlimit = 0.4)
## $presidente
## numeric(0)
m <- as.matrix(dtm)
v <- sort(rowSums(m), decreasing = TRUE)
d <- data.frame(word = names(v), freq = v)
head(d, 5)
## word freq
## brasil brasil 212
## governo governo 178
## sobre sobre 99
## aƧƵes aƧƵes 96
## presidente presidente 85
wordcloud2(data = d, size = 1.2)
sample_n(oplexicon_v3.0, size = 20) %>%
arrange(polarity)
## term type polarity polarity_revision
## 1 triturados adj -1 A
## 2 barbaros adj -1 M
## 3 hermetico adj -1 A
## 4 passeador adj 0 A
## 5 contactaveis adj 0 A
## 6 conclusiva adj 0 M
## 7 arremessados adj 0 A
## 8 refrescada adj 0 A
## 9 corriqueira adj 0 M
## 10 suspiroso adj 0 A
## 11 tecnicos adj 0 M
## 12 publicos adj 0 M
## 13 afincada adj 0 A
## 14 secreto adj 0 M
## 15 solidarias adj 1 A
## 16 lidimos adj 1 M
## 17 efemeras adj 1 A
## 18 vernaculas adj 1 A
## 19 remunerados adj 1 A
## 20 abrir o possibilidade de vb det n prp 1 A
oplexicon_v3.0 %>%
count(polarity, sort = TRUE)
## polarity n
## 1 -1 14569
## 2 0 9002
## 3 1 8620
oplexicon_v3.0 %>%
count(type, sort = TRUE)
## type n
## 1 adj 24475
## 2 vb 6889
## 3 htag 471
## 4 vb det n prp 103
## 5 vb n prp 91
## 6 vb adj 74
## 7 emot 66
## 8 vb adv 22
tweets$text <- tweets$text %>%
removeWords(words = c("bom", "muito", "pouco",
stopwords(kind = "pt")))
# Faz tokenização nas palavras individuais e empilha as palavras.
texto_un <- tweets %>%
unnest_tokens(output = "words", input = text)
tb_sen <- inner_join(texto_un,
oplexicon_v3.0[, c("term", "polarity")],
by = c("words" = "term"))
# Agora o termos tem sua polaridade presente na tabela.
sample_n(tb_sen, size = 20)
## # A tibble: 20 x 17
## favorited favoriteCount replyToSN created truncated replyToSID
## <lgl> <dbl> <chr> <dttm> <lgl> <chr>
## 1 FALSE 69697 <NA> 2020-10-09 00:44:56 TRUE <NA>
## 2 FALSE 5403 jairbols~ 2020-05-31 17:29:54 TRUE 126714582~
## 3 FALSE 21900 <NA> 2020-04-16 22:37:05 FALSE <NA>
## 4 FALSE 20371 <NA> 2020-10-04 18:05:53 TRUE <NA>
## 5 FALSE 4594 jairbols~ 2020-06-25 11:52:14 TRUE 127612043~
## 6 FALSE 33099 <NA> 2020-01-06 19:31:12 TRUE <NA>
## 7 FALSE 55795 <NA> 2020-06-05 01:33:05 FALSE <NA>
## 8 FALSE 12502 jairbols~ 2021-01-05 08:39:15 FALSE 134637556~
## 9 FALSE 79839 <NA> 2019-11-23 03:49:05 TRUE <NA>
## 10 FALSE 0 <NA> 2020-05-20 02:16:24 FALSE <NA>
## 11 FALSE 39989 <NA> 2020-06-26 19:17:41 TRUE <NA>
## 12 FALSE 32214 <NA> 2020-08-29 11:35:02 FALSE <NA>
## 13 FALSE 12117 jairbols~ 2020-02-09 12:33:15 TRUE 122648401~
## 14 FALSE 4015 jairbols~ 2020-09-07 16:24:47 TRUE 130300599~
## 15 FALSE 9308 jairbols~ 2020-07-10 12:11:54 TRUE 128156140~
## 16 FALSE 17675 <NA> 2020-02-20 23:17:02 TRUE <NA>
## 17 FALSE 4273 jairbols~ 2019-10-27 15:16:55 TRUE 118847441~
## 18 FALSE 40424 <NA> 2020-04-02 01:27:38 TRUE <NA>
## 19 FALSE 15724 <NA> 2020-03-17 22:07:32 FALSE <NA>
## 20 FALSE 39803 jairbols~ 2020-05-02 21:40:27 FALSE 125670001~
## # ... with 11 more variables: id <chr>, replyToUID <chr>, statusSource <chr>,
## # screenName <chr>, retweetCount <dbl>, isRetweet <lgl>, retweeted <lgl>,
## # longitude <lgl>, latitude <lgl>, words <chr>, polarity <int>
tb <- tb_sen %>%
group_by(id) %>%
summarise(soma = sum(polarity),
n = n(),
sentiment = soma/n)
tb
## # A tibble: 2,047 x 4
## id soma n sentiment
## <chr> <int> <int> <dbl>
## 1 1188120331350937600 0 4 0
## 2 1188173687226286080 0 1 0
## 3 1188228432066482176 -1 2 -0.5
## 4 1188228870593536000 -1 1 -1
## 5 1188441847984721921 1 1 1
## 6 1188468641882353671 0 4 0
## 7 1188468784295743489 -1 1 -1
## 8 1188469656312524800 0 2 0
## 9 1188469809580826626 0 1 0
## 10 1188470883792424966 -1 1 -1
## # ... with 2,037 more rows
ggplot(tb, aes(x = sentiment)) +
geom_density(fill = "orange", alpha = 0.25) +
geom_rug() +
labs(x = "Polaridade", y = "Densidade")

ggplot(tb, aes(x = sentiment)) +
stat_ecdf() +
geom_rug() +
labs(x = "Polaridade", y = "FrequĆŖncia")

tb %>%
top_n(sentiment, n = 10) %>%
inner_join(tweets[, c("id", "text")]) %>%
select(sentiment, text)
## # A tibble: 304 x 2
## sentiment text
## <dbl> <chr>
## 1 1 "- Nossa viagem Oriente MƩdio. \n- O Brasil recupera confianƧa ~
## 2 1 "29- Aprovada medida permite dinheiro leilão cessão onerosa ~
## 3 1 "Homenagem Emirados Ćrabes Unidos Brasil. https://t.co/IlWq0iSlE~
## 4 1 "RT @CarlosBolsonaro: A pedido @VEJA ! NĆ£o preocupem, abutres, d~
## 5 1 "O Ministro Capitão @tarcisiogdf explana feitos realizados parte~
## 6 1 "Bahia: concessĆ£o Ferrovia Oeste-Leste, trecho CaetitĆ©-IlhĆ©us. 2ā¢~
## 7 1 "O @MinEconomia @sebrae lançaram programa Mobilização EMPREGO ~
## 8 1 "Hoje busquei moto concessionƔria. Motocicleta, paraquedismo me~
## 9 1 "- Descontraindo imprensa. Boa tarde todos! https://t.co/1pGiG~
## 10 1 "2- O @minsaude destinou 67 novas ambulâncias CearÔ. A entrega ~
## # ... with 294 more rows
tb %>%
top_n(sentiment, n = -10) %>%
inner_join(tweets[, c("id", "text")]) %>%
select(sentiment, text)
## # A tibble: 200 x 2
## sentiment text
## <dbl> <chr>
## 1 -1 Qualquer outro menos independência disposição levar adiante pr~
## 2 -1 2- PROJETO VIGIA: organizaƧƵes criminosas responsƔveis contraban~
## 3 -1 5- COMBATE Ć CORRUPĆĆO 3: A @CGUonline UniĆ£o @policiafederal de~
## 4 -1 25- O @MInfraestrutura Ministro @tarcisiogdf , trabalha BR-135/~
## 5 -1 4- Defesa: cooperação partes assuntos defesa, pesquisa desenv~
## 6 -1 LIVE: Mais matƩria porca Globo. Caso Marielle. https://t.co/GVW7~
## 7 -1 CANALHAS! https://t.co/THbGVEbasE
## 8 -1 @Barretorec Lula tĆ” preso...
## 9 -1 No CearĆ”, @mdregional_br , Gustavo Canuto, entregou semana, 1.76~
## 10 -1 12- O @mdregional_br financia R$ 268 milhƵes modernizar reparar ~
## # ... with 190 more rows
tb_words <- tb_sen %>%
count(words, polarity, sort = TRUE) %>%
filter(polarity != 0)
tb_cloud <- tb_words %>%
spread(key = "polarity", value = "n", fill = 0) %>%
rename("negative" = "-1", "positive" = "1")
tb_cloud
## # A tibble: 703 x 3
## words negative positive
## <chr> <dbl> <dbl>
## 1 abandonadas 1 0
## 2 abastecer 0 1
## 3 abolido 1 0
## 4 abrigar 1 0
## 5 abrir 1 0
## 6 absoluta 0 1
## 7 absurdas 2 0
## 8 acabamento 0 1
## 9 acre 1 0
## 10 acusado 1 0
## # ... with 693 more rows
tb <- as.data.frame(tb_cloud[, c("negative", "positive")])
rownames(tb) <- tb_cloud$words
head(tb)
## negative positive
## abandonadas 1 0
## abastecer 0 1
## abolido 1 0
## abrigar 1 0
## abrir 1 0
## absoluta 0 1
tb
## negative positive
## abandonadas 1 0
## abastecer 0 1
## abolido 1 0
## abrigar 1 0
## abrir 1 0
## absoluta 0 1
## absurdas 2 0
## acabamento 0 1
## acre 1 0
## acusado 1 0
## adeptos 0 1
## adequada 0 2
## adequados 0 1
## adotada 2 0
## adotadas 2 0
## afastadas 0 1
## afetados 2 0
## africanos 0 1
## agir 0 2
## agredir 1 0
## agreste 6 0
## agricultor 2 0
## agricultores 1 0
## agro 4 0
## alegre 0 7
## alerta 0 1
## alertar 0 1
## alertas 0 1
## alinhado 0 2
## aliviar 1 0
## alvo 0 2
## alvos 0 1
## amante 0 1
## amantes 0 1
## ambulantes 1 0
## amigo 0 4
## amigos 0 4
## ampla 0 1
## ana 1 0
## anexo 1 0
## animal 1 0
## antecipar 0 1
## antifascistas 0 1
## apavorar 0 1
## aplicada 0 2
## aplicadas 0 1
## aplicados 0 3
## apoiadas 1 0
## apoiadores 0 2
## apoiar 0 6
## apreendidas 1 0
## apreendido 1 0
## apreendidos 9 0
## aprovada 0 3
## aprovadas 0 2
## aprovado 0 3
## aprovados 0 4
## apurar 0 4
## arrecadado 1 0
## arrecadados 1 0
## articular 1 0
## assentados 0 2
## associar 1 0
## assustada 1 0
## atentar 0 1
## atingidas 3 0
## atingido 1 0
## atingidos 3 0
## ativos 0 2
## atleta 0 3
## atrair 0 3
## atrativo 0 1
## atrelado 0 1
## augusto 0 6
## aumentar 0 8
## autista 1 0
## autorizada 0 2
## autorizado 0 1
## autorizados 0 2
## avaliar 0 1
## bacana 0 1
## bandido 1 0
## bandidos 3 0
## baratear 0 1
## barato 0 2
## belo 0 2
## belos 0 1
## bento 0 3
## bernardo 1 0
## boa 0 41
## boas 0 4
## bom 0 53
## bota 1 0
## breve 0 3
## breves 0 4
## brutal 1 0
## bruto 1 0
## burros 0 1
## buscar 0 1
## ca 5 0
## cadastrados 1 0
## cair 0 1
## calado 0 2
## calma 0 1
## caluniar 1 0
## camponesa 1 0
## canalhas 2 0
## cancelar 1 0
## capaz 0 3
## capitais 2 0
## captar 0 2
## cara 1 0
## carentes 1 0
## caro 1 0
## carregados 1 0
## causados 0 3
## causar 0 1
## celso 0 2
## centralizada 1 0
## certa 0 3
## certificada 0 1
## certo 0 4
## chamar 0 1
## chapada 2 0
## chefiar 0 1
## chegada 0 6
## chegado 0 1
## chegar 4 0
## ciente 0 1
## citar 1 0
## clara 0 2
## claro 0 1
## cobrir 1 0
## combater 10 0
## comerciantes 2 0
## comida 2 0
## comovente 0 1
## companheiro 0 1
## compartilhar 6 0
## complexa 1 0
## complexo 3 0
## complexos 3 0
## comunista 0 1
## conceituada 0 2
## concluir 0 3
## concreto 0 4
## condenado 2 0
## conduzida 1 0
## confiantes 0 1
## conhecer 0 1
## conhecida 0 2
## conhecido 0 2
## conjunta 4 0
## conjuntas 2 0
## conjunto 10 0
## conjuntos 1 0
## consagrado 0 1
## considerada 0 2
## considerados 0 1
## consultar 1 0
## consumidor 1 0
## consumidores 3 0
## contado 1 0
## contingente 1 0
## continuar 0 6
## controlada 0 3
## controladoras 1 0
## controlados 0 1
## conversar 0 3
## cooperar 0 1
## corajosa 0 1
## corajoso 0 1
## cortar 1 0
## covarde 2 0
## covardes 2 0
## crescente 0 3
## crescido 0 1
## criados 0 2
## criar 2 0
## criminosa 2 0
## criminosas 1 0
## criminoso 1 0
## criminosos 1 0
## criticar 1 0
## cruzado 1 0
## culto 0 1
## curado 0 1
## curados 0 2
## curtidas 0 2
## curvas 1 0
## dar 13 0
## dedicado 0 1
## defender 1 0
## defensor 0 1
## defesa 12 0
## defeso 2 0
## definir 0 1
## degradadas 1 0
## degradar 1 0
## demarcada 1 0
## derrotado 1 0
## derrubada 1 0
## desafogar 1 0
## desarmar 0 1
## desarticular 0 1
## desbaratada 1 0
## descoberta 0 1
## descoberto 0 1
## desejar 0 1
## desempregados 1 0
## desenvolver 1 0
## desenvolvidas 0 1
## desenvolvido 0 3
## desmantelar 1 0
## desmentida 1 0
## desmontadas 1 0
## desrespeitar 0 1
## desrespeitosa 1 0
## destinado 0 3
## destinados 0 5
## destravar 0 1
## determinada 0 1
## determinadas 0 1
## determinado 0 1
## determinantes 1 0
## deturpar 1 0
## devaneio 0 1
## devastada 1 0
## dever 0 3
## diminuir 1 0
## direta 2 0
## diretor 0 2
## diretores 0 2
## dirigir 0 1
## dirimir 0 1
## discutida 1 0
## dispostos 0 1
## disputado 1 0
## disseminado 2 0
## distantes 2 0
## distorcer 0 1
## ditador 1 0
## diversificadas 0 1
## dividir 1 0
## divulgar 4 0
## dobrar 1 0
## doce 0 2
## drogados 1 0
## duplicada 3 0
## duplicado 1 0
## duplicados 3 0
## dura 1 0
## efetivo 0 1
## efetuar 0 2
## eficaz 0 3
## emocionante 0 2
## empenhado 0 1
## empreendedor 0 1
## empreendedores 0 4
## encaminhadas 0 1
## encerrado 0 2
## encontrar 2 0
## endividados 1 0
## entender 0 1
## entrar 2 0
## envergonhado 1 0
## errado 1 0
## esclarecedores 0 1
## esclarecida 0 1
## escolar 0 6
## escolher 1 0
## escolhido 0 1
## escravizado 2 0
## espalhadas 1 0
## espalhar 1 0
## especiais 0 3
## especial 0 15
## esperados 0 1
## esquecer 0 1
## esquecido 1 0
## estar 0 1
## estimada 0 1
## estimado 0 1
## eterna 0 1
## eterno 0 1
## evidente 0 1
## evitar 0 4
## exata 0 1
## exatas 0 1
## excelente 0 8
## exclusivos 0 3
## executadas 1 0
## executado 1 0
## executivos 0 1
## existir 0 1
## exonerar 1 0
## expandir 1 0
## expulso 1 0
## extraordinario 0 1
## extrema 2 0
## extremas 1 0
## facil 0 1
## facilitar 2 0
## falsa 1 0
## falsas 2 0
## falta 6 0
## favor 0 2
## febre 0 1
## fechadas 4 0
## fechado 2 0
## fechados 2 0
## feita 0 6
## feitas 0 1
## feito 0 3
## feitos 0 6
## feliz 0 10
## ferrenho 1 0
## ficar 0 1
## firmado 2 0
## firmados 1 0
## firme 0 1
## firmes 0 1
## fiuza 1 0
## fofocar 0 1
## forjar 1 0
## fornecer 1 0
## fortalecer 0 1
## forte 0 26
## fortes 0 5
## fracos 1 0
## frias 1 0
## funcionar 0 1
## furtado 1 0
## garantido 0 1
## garoto 2 0
## gastos 16 0
## generalizada 1 0
## gerar 7 0
## governado 0 2
## governados 0 1
## grato 0 4
## guiar 0 1
## habilitados 0 3
## habilitar 0 2
## haver 0 2
## hediondo 1 0
## honesto 0 1
## honrado 0 1
## honroso 0 1
## humano 0 1
## humanos 0 4
## idiotas 1 0
## ignoradas 1 0
## ignorado 1 0
## ilegal 2 0
## imediato 0 3
## imediatos 0 1
## impactar 0 1
## impacto 1 0
## impactos 2 0
## impedir 1 0
## imperial 1 0
## importante 0 13
## importantes 0 3
## importuna 1 0
## imposto 13 0
## impostos 17 0
## inacabada 1 0
## inacabadas 3 0
## incentivo 6 0
## incomoda 2 0
## incomodado 1 0
## inconclusivos 1 0
## incorporada 1 0
## india 1 0
## indicados 0 2
## infectados 3 0
## infeliz 1 0
## informadas 0 1
## informado 0 1
## informar 1 0
## iniciada 1 0
## iniciadas 2 0
## iniciados 1 0
## inimigo 0 1
## injusta 1 0
## inovadora 0 1
## inquietantes 1 0
## inserido 1 0
## instalado 2 0
## integra 0 2
## integrada 1 0
## intensas 0 1
## intenso 0 2
## interessada 0 1
## interessado 0 1
## interessados 0 1
## interpretar 1 0
## investigar 0 1
## investir 8 0
## isentar 1 0
## isolados 1 0
## jantar 0 1
## justa 0 1
## justas 0 1
## leal 0 1
## legais 0 1
## legal 0 5
## levado 1 0
## levantar 0 3
## levar 7 0
## liberar 1 0
## ligados 2 0
## ligar 2 0
## limpa 0 2
## lindas 0 2
## longe 1 0
## ma 23 0
## maduro 0 1
## maltratar 1 0
## maneira 0 4
## manifestar 1 0
## manipulados 1 0
## maravilhoso 0 2
## marcada 0 1
## marginais 3 0
## mas 7 0
## mau 1 0
## melhor 0 12
## melhores 0 1
## memorial 0 1
## mentir 4 0
## moleque 1 0
## mono 1 0
## mortos 1 0
## mostrar 2 0
## motivada 0 1
## movimentadas 0 1
## movimentados 0 1
## mudar 4 0
## mundo 0 27
## municipais 0 2
## nascentes 2 0
## necessitados 2 0
## nefasta 1 0
## negativo 3 0
## nomeado 0 1
## nova 0 28
## novas 0 19
## novo 0 33
## novos 0 28
## obrigado 43 0
## obrigados 1 0
## ocultas 1 0
## oculto 1 0
## oferecidos 1 0
## ofertado 1 0
## omissos 1 0
## oportunidade 0 4
## organizada 0 1
## organizado 0 6
## oriundos 3 0
## ostensiva 1 0
## paciente 0 1
## pacientes 0 10
## paga 0 1
## pagar 5 0
## pagos 0 4
## parada 7 0
## paradas 2 0
## parado 2 0
## paralisadas 1 0
## parar 0 3
## pardos 1 0
## parlamentar 3 3
## parlamentares 1 0
## participar 1 0
## partida 1 0
## partidas 1 0
## partido 8 0
## partir 17 0
## passa 7 0
## passada 2 0
## passado 8 0
## passo 9 0
## passos 2 0
## patriotas 0 1
## pautada 0 1
## pautado 0 1
## pedido 0 8
## pedir 0 2
## pegar 0 3
## pensada 1 0
## pensado 1 0
## penso 0 1
## perder 4 0
## perdidos 1 0
## perfeitos 0 1
## perigosas 1 0
## pertinente 0 1
## pior 4 0
## piores 3 0
## plena 0 2
## pleno 0 2
## pobres 3 0
## podre 1 0
## pontual 0 1
## porca 1 0
## positivo 0 5
## positivos 0 2
## potenciais 0 1
## potencial 0 4
## prazer 0 2
## precisa 0 3
## precisas 0 1
## preciso 0 4
## precoce 3 0
## prejudicado 1 0
## premiado 0 1
## preparado 0 1
## presenciar 0 1
## preservados 0 4
## preservar 5 0
## preso 2 0
## presos 1 0
## presta 0 1
## prestes 0 1
## prestigiado 0 1
## presto 0 2
## preto 2 0
## previsto 0 6
## prima 2 0
## privativo 0 1
## procurar 0 1
## produtivo 0 2
## produzidos 0 1
## promissor 0 1
## promocionais 0 1
## promover 0 2
## pronta 0 2
## pronto 0 2
## prontos 0 1
## pronunciar 1 0
## propagar 1 0
## proposital 2 0
## proteger 6 0
## protestar 0 1
## prudente 0 1
## pura 0 1
## puta 1 0
## qualificados 0 1
## queimadas 3 0
## questionado 1 0
## racista 1 0
## reais 0 5
## real 0 1
## realizada 0 4
## realizadas 0 3
## realizados 0 5
## realizar 0 1
## receber 0 10
## reconhecido 0 2
## recuperada 0 4
## recuperado 0 1
## recuperados 0 2
## reduzidos 1 0
## reduzir 8 0
## refeitas 0 1
## referida 1 0
## reflexos 2 0
## refugiado 1 0
## refugiados 1 0
## regionais 0 1
## regulamentar 0 1
## regular 0 4
## relacionadas 2 0
## relacionados 2 0
## relevante 0 1
## renomado 0 1
## renomados 0 1
## reparar 2 0
## repassado 1 0
## repassados 4 0
## repetida 0 1
## repressivas 2 0
## reprimido 1 0
## resolvida 0 1
## respeitado 0 1
## ressentidos 1 0
## restabelecida 0 3
## restaurados 0 2
## restringir 1 0
## restritivas 1 0
## ricas 0 1
## roberto 2 0
## rodada 5 0
## rodado 2 0
## rombo 1 0
## rompimento 1 0
## roubado 1 0
## sa 0 2
## sabe 0 1
## sabia 0 1
## sacados 1 0
## sagrada 0 1
## sair 1 0
## salvar 5 0
## sancionar 0 2
## santa 0 12
## santas 0 2
## santo 0 2
## santos 0 9
## saudoso 2 0
## seca 1 0
## secas 1 0
## seguidores 0 2
## segura 0 2
## seguro 0 6
## sensacional 0 1
## ser 0 46
## significativo 0 1
## sindical 0 1
## so 1 0
## solicitar 0 1
## sonhada 1 0
## sonho 0 1
## sujeitas 1 0
## super 0 1
## superficial 0 1
## superintendente 0 1
## superior 0 1
## supostas 1 0
## supostos 1 0
## suprema 0 2
## surpreendido 1 0
## surpresa 2 0
## suspeita 1 0
## suspeitas 1 0
## suspeitos 1 0
## suspensa 2 0
## suspensas 3 0
## tamanho 0 1
## taxar 0 1
## temporais 1 0
## terrorista 2 0
## topo 0 2
## trabalhador 0 2
## trabalhadores 0 13
## trabalhar 0 8
## traficante 2 0
## transportada 2 0
## transportados 1 0
## tratado 0 1
## tratados 0 1
## triste 1 0
## trocada 1 0
## trocado 0 1
## trocados 1 0
## trocar 0 2
## ultrajado 1 0
## unido 0 6
## unidos 0 11
## unificar 0 1
## usada 4 0
## usadas 1 0
## usado 5 0
## usados 2 0
## va 3 0
## vagas 11 0
## vagos 1 0
## valer 0 2
## veicular 1 0
## vencer 2 0
## vendido 1 0
## ver 0 3
## verdadeira 0 1
## verdadeiras 0 1
## verdadeiro 0 1
## verdadeiros 0 4
## vertical 0 1
## vetar 0 2
## vi 0 2
## vila 4 0
## vinda 1 0
## vindos 2 0
## violados 1 0
## violenta 1 0
## violentas 1 0
## vis 1 0
## vista 0 3
## visto 0 1
## vistos 0 1
## vitorioso 0 1
## viva 0 1
## vivas 0 1
## vivo 0 5
## vivos 0 1
## voltadas 2 0
## voltado 3 0
## voltados 1 0
## voltar 1 0
## xp 1 0
## zerar 2 0
comparison.cloud(tb,
colors = c("red", "blue"),
max.words = min(nrow(tb), 200))

n_words <- 20
tb_bars <- tb_words %>%
mutate(score = polarity * n) %>%
group_by(polarity) %>%
top_n(n, n = n_words) %>%
ungroup()
ggplot(data = tb_bars,
mapping = aes(x = reorder(words, score),
y = score,
fill = score)) +
geom_col(color = "black") +
scale_fill_distiller(palette = "RdBu", direction = 1) +
coord_flip() +
theme_light() +
theme(legend.position = c(0.95, 0.5),
legend.justification = c(1, 0.5)) +
labs(y = "FrequĆŖncia de ocorrĆŖncia",
x = "Termo",
fill = "FrequĆŖncia de\nocorrĆŖncia")
