#dados <- readLines(file.choose())
#setwd("/Users/fernandolhamas/Downloads/rd_exemplo.csv") 
dados <- readLines(file("/Users/fernandolhamas/Downloads/rd_exemplo.csv", "r")) #abrir arquivo csv, salvo em utf-8 previamente
## Warning in readLines(file("/Users/fernandolhamas/Downloads/rd_exemplo.csv", :
## incomplete final line found on '/Users/fernandolhamas/Downloads/rd_exemplo.csv'
objetivos = dados %>% tolower %>% 
  removePunctuation %>% removeWords(., stopwords('pt')) %>% 
  removeWords(., c("vezes","com", "uma", "para","por","meu", "devido", "pois", "ainda", "nao", "assim", "sim"))

docs = Corpus(VectorSource(enc2native(objetivos)))

tdm = TermDocumentMatrix(docs) 

m <- as.matrix(tdm)

v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)
kable(d[1:20,])
word freq
alunos alunos 9
eaufba eaufba 5
aula aula 5
professores professores 5
sala sala 3
todos todos 3
acompanhar acompanhar 2
trabalhar trabalhar 2
acredito acredito 2
grande grande 2
necessário necessário 2
núcleo núcleo 2
psicológico psicológico 2
sugiro sugiro 2
suporte suporte 2
curso curso 2
necessidade necessidade 2
desinteresse desinteresse 2
frequência frequência 2
questões questões 2
findAssocs(tdm, terms = "desinteresse", corlimit = 0.3)
## $desinteresse
##              sala            apenas           chamada         cotidiano 
##              0.76              0.67              0.67              0.67 
##               eou   estágiotrabalho             manhã           matéria 
##              0.67              0.67              0.67              0.67 
##           motivos           período          presença         professor 
##              0.67              0.67              0.67              0.67 
##             tange         abordagem          absoluta             casar 
##              0.67              0.67              0.67              0.67 
##          concreta           cotiano            debate              deve 
##              0.67              0.67              0.67              0.67 
##             elite         escutamos    inacreditáveis           mercado 
##              0.67              0.67              0.67              0.67 
##       patricinhas          playboys            porquê           repleta 
##              0.67              0.67              0.67              0.67 
##             temas trabalhoaplicação               uso          voltadas 
##              0.67              0.67              0.67              0.67 
##              aula        frequência          questões             aulas 
##              0.50              0.38              0.38              0.38 
##            muitas 
##              0.38
findAssocs(tdm, terms = "acompanhar", corlimit = 0.3)
## $acompanhar
##       acadêmica           ajuda         aluguel         atenção      beneficiam 
##            0.67            0.67            0.67            0.67            0.67 
##          bolsas       conseguem          custos        didática         estudar 
##            0.67            0.67            0.67            0.67            0.67 
##     financeiras      limitações           moram           outra        precisam 
##            0.67            0.67            0.67            0.67            0.67 
##        sozinhos             ter         voltada           algum        amenizar 
##            0.67            0.67            0.67            0.67            0.67 
##    apresentarem             bom        calouros        conflito         demanda 
##            0.67            0.67            0.67            0.67            0.67 
##         desafio      desempenho        dimensão       discentes       emocional 
##            0.67            0.67            0.67            0.67            0.67 
##          evasão      implemente           média          núcleo          poderá 
##            0.67            0.67            0.67            0.67            0.67 
##           porém     psicológico psicopedagógico             sei     sinalizarem 
##            0.67            0.67            0.67            0.67            0.67 
##          sugiro         suporte            ufba       veteranos       trabalhar 
##            0.67            0.67            0.67            0.67            0.38 
##        acredito          grande      necessário          eaufba 
##            0.38            0.38            0.38            0.37
findAssocs(tdm, terms = "suporte", corlimit = 0.3)
## $suporte
##           algum        amenizar    apresentarem             bom        calouros 
##            1.00            1.00            1.00            1.00            1.00 
##        conflito         demanda         desafio      desempenho        dimensão 
##            1.00            1.00            1.00            1.00            1.00 
##       discentes       emocional          evasão      implemente           média 
##            1.00            1.00            1.00            1.00            1.00 
##          núcleo          poderá           porém     psicológico psicopedagógico 
##            1.00            1.00            1.00            1.00            1.00 
##             sei     sinalizarem          sugiro            ufba       veteranos 
##            1.00            1.00            1.00            1.00            1.00 
##          eaufba      acompanhar        acredito          grande      necessário 
##            0.75            0.67            0.67            0.67            0.67
wordcloud2(d[1:40,], minRotation = 0, maxRotation = 0, size=.55)