#dados <- readLines(file.choose())
#setwd("/Users/fernandolhamas/Downloads/rd_exemplo.csv")
dados <- readLines(file("/Users/fernandolhamas/Downloads/rd_exemplo.csv", "r")) #abrir arquivo csv, salvo em utf-8 previamente
## Warning in readLines(file("/Users/fernandolhamas/Downloads/rd_exemplo.csv", :
## incomplete final line found on '/Users/fernandolhamas/Downloads/rd_exemplo.csv'
objetivos = dados %>% tolower %>%
removePunctuation %>% removeWords(., stopwords('pt')) %>%
removeWords(., c("vezes","com", "uma", "para","por","meu", "devido", "pois", "ainda", "nao", "assim", "sim"))
docs = Corpus(VectorSource(enc2native(objetivos)))
tdm = TermDocumentMatrix(docs)
m <- as.matrix(tdm)
v <- sort(rowSums(m),decreasing=TRUE)
d <- data.frame(word = names(v),freq=v)
kable(d[1:20,])
| alunos |
alunos |
9 |
| eaufba |
eaufba |
5 |
| aula |
aula |
5 |
| professores |
professores |
5 |
| sala |
sala |
3 |
| todos |
todos |
3 |
| acompanhar |
acompanhar |
2 |
| trabalhar |
trabalhar |
2 |
| acredito |
acredito |
2 |
| grande |
grande |
2 |
| necessário |
necessário |
2 |
| núcleo |
núcleo |
2 |
| psicológico |
psicológico |
2 |
| sugiro |
sugiro |
2 |
| suporte |
suporte |
2 |
| curso |
curso |
2 |
| necessidade |
necessidade |
2 |
| desinteresse |
desinteresse |
2 |
| frequência |
frequência |
2 |
| questões |
questões |
2 |
findAssocs(tdm, terms = "desinteresse", corlimit = 0.3)
## $desinteresse
## sala apenas chamada cotidiano
## 0.76 0.67 0.67 0.67
## eou estágiotrabalho manhã matéria
## 0.67 0.67 0.67 0.67
## motivos período presença professor
## 0.67 0.67 0.67 0.67
## tange abordagem absoluta casar
## 0.67 0.67 0.67 0.67
## concreta cotiano debate deve
## 0.67 0.67 0.67 0.67
## elite escutamos inacreditáveis mercado
## 0.67 0.67 0.67 0.67
## patricinhas playboys porquê repleta
## 0.67 0.67 0.67 0.67
## temas trabalhoaplicação uso voltadas
## 0.67 0.67 0.67 0.67
## aula frequência questões aulas
## 0.50 0.38 0.38 0.38
## muitas
## 0.38
findAssocs(tdm, terms = "acompanhar", corlimit = 0.3)
## $acompanhar
## acadêmica ajuda aluguel atenção beneficiam
## 0.67 0.67 0.67 0.67 0.67
## bolsas conseguem custos didática estudar
## 0.67 0.67 0.67 0.67 0.67
## financeiras limitações moram outra precisam
## 0.67 0.67 0.67 0.67 0.67
## sozinhos ter voltada algum amenizar
## 0.67 0.67 0.67 0.67 0.67
## apresentarem bom calouros conflito demanda
## 0.67 0.67 0.67 0.67 0.67
## desafio desempenho dimensão discentes emocional
## 0.67 0.67 0.67 0.67 0.67
## evasão implemente média núcleo poderá
## 0.67 0.67 0.67 0.67 0.67
## porém psicológico psicopedagógico sei sinalizarem
## 0.67 0.67 0.67 0.67 0.67
## sugiro suporte ufba veteranos trabalhar
## 0.67 0.67 0.67 0.67 0.38
## acredito grande necessário eaufba
## 0.38 0.38 0.38 0.37
findAssocs(tdm, terms = "suporte", corlimit = 0.3)
## $suporte
## algum amenizar apresentarem bom calouros
## 1.00 1.00 1.00 1.00 1.00
## conflito demanda desafio desempenho dimensão
## 1.00 1.00 1.00 1.00 1.00
## discentes emocional evasão implemente média
## 1.00 1.00 1.00 1.00 1.00
## núcleo poderá porém psicológico psicopedagógico
## 1.00 1.00 1.00 1.00 1.00
## sei sinalizarem sugiro ufba veteranos
## 1.00 1.00 1.00 1.00 1.00
## eaufba acompanhar acredito grande necessário
## 0.75 0.67 0.67 0.67 0.67
wordcloud2(d[1:40,], minRotation = 0, maxRotation = 0, size=.55)