Tips
Создание корпуса и матрицы
library("tm")
corpus <- Corpus(VectorSource(chat_data$msg))
tdm.data <- TermDocumentMatrix(corpus)
Частотные слова
#library("tm")
ft.data <- findFreqTerms(tdm.data, lowfreq=3)
Ассоциативный анализ
#library("tm")
findAssocs(tdm.data, "привет", 0.1)
Облако слов
library("devtools")
source_gist("https://gist.github.com/paulokopny/297387187194a48cb1a8")
Дополнительные источники
- Text Analysis With R (for Students of Literature) by Matthew L. Jockers (есть в группе)
- Материалы к курсу по text mining Кирилла Александровича Маслинского: