Отчет: данные по детскому стрессу
Исходные данные
Исходные данные представляют собой таблицу, где каждая строчка соответствует одному ответу, различные колонки хранят мета-данные о респонденте.
Таблица интерактивная и прокручиваемая (как и все таблицы в отчете).
Таблица с токенами
С помощью пакета {udpipe} ответы в колонках ReasonsAngry
и ReasonsHappy
были распарсены и сохранены в таблицу следующего формата:
- Токен = одно слово
- Каждая строчка = один токен
Таблица частотности
Таблица частотности лемм:
Облако слов
Для облака слов были удалены незначимые части речи и знаки препинания ("PUNCT", "CCONJ", "ADP", "PRON"
)
Тематическое моделирование (topic modelling)
Для тематического моделирования мы использовали DTM матрицу, для которой удалили знаки препинания, незначимые части речи ("PUNCT", "CCONJ", "ADP", "PRON"
) и стопслова. Далее представлен пример с 6 топиками и наиболее значимыми (по показателю бета) словами в них.