Отчет: данные по детскому стрессу

Исходные данные

Исходные данные представляют собой таблицу, где каждая строчка соответствует одному ответу, различные колонки хранят мета-данные о респонденте.

Таблица интерактивная и прокручиваемая (как и все таблицы в отчете).

Таблица с токенами

С помощью пакета {udpipe} ответы в колонках ReasonsAngry и ReasonsHappy были распарсены и сохранены в таблицу следующего формата:

  • Токен = одно слово
  • Каждая строчка = один токен

Таблица частотности

Таблица частотности лемм:

Облако слов

Для облака слов были удалены незначимые части речи и знаки препинания ("PUNCT", "CCONJ", "ADP", "PRON")

Тематическое моделирование (topic modelling)

Для тематического моделирования мы использовали DTM матрицу, для которой удалили знаки препинания, незначимые части речи ("PUNCT", "CCONJ", "ADP", "PRON") и стопслова. Далее представлен пример с 6 топиками и наиболее значимыми (по показателю бета) словами в них.