Техническая информация и библиотеки

rm(list = ls())
date()
## [1] "Sat Feb  8 02:00:19 2025"
sessionInfo()
## R version 4.4.2 (2024-10-31)
## Platform: x86_64-apple-darwin20
## Running under: macOS Ventura 13.7.3
## 
## Matrix products: default
## BLAS:   /Library/Frameworks/R.framework/Versions/4.4-x86_64/Resources/lib/libRblas.0.dylib 
## LAPACK: /Library/Frameworks/R.framework/Versions/4.4-x86_64/Resources/lib/libRlapack.dylib;  LAPACK version 3.12.0
## 
## locale:
## [1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
## 
## time zone: Europe/Moscow
## tzcode source: internal
## 
## attached base packages:
## [1] stats     graphics  grDevices datasets  utils     methods   base     
## 
## loaded via a namespace (and not attached):
##  [1] digest_0.6.36     R6_2.5.1          fastmap_1.2.0     xfun_0.49        
##  [5] cachem_1.1.0      knitr_1.49        htmltools_0.5.8.1 rmarkdown_2.27   
##  [9] lifecycle_1.0.4   cli_3.6.3         sass_0.4.9        renv_1.0.11      
## [13] jquerylib_0.1.4   compiler_4.4.2    rstudioapi_0.16.0 tools_4.4.2      
## [17] evaluate_1.0.1    bslib_0.7.0       yaml_2.3.10       jsonlite_1.8.8   
## [21] rlang_1.1.4

Билиотеки

library(dplyr)
library(quanteda)
library(ggplot2)
library(stringr)
library(quanteda.textplots)
library(quanteda.textstats)

Загрузка объектов

#load(file = "Corpus_S.Rdata")
load(file = "Tokens_S.Rdata")
load(file = "Dictionary.RData")
load(file = "Tokens_S3.Rdata")

Для анализ объединенил три текста по разным картинкам от одного изспытуемого в один. Частотный анализ логичнее провести по испытуемым, а не текстам. Какие слова использовал испытуемый хотя бы по одной из картинок.

Полный список слов c обозначением части речи:

nrow(Dictionary)
## [1] 1938

Dictionary |>
  select(-Word_POS) |>
  arrange(Word)
##                      Word    POS
## 1                       а   CONJ
## 2                       а      S
## 3                       а   PART
## 4               абсолютно    ADV
## 5                авантюра      S
## 6            авторитарный      A
## 7               авторитет      S
## 8                     ага   PART
## 9             агрессивный      A
## 10               агрессия      S
## 11              адекватно    ADV
## 12             адекватный      A
## 13                активно    ADV
## 14               алкоголь      S
## 15            алкогольный      A
## 16                    ама      S
## 17                америка      S
## 18           американский      A
## 19                анекдот      S
## 20                   анна      S
## 21               аннабель      S
## 22              антипатия      S
## 23                  анфас    ADV
## 24                    аня      S
## 25             ассоциация      S
## 26          ассоциировать      V
## 27                  афиша      S
## 28                      б   PART
## 29                   баба      S
## 30                бабушка      S
## 31                 бандит      S
## 32                   бант      S
## 33                 бедный      A
## 34                 бежать      V
## 35                    без     PR
## 36             безмолвный      A
## 37           безопасность      S
## 38            безразличие      S
## 39           безразличный      A
## 40            безучастный      A
## 41          безысходность      S
## 42                  белый      A
## 43                  белье      S
## 44             беременный      A
## 45                берлога      S
## 46                 беседа      S
## 47             беседовать      V
## 48           беспокоиться      V
## 49            беспокойный      A
## 50           беспокойство      S
## 51           бестактность      S
## 52          биологический      A
## 53                   бить      V
## 54              благодаря     PR
## 55                близкие      S
## 56                близкий      A
## 57                 близко    ADV
## 58                    бля   INTJ
## 59             блядушник?      S
## 60                богатый      A
## 61                   боже      S
## 62                    бой      S
## 63                  более    ADV
## 64                 болеть      V
## 65                болтать      V
## 66                   боль      S
## 67               больница      S
## 68                больной      S
## 69                 больше    ADV
## 70            большинство      S
## 71                большой      A
## 72                бордель      S
## 73              бормотать      V
## 74               бороться      V
## 75                 борьба      S
## 76                бояться      V
## 77                   брак      S
## 78                   брат      S
## 79                 братик      S
## 80                  брать      V
## 81                  бровь      S
## 82                бросать      V
## 83                  будто   CONJ
## 84                  будто   PART
## 85                будущее      S
## 86                будущий      A
## 87                     бы   PART
## 88                 быстро    ADV
## 89                   быть      V
## 90                      в     PR
## 91               важность      S
## 92                 важный      A
## 93               вакансия      S
## 94                вариант      S
## 95               вариация      S
## 96                    ваш   APRO
## 97                 вблизи    ADV
## 98           вглядываться      V
## 99                  вдаль    ADV
## 100                вдвоем    ADV
## 101                 вдруг    ADV
## 102                  ведь   PART
## 103                  ведь   CONJ
## 104                 везти      V
## 105               веревка      S
## 106                вернее    ADV
## 107               вернуть      V
## 108             вернуться      V
## 109                верный      A
## 110              вероятно    ADV
## 111             вероятный      A
## 112                версия      S
## 113               веселие      S
## 114            веселиться      V
## 115                весело    ADV
## 116               веселый      A
## 117                 вести      V
## 118                  весь   APRO
## 119                 вечер      S
## 120              вещество      S
## 121                  вещь      S
## 122        взаимодействие      S
## 123     взаимодействовать      V
## 124       взаимоотношение      S
## 125       взаимоотношения      S
## 126          взволнованно    ADV
## 127                взгляд      S
## 128           взглядывать      V
## 129              вздыхать      V
## 130              взрослый      A
## 131              взрослый      S
## 132                 взять      V
## 133               взяться      V
## 134                   вид      S
## 135                видеть      V
## 136              видеться      V
## 137                видимо    ADV
## 138             виднеться      V
## 139                 видно    ADV
## 140                видный      A
## 141                  вина      S
## 142             виноватый      A
## 143                висеть      V
## 144                  вить      V
## 145               вкладка      S
## 146           вкладывание      S
## 147            вкладывать      V
## 148            влюбленный      A
## 149              влюблять      V
## 150           вляпываться      V
## 151              вляться?      V
## 152                вместе    ADV
## 153           вмешиваться      V
## 154                   вне     PR
## 155               внешний      A
## 156               вникать      V
## 157              внимание      S
## 158           внимательно    ADV
## 159               внимать      V
## 160                  внук      S
## 161                внучка      S
## 162               внушать      V
## 163                    во     PR
## 164             во-первых    ADV
## 165          возвращаться      V
## 166                 возле     PR
## 167             возлюбить      V
## 168          возлюбленная      S
## 169          возлюбленный      A
## 170              возможно    ADV
## 171           возможность      S
## 172             возможный      A
## 173            возмущение      S
## 174             возникать      V
## 175               возраст      S
## 176            возрастной      A
## 177                 война      S
## 178              волнение      S
## 179           волноваться      V
## 180                 волос      S
## 181                  воля      S
## 182                   вон   PART
## 183                вообще    ADV
## 184             вообще-то    ADV
## 185                вопрос      S
## 186        вопросительный      A
## 187            воспитание      S
## 188          воспитанница      S
## 189           воспитывать      V
## 190          воспринимать      V
## 191       восстанавливать      V
## 192           восхищаться      V
## 193            восхищение      S
## 194                   вот   PART
## 195               вот-вот    ADV
## 196               впервой    ADV
## 197                вполне    ADV
## 198                вранье      S
## 199                 врать      V
## 200               вредный      A
## 201                 время      S
## 202                 вроде     PR
## 203                 вроде   PART
## 204                  вряд    ADV
## 205                   все   SPRO
## 206                   все    ADV
## 207              все-таки   PART
## 208                всегда ADVPRO
## 209            вскакивать      V
## 210         вспыльчивость      S
## 211              вставать      V
## 212               встреча      S
## 213             встречать      V
## 214           встречаться      V
## 215           встряхивать      V
## 216              вступать      V
## 217         вступительный      A
## 218              всячески    ADV
## 219                второй   ANUM
## 220                    вы   SPRO
## 221              выбегать      V
## 222              выбирать      V
## 223                 вывод      S
## 224             выглядеть      V
## 225            выдумывать      V
## 226            выигрывать      V
## 227            выкуривать      V
## 228           вылавливать      V
## 229              выливать      V
## 230              выпадать      V
## 231              выпивать      V
## 232             выполнять      V
## 233             выражение      S
## 234            вырываться      V
## 235         высказываться      V
## 236           выслуживать      V
## 237           выслушивать      V
## 238          высматривать      V
## 239               высокий      A
## 240            выставлять      V
## 241             выступать      V
## 242            высыпаться      V
## 243                 выход      S
## 244              выходить      V
## 245             выяснение      S
## 246            выяснивать      V
## 247              выяснять      V
## 248                   где ADVPRO
## 249                где-то ADVPRO
## 250               героиня      S
## 251                 герой      S
## 252               главный      A
## 253                  глаз      S
## 254            глобальный      A
## 255              глупость      S
## 256                глупый      A
## 257                  гнев      S
## 258              говорить      V
## 259                   год      S
## 260                голова      S
## 261              головной      A
## 262                 голый      A
## 263              гольцман      S
## 264                гордый      A
## 265             горничная      S
## 266             горничный      A
## 267               горький      A
## 268               господи   INTJ
## 269              гостевой      A
## 270              гостиная      S
## 271             гостиница      S
## 272                 гость      S
## 273              готовить      V
## 274            готовиться      V
## 275               готовый      A
## 276               граница      S
## 277                 грубо    ADV
## 278                грубый      A
## 279                 грудь      S
## 280              грустить      V
## 281         грустненький?      A
## 282               грустно    ADV
## 283              грустный      A
## 284                грусть      S
## 285                грызть      V
## 286                  губа      S
## 287           гувернантка      S
## 288                гулять      V
## 289                    да   CONJ
## 290                    да   PART
## 291                давать      V
## 292                давить      V
## 293              давление      S
## 294                 давно    ADV
## 295                  даже   PART
## 296                  даже   CONJ
## 297                 далее    ADV
## 298                далеко    ADV
## 299            дальнейший      A
## 300                  дама      S
## 301                данный      A
## 302                   два    NUM
## 303            двенадцать    NUM
## 304                 дверь      S
## 305             двигаться      V
## 306              движение      S
## 307             двинуться      V
## 308                  двое    NUM
## 309                двойка      S
## 310                  двор      S
## 311               девочка      S
## 312               девушка      S
## 313              действие      S
## 314                делать      V
## 315              делиться      V
## 316                  дело      S
## 317               деловой      A
## 318       демонстративный      A
## 319                  день      S
## 320               держать      V
## 321             держаться      V
## 322               дернуть      V
## 323           деспотичный      A
## 324                десять    NUM
## 325                деталь      S
## 326               детский      A
## 327                  джаз      S
## 328            джентльмен      S
## 329                диалог      S
## 330                 диван      S
## 331              диванчик      S
## 332                   для     PR
## 333               дневник      S
## 334                    до     PR
## 335            добиваться      V
## 336                добрый      A
## 337              доверять      V
## 338              довольно    ADV
## 339             довольный      A
## 340               догнать      V
## 341          додавливать?      V
## 342          докапываться      V
## 343                  долг      S
## 344                 долго    ADV
## 345         долгоиграющий      A
## 346                должно    ADV
## 347             должность      S
## 348               должный      A
## 349                   дом      S
## 350                  дома    ADV
## 351              домашний      A
## 352                 домой    ADV
## 353              доносить      V
## 354        дополнительный      A
## 355                допрос      S
## 356             допускать      V
## 357               дорогой      A
## 358                досада      S
## 359            досиживать      V
## 360             доставать      V
## 361            достаточно    ADV
## 362           достучаться      V
## 363            дочитывать      V
## 364                 дочка      S
## 365                  дочь      S
## 366                 драка      S
## 367                  друг      S
## 368                другой   APRO
## 369               дружить      V
## 370                думать      V
## 371                  дура      S
## 372                 дурак      S
## 373                дуться      V
## 374                   дух      S
## 375               дядюшка      S
## 376               евгений      S
## 377                   его   APRO
## 378          единственный      A
## 379                    ее   APRO
## 380                  если   CONJ
## 381           естественно    ADV
## 382                  есть      V
## 383                 ехать      V
## 384                ехидно    ADV
## 385               ехидный      A
## 386                   еще    ADV
## 387                жалеть      V
## 388                жалкий      A
## 389                  жаль    ADV
## 390                  жанр      S
## 391                 ждать      V
## 392                    же   PART
## 393               желание      S
## 394                желать      V
## 395              железный      A
## 396                  жена      S
## 397               женатый      A
## 398              жениться      V
## 399                 жених      S
## 400               женский      A
## 401               женщина      S
## 402                жертва      S
## 403                  жест      S
## 404                 живой      A
## 405             жизненный      A
## 406                 жизнь      S
## 407                  жить      V
## 408                 жутко    ADV
## 409                    за     PR
## 410               забавно    ADV
## 411              забирать      V
## 412                забота      S
## 413              заботить      V
## 414            заботиться      V
## 415             заботливо    ADV
## 416            заботливый      A
## 417              забывать      V
## 418            забываться      V
## 419             заведение      S
## 420           завершаться      V
## 421           зависимость      S
## 422                 завод      S
## 423              заводить      V
## 424                завтра    ADV
## 425             завязнуть      V
## 426          завязываться      V
## 427             загадочно    ADV
## 428            загадочный      A
## 429           заглаживать      V
## 430           заглядывать      V
## 431          заговаривать      V
## 432           задабривать      V
## 433              задавать      V
## 434               задание      S
## 435           задерживать      V
## 436                задний      A
## 437            задолбать?      V
## 438            задумчивый      A
## 439          задумываться      V
## 440            заигрывать      V
## 441    заинтересованность      S
## 442      заинтересованный      A
## 443      заинтересовывать      V
## 444                 зайти      V
## 445            закалывать      V
## 446           заканчивать      V
## 447         заканчиваться      V
## 448            закидывать      V
## 449             заключать      V
## 450                 закон      S
## 451              законный      A
## 452              закрытый      A
## 453            закуривать      V
## 454             замечание      S
## 455              замечать      V
## 456                 замуж    ADV
## 457              занимать      V
## 458            заниматься      V
## 459               занятие      S
## 460               занятый      A
## 461                 запах      S
## 462          запеленывать      V
## 463         запечатлевать      V
## 464         заподозривать      V
## 465             запрещать      V
## 466            засмеяться      V
## 467             заставать      V
## 468            заставлять      V
## 469           застукивать      V
## 470           заступаться      V
## 471              затевать      V
## 472              захотеть      V
## 473                 зачем ADVPRO
## 474              защищать      V
## 475                 звать      V
## 476                  звук      S
## 477                 здесь ADVPRO
## 478           здороваться      V
## 479              здоровый      A
## 480               зеркало      S
## 481               злиться      V
## 482                   зло      S
## 483                 злоба      S
## 484                  злой      A
## 485                злость      S
## 486                  знак      S
## 487              знакомая      S
## 488           знакомиться      V
## 489            знакомство      S
## 490              знакомый      S
## 491              знакомый      A
## 492                 знать      V
## 493                значит    ADV
## 494               золотой      A
## 495               зрелище      S
## 496                зрение      S
## 497               зритель      S
## 498                   зуб      S
## 499                     и   CONJ
## 500          игнорировать      V
## 501                  игра      S
## 502                играть      V
## 503              играться      V
## 504               игрушка      S
## 505              идеально    ADV
## 506             идеальный      A
## 507               идиотка      S
## 508                  идти      V
## 509                    из     PR
## 510                 из-за     PR
## 511           избавляться      V
## 512          избалованный      A
## 513          избаловывать      V
## 514              избегать      V
## 515              извинять      V
## 516            извиняться      V
## 517           излюбленный      A
## 518                измена      S
## 519              изменять      V
## 520            изменяться      V
## 521            изначально    ADV
## 522            изображать      V
## 523             изумление      S
## 524              изумлять      V
## 525                   или   CONJ
## 526                именно   PART
## 527                 иметь      V
## 528                   имя      S
## 529                 иначе   CONJ
## 530                иногда    ADV
## 531             инородный      A
## 532      интеллектуальный      A
## 533        интеллигентный      A
## 534              интервью      S
## 535               интерес      S
## 536             интересно    ADV
## 537         интересность?      S
## 538            интересный      A
## 539          интересовать      V
## 540        интересоваться      V
## 541      интерпретировать      V
## 542              интрижка      S
## 543            информация      S
## 544                искать      V
## 545          использовать      V
## 546            исправлять      V
## 547                 испуг      S
## 548             испуганно    ADV
## 549              испугать      V
## 550            испугаться      V
## 551            испытывать      V
## 552          испытываться      V
## 553               история      S
## 554                  итог      S
## 555                    их   APRO
## 556                     к     PR
## 557               кабинет      S
## 558             каверзный      A
## 559                  кадр      S
## 560                каждый   APRO
## 561               кажется    ADV
## 562              казаться      V
## 563                   как   CONJ
## 564                   как ADVPRO
## 565            как-нибудь ADVPRO
## 566                как-то ADVPRO
## 567                 какой   APRO
## 568          какой-нибудь   APRO
## 569              какой-то   APRO
## 570          капризничать      V
## 571             капризный      A
## 572               картина      S
## 573              картинка      S
## 574              касаться      V
## 575                  кафе      S
## 576              кафешок?      S
## 577              качество      S
## 578              квартира      S
## 579                  кино      S
## 580                кинуть      V
## 581                   кит      S
## 582              классика      S
## 583              классный      A
## 584                класть      V
## 585                  клуб      S
## 586                 книга      S
## 587                книжка      S
## 588               книжный      A
## 589                    ко     PR
## 590                 когда   CONJ
## 591                 когда ADVPRO
## 592              когда-то ADVPRO
## 593            кокетливый      A
## 594              коктейль      S
## 595               коллега      S
## 596                кольцо      S
## 597          командировка      S
## 598           комментарий      S
## 599      коммуницировать?      V
## 600               комната      S
## 601              компания      S
## 602            комплимент      S
## 603            компромисс      S
## 604             комфортно    ADV
## 605                 конец      S
## 606               конечно    ADV
## 607         конструктивно    ADV
## 608        конструктивный      A
## 609               контакт      S
## 610        контактировать      V
## 611      конфиденциальный      A
## 612              конфликт      S
## 613           конфликтный      A
## 614              концовка      S
## 615               кормить      V
## 616             коробочка      S
## 617              короткий      A
## 618                короче    ADV
## 619                корпус      S
## 620             косметика      S
## 621                 косяк      S
## 622               котенок      S
## 623                 котик      S
## 624               который   APRO
## 625                  кофе      S
## 626                  край      S
## 627               крайний      A
## 628             красавица      S
## 629              красивый      A
## 630             краситься      V
## 631               красный      A
## 632               красота      S
## 633               крепкий      A
## 634                крепко    ADV
## 635                кресло      S
## 636                кристи      S
## 637               кричать      V
## 638              кроватка      S
## 639                 кроха      S
## 640                кстати    ADV
## 641                   кто   SPRO
## 642                кто-то   SPRO
## 643                  куда ADVPRO
## 644               куда-то ADVPRO
## 645                 кукла      S
## 646                 кулак      S
## 647                 кулек      S
## 648                курить      V
## 649               кусочек      S
## 650                  куча      S
## 651               кушетка      S
## 652              ладиться      V
## 653                 ладно   PART
## 654             лаконично    ADV
## 655                 левый      A
## 656        легализоваться      V
## 657                легкий      A
## 658                 легко    ADV
## 659                лежать      V
## 660                 лезть      V
## 661                летний      A
## 662                    ли   PART
## 663                  либо   CONJ
## 664                 линия      S
## 665            литература      S
## 666                  лицо      S
## 667                 лично    ADV
## 668                личный      A
## 669                лишний      A
## 670                  лишь   PART
## 671            лобызаться      V
## 672               лукавый      A
## 673               любимый      A
## 674                любить      V
## 675              любовник      S
## 676             любовница      S
## 677              любовный      A
## 678                любовь      S
## 679                 любой   APRO
## 680           любопытство      S
## 681                     м      S
## 682                макияж      S
## 683             маленький      A
## 684                  мало    ADV
## 685            малолетняя      S
## 686                 малый      A
## 687                 малыш      S
## 688               малышка      S
## 689                  мама      S
## 690                манера      S
## 691                маньяк      S
## 692               марафет      S
## 693                  март      S
## 694                 марта      S
## 695           материнский      A
## 696           материнство      S
## 697                  мать      S
## 698             мгновение      S
## 699           медицинский      A
## 700             медсестра      S
## 701                 между     PR
## 702                 мема?      S
## 703                 менее    ADV
## 704            ментальный      A
## 705                  мера      S
## 706           мероприятие      S
## 707               мертвый      A
## 708                 место      S
## 709                 мечта      S
## 710          мечтательный      A
## 711               мечтать      V
## 712                  мило    ADV
## 713                 милый      A
## 714                 минус      S
## 715                минута      S
## 716               минутка      S
## 717                   мир      S
## 718                 мирно    ADV
## 719              младенец      S
## 720               младший      A
## 721                мнение      S
## 722                многий   APRO
## 723                 много    ADV
## 724                 может    ADV
## 725                 можно    ADV
## 726                   мой   APRO
## 727                молить      V
## 728               молодой      A
## 729                момент      S
## 730             моральный      A
## 731                  мочь      V
## 732              мудрость      S
## 733                   муж      S
## 734                 мужик      S
## 735               мужской      A
## 736               мужчина      S
## 737                мутить      V
## 738           мучительный      A
## 739                    мы   SPRO
## 740                 мысль      S
## 741                мягкий      A
## 742                 мягко    ADV
## 743                    на     PR
## 744             наблюдать      V
## 745           наброситься      V
## 746               наверно    ADV
## 747              наверное    ADV
## 748             наверняка   PART
## 749              наводить      V
## 750             навредить      V
## 751              навсегда    ADV
## 752             нагружать      V
## 753                   над     PR
## 754           надавливать      V
## 755             надеяться      V
## 756                  надо    ADV
## 757             надоедать      V
## 758            надумывать      V
## 759            назойливый      A
## 760              называть      V
## 761            называться      V
## 762               наивный      A
## 763            наказывать      V
## 764                наклон      S
## 765             наклонять      V
## 766           наклоняться      V
## 767               наконец    ADV
## 768             накрасить      V
## 769            налаживать      V
## 770              намекать      V
## 771             намерение      S
## 772            намеренный      A
## 773               намного    ADV
## 774              наносить      V
## 775              наоборот    ADV
## 776              написать      V
## 777            напоминать      V
## 778            направлять      V
## 779              например    ADV
## 780              напролет    ADV
## 781            напряженно    ADV
## 782           напряженный      A
## 783              напугать      V
## 784             наругать?      V
## 785              нарушать      V
## 786                 наряд      S
## 787              наседать      V
## 788             насколько    ADV
## 789           наскучивать      V
## 790              насмешка      S
## 791            наставлять      V
## 792            настаивать      V
## 793            настойчиво    ADV
## 794         настойчивость      S
## 795           настойчивый      A
## 796             настолько    ADV
## 797             настоящее      S
## 798             настоящий      A
## 799           настраивать      V
## 800            настроение      S
## 801             наступать      V
## 802                насчет     PR
## 803           наталкивать      V
## 804               научать      V
## 805           нахмуривать      V
## 806              находить      V
## 807            находиться      V
## 808                начало      S
## 809             начальник      S
## 810            начальство      S
## 811              начинать      V
## 812            начинаться      V
## 813            начинающий      A
## 814                    не   PART
## 815          неаккуратный      A
## 816             небольшой      A
## 817              небрежно    ADV
## 818              невкусно    ADV
## 819       невоспитанность      S
## 820            негативный      A
## 821               недавно    ADV
## 822                неделя      S
## 823            недовольно    ADV
## 824           недовольный      A
## 825          недовольство      S
## 826         недопонимание      S
## 827            недоумение      S
## 828             нежелание      S
## 829          нежелательно    ADV
## 830              нежность      S
## 831  незаинтересованность      S
## 832            незамужний      A
## 833            незнакомец      S
## 834            неизвестно    ADV
## 835          неинтересный      A
## 836                 некий   APRO
## 837          некомфортно?    ADV
## 838             некоторый   APRO
## 839              нелегкий      A
## 840               нелепый      A
## 841             нелестный      A
## 842               неловко    ADV
## 843            неловкость      S
## 844                нельзя    ADV
## 845                немало    ADV
## 846               немного    ADV
## 847            немножечко    ADV
## 848              немножко    ADV
## 849                 немой      A
## 850           ненаглядный      A
## 851           ненормально    ADV
## 852              ненужный      A
## 853         необходимость      S
## 854              необычно    ADV
## 855            неожиданно    ADV
## 856         неожиданность      S
## 857           неожиданный      A
## 858      неопределенность      S
## 859           непонимание      S
## 860             непонятно    ADV
## 861            непонятный      A
## 862       непосредственно    ADV
## 863          непотребство      S
## 864           неправильно    ADV
## 865           неприличный      A
## 866             неприязнь      S
## 867             неприятно    ADV
## 868            неприятный      A
## 869             непростой      A
## 870       нереализованный      A
## 871           несерьезный      A
## 872             несколько    ADV
## 873             несколько    NUM
## 874              несмотря    ADV
## 875                 нести      V
## 876            несчастный      A
## 877                   нет   PART
## 878                   нет    ADV
## 879        неуважительный      A
## 880         неуверенность      S
## 881     неудовлетворенный      A
## 882          неформальный      A
## 883             неясность      S
## 884               неясный      A
## 885                    ни   PART
## 886                    ни   CONJ
## 887                 никак ADVPRO
## 888               никакой   APRO
## 889               никогда ADVPRO
## 890                 никто   SPRO
## 891                никуда ADVPRO
## 892                ничего    ADV
## 893                 ничто   SPRO
## 894                    но   CONJ
## 895         новорожденный      A
## 896               новость      S
## 897                 новый      A
## 898                  нога      S
## 899                 номер      S
## 900                 норма      S
## 901             нормально    ADV
## 902            нормальный      A
## 903                   нос      S
## 904                носить      V
## 905               нотация      S
## 906             ночнушка?      S
## 907                  ночь      S
## 908             нравиться      V
## 909           нравоучение      S
## 910                    ну   PART
## 911                 нужда      S
## 912                 нужно    ADV
## 913                нужный      A
## 914               нянечка      S
## 915             нянчиться      V
## 916                нянька      S
## 917               нянюшка      S
## 918                  няня      S
## 919                     о     PR
## 920                    об     PR
## 921                   оба    NUM
## 922            обдумывать      V
## 923          обезличивать      V
## 924             оберегать      V
## 925          обертываться      V
## 926        обескураженно?    ADV
## 927        обескураживать      V
## 928          обеспечивать      V
## 929          обеспокоенно    ADV
## 930       обеспокоенность      S
## 931                обидно    ADV
## 932               обидчик      S
## 933               обижать      V
## 934             обижаться      V
## 935             обиженный      A
## 936           облажаться?      V
## 937            облегчение      S
## 938            обманывать      V
## 939            обнаженный      A
## 940          обнаруживать      V
## 941              обнимать      V
## 942            обниматься      V
## 943         оборачиваться      V
## 944                 образ      S
## 945               обратно    ADV
## 946              обратный      A
## 947              обращать      V
## 948            обращаться      V
## 949            обременять      V
## 950              обронить      V
## 951            обстановка      S
## 952        обстоятельство      S
## 953             обсуждать      V
## 954              обучение      S
## 955              общаться      V
## 956               общение      S
## 957          общественный      A
## 958                 общий      A
## 959           объединение      S
## 960                объект      S
## 961            объяснение      S
## 962             объяснять      V
## 963           объясняться      V
## 964             обыденный      A
## 965                обычно    ADV
## 966               обычный      A
## 967           обязанность      S
## 968                   ого   INTJ
## 969               оголять      V
## 970               одевать      V
## 971                одежда      S
## 972            одергивать      V
## 973                одеяло      S
## 974               одеяние      S
## 975                  один   APRO
## 976                  один   ANUM
## 977              одинокий      A
## 978           одиночество      S
## 979                однако   CONJ
## 980            однозначно    ADV
## 981            однотонный      A
## 982              ожидание      S
## 983               ожидать      V
## 984           озабочивать      V
## 985            озадаченно    ADV
## 986           озадачивать      V
## 987                    ой   INTJ
## 988             оказывать      V
## 989           оказываться      V
## 990              окликать      V
## 991                  окно      S
## 992                 около     PR
## 993                округа      S
## 994              окружать      V
## 995            окружающие      S
## 996                    он   SPRO
## 997                   она   SPRO
## 998                онегин      S
## 999                   они   SPRO
## 1000                  оно   SPRO
## 1001                 опа?      S
## 1002           опаздывать      V
## 1003              опешить      V
## 1004            описывать      V
## 1005          оправдывать      V
## 1006          определенно    ADV
## 1007              опрятно    ADV
## 1008             опускать      V
## 1009                 опыт      S
## 1010                опять    ADV
## 1011          оскорбление      S
## 1012           оскорблять      V
## 1013             особенно    ADV
## 1014                особо    ADV
## 1015               особый      A
## 1016           осознавать      V
## 1017           оставаться      V
## 1018            оставлять      V
## 1019        останавливать      V
## 1020           осторожный      A
## 1021      осчастливливать      V
## 1022                   от     PR
## 1023           отваживать      V
## 1024            отвергать      V
## 1025          отвертеться      V
## 1026        отвертываться      V
## 1027                ответ      S
## 1028      ответственность      S
## 1029             отвечать      V
## 1030            отвлекать      V
## 1031          отвлекаться      V
## 1032          отвлеченный      A
## 1033             отводить      V
## 1034         отворачивать      V
## 1035       отворачиваться      V
## 1036           отвращение      S
## 1037             отгибать      V
## 1038       отгораживаться      V
## 1039             отдавать      V
## 1040           отдаляться      V
## 1041             отдельно    ADV
## 1042             отдыхать      V
## 1043                отель      S
## 1044                 отец      S
## 1045                отказ      S
## 1046           отказывать      V
## 1047         отказываться      V
## 1048          откладывать      V
## 1049        откланиваться      V
## 1050           открывание      S
## 1051             открытка      S
## 1052            откуда-то ADVPRO
## 1053              отлично    ADV
## 1054             относить      V
## 1055           относиться      V
## 1056            отношение      S
## 1057         отодвигаться      V
## 1058          отплачивать      V
## 1059         отправляться      V
## 1060          отпрядывать      V
## 1061            отпускать      V
## 1062             отражать      V
## 1063        отреагировать      V
## 1064            отставать      V
## 1065          отстраненно    ADV
## 1066       отстраненность      S
## 1067           отстранять      V
## 1068         отстраняться      V
## 1069            отступать      V
## 1070               отсюда ADVPRO
## 1071          отталкивать      V
## 1072           оттягивать      V
## 1073          отхватывать      V
## 1074             отходить      V
## 1075              отчасти    ADV
## 1076             отчаяние      S
## 1077            отчуждать      V
## 1078           отчужденно    ADV
## 1079             отшивать      V
## 1080           официантка      S
## 1081           охватывать      V
## 1082           охладевать      V
## 1083            оценивать      V
## 1084       очаровательный      A
## 1085                очень    ADV
## 1086            очередной      A
## 1087              очередь      S
## 1088          ошарашивать      V
## 1089               ошибка      S
## 1090              ощущать      V
## 1091             ощущение      S
## 1092                  паб      S
## 1093                палец      S
## 1094                 папа      S
## 1095             папироса      S
## 1096                 пара      S
## 1097               парень      S
## 1098                 парк      S
## 1099              парочка      S
## 1100              партнер      S
## 1101          партнерский      A
## 1102              пахнуть      V
## 1103             пеленать      V
## 1104           пепельница      S
## 1105               первый   ANUM
## 1106      переглядываться      V
## 1107                перед     PR
## 1108           передавать      V
## 1109             передача      S
## 1110             передний      A
## 1111          переживание      S
## 1112           переживать      V
## 1113       перекидываться      V
## 1114           перелагать      V
## 1115       переменчивость      S
## 1116           переминать      V
## 1117           переносить      V
## 1118            перепалка      S
## 1119          перерастать      V
## 1120             пересказ      S
## 1121            переспать      V
## 1122          переставать      V
## 1123         перетягивать      V
## 1124         переубеждать      V
## 1125           переходить      V
## 1126          перечислять      V
## 1127               период      S
## 1128              персона      S
## 1129             персонаж      S
## 1130          перспектива      S
## 1131                песок      S
## 1132            печальный      A
## 1133               пилить      V
## 1134               писать      V
## 1135               письмо      S
## 1136               питать      V
## 1137                 пить      V
## 1138                 пища      S
## 1139               плакат      S
## 1140              плакать      V
## 1141                 план      S
## 1142               платье      S
## 1143                 плач      S
## 1144                плечо      S
## 1145                плохо    ADV
## 1146               плохой      A
## 1147                 плюс   CONJ
## 1148                   по     PR
## 1149          по-отечески    ADV
## 1150             побежать      V
## 1151         побеседовать      V
## 1152               побыть      V
## 1153            поведение      S
## 1154           поведывать      V
## 1155          повертывать      V
## 1156        повертываться      V
## 1157 повзаимодействовать?      V
## 1158           повздорить      V
## 1159          повзрослеть      V
## 1160                повод      S
## 1161             поводить      V
## 1162          поглядывать      V
## 1163           поговорить      V
## 1164            погружать      V
## 1165             погулять      V
## 1166                  под     PR
## 1167             подавать      V
## 1168             подарить      V
## 1169              подарок      S
## 1170          подготовить      V
## 1171         поддерживать      V
## 1172           поделиться      V
## 1173            подержать      V
## 1174            поджимать      V
## 1175          подкатывать      V
## 1176           подключать      V
## 1177            подлезать      V
## 1178             подобный      A
## 1179          подозревать      V
## 1180                подол      S
## 1181           подопечный      A
## 1182              подруга      S
## 1183             подружка      S
## 1184        подсаживаться      V
## 1185            подсказка      S
## 1186         подслушивать      V
## 1187          подтягивать      V
## 1188             подумать      V
## 1189            подходить      V
## 1190              поехать      V
## 1191           пожалуйста   PART
## 1192           пожениться      V
## 1193              пожилой      A
## 1194                 поза      S
## 1195              позвать      V
## 1196               поздно    ADV
## 1197        поздороваться      V
## 1198           позировать      V
## 1199        познакомиться      V
## 1200             поиграть      V
## 1201           поиграться      V
## 1202     поинтересоваться      V
## 1203             поискать      V
## 1204                пойти      V
## 1205                 пока   CONJ
## 1206           показывать      V
## 1207         показываться      V
## 1208                покой      S
## 1209                  пол      S
## 1210             полагать      V
## 1211                 поле      S
## 1212              полезно    ADV
## 1213             поличное      S
## 1214            полностью    ADV
## 1215               полный      A
## 1216            полосатый      A
## 1217            полуголый      A
## 1218             получать      V
## 1219           получаться      V
## 1220               польза      S
## 1221             полюбить      V
## 1222             полюбой?      S
## 1223             помешать      V
## 1224            помещение      S
## 1225           помириться      V
## 1226             помогать      V
## 1227               помощь      S
## 1228               помыть      V
## 1229            понимание      S
## 1230             понимать      V
## 1231          понравиться      V
## 1232             понятный      A
## 1233             попадать      V
## 1234           попадаться      V
## 1235            попечение      S
## 1236          попробовать      V
## 1237            попросить      V
## 1238           попытаться      V
## 1239              попытка      S
## 1240                 пора    ADV
## 1241                 пора      S
## 1242              портрет      S
## 1243           поругаться      V
## 1244                порыв      S
## 1245             посадить      V
## 1246             посидеть      V
## 1247                после     PR
## 1248                после    ADV
## 1249          последовать      V
## 1250          последствие      S
## 1251            послушать      V
## 1252           посмотреть      V
## 1253          поссориться      V
## 1254           поставлять      V
## 1255           постепенно    ADV
## 1256            постоялец      S
## 1257            постоянно    ADV
## 1258           постоянный      A
## 1259             поступок      S
## 1260            потаенный      A
## 1261            потерянно    ADV
## 1262             потерять      V
## 1263                потом ADVPRO
## 1264               потому ADVPRO
## 1265          потребность      S
## 1266          потревожить      V
## 1267            поужинать      V
## 1268              поучать      V
## 1269         пофлиртовать      V
## 1270           похабность      S
## 1271            похлопать      V
## 1272              походка      S
## 1273               похоже    ADV
## 1274              похожий      A
## 1275               похоть      S
## 1276           поцеловать      V
## 1277               почему ADVPRO
## 1278            почему-то ADVPRO
## 1279        почувствовать      V
## 1280             пошутить      V
## 1281               пощада      S
## 1282              поэтому ADVPRO
## 1283            появление      S
## 1284           появляться      V
## 1285               правда      S
## 1286               правда    ADV
## 1287              правило      S
## 1288            правильно    ADV
## 1289           правильный      A
## 1290               правый      A
## 1291          праздничный      A
## 1292            пребывать      V
## 1293        превосходство      S
## 1294             преграда      S
## 1295               предел      S
## 1296           предлагать      V
## 1297          предложение      S
## 1298              предмет      S
## 1299        предотвращать      V
## 1300         предполагать      V
## 1301        предпринимать      V
## 1302          предприятие      S
## 1303        представление      S
## 1304         представлять      V
## 1305       представляться      V
## 1306        предупреждать      V
## 1307       предшествовать      V
## 1308            презрение      S
## 1309            прекрасно    ADV
## 1310           прекрасный      A
## 1311        преподаватель      S
## 1312            прерывать      V
## 1313            прецедент      S
## 1314                  при     PR
## 1315               привет      S
## 1316      привлекательный      A
## 1317           привлекать      V
## 1318          привлечение      S
## 1319            привыкать      V
## 1320          привязывать      V
## 1321          пригибаться      V
## 1322         придерживать      V
## 1323          придумывать      V
## 1324            приезжать      V
## 1325          прижиматься      V
## 1326           признавать      V
## 1327         признаваться      V
## 1328               прийти      V
## 1329          приказывать      V
## 1330            прикольно    ADV
## 1331          прикуривать      V
## 1332            приличный      A
## 1333            применять      V
## 1334          примеривать      V
## 1335             примерно    ADV
## 1336            принимать      V
## 1337            приносить      V
## 1338                принц      S
## 1339              принцип      S
## 1340             принятие      S
## 1341         приобнимать?      V
## 1342         приоткрывать      V
## 1343          приподнятый      A
## 1344          приподымать      V
## 1345              природа      S
## 1346            приседать      V
## 1347             прислуга      S
## 1348             присмотр      S
## 1349           приставать      V
## 1350          приставлять      V
## 1351           пристально    ADV
## 1352          пристальный      A
## 1353          пристрастие      S
## 1354          присутствие      S
## 1355            приходить      V
## 1356               причем   CONJ
## 1357             прическа      S
## 1358              причина      S
## 1359            причитать      V
## 1360              приятно    ADV
## 1361             приятный      A
## 1362                  про     PR
## 1363             проблема      S
## 1364          проваливать      V
## 1365          провиниться      V
## 1366            проводить      V
## 1367            провожать      V
## 1368            прогибать      V
## 1369         проглядывать      V
## 1370             прогнать      V
## 1371           продолжать      V
## 1372          продолжение      S
## 1373          произносить      V
## 1374          происходить      V
## 1375            пропадать      V
## 1376        прорабатывать      V
## 1377            просекать      V
## 1378              просить      V
## 1379               просто   PART
## 1380               просто    ADV
## 1381         пространство      S
## 1382            проступок      S
## 1383          просыпаться      V
## 1384              просьба      S
## 1385          противиться      V
## 1386             противно    ADV
## 1387      противоположный      A
## 1388          протягивать      V
## 1389            проходить      V
## 1390              процент      S
## 1391              процесс      S
## 1392                прочь    ADV
## 1393              прошлое      S
## 1394              прошлый      A
## 1395              прощать      V
## 1396            проявлять      V
## 1397                прямо   PART
## 1398               прямой      A
## 1399            публичный      A
## 1400               пугать      V
## 1401                 пупс      S
## 1402               пускай   PART
## 1403          путешествие      S
## 1404                 путь      S
## 1405                пуфик      S
## 1406             пытаться      V
## 1407                пытка      S
## 1408                 пять    NUM
## 1409               работа      S
## 1410             работать      V
## 1411             работник      S
## 1412            работящий      A
## 1413           равнодушие      S
## 1414               равный      A
## 1415                  рад      A
## 1416             радовать      V
## 1417            радостный      A
## 1418              радость      S
## 1419                  раз      S
## 1420          разбираться      V
## 1421       развертываться      V
## 1422          развеселять      V
## 1423         развлекаться      V
## 1424               развод      S
## 1425          разводиться      V
## 1426        разговаривать      V
## 1427             разговор      S
## 1428        раздосадовать      V
## 1429           раздражать      V
## 1430          раздражение      S
## 1431       раздраженность      S
## 1432         раздраженный      A
## 1433          различаться      V
## 1434               размер      S
## 1435           размышлять      V
## 1436          разногласие      S
## 1437               разный      A
## 1438              разовый      A
## 1439          разозлиться      V
## 1440        разочарование      S
## 1441            разрешать      V
## 1442          разрешаться      V
## 1443                разум      S
## 1444                ранее    ADV
## 1445                 рано    ADV
## 1446          раскусывать      V
## 1447            распивать      V
## 1448           расписание      S
## 1449         расплакаться      V
## 1450          располагать      V
## 1451         расположение      S
## 1452      расположенность      S
## 1453            рассевать      V
## 1454         рассеиваться      V
## 1455           рассердить      V
## 1456              рассказ      S
## 1457         рассказывать      V
## 1458          расслаблять      V
## 1459          расставание      S
## 1460         расставаться      V
## 1461           расстояние      S
## 1462         расстраивать      V
## 1463       расстраиваться      V
## 1464         расстроенный      A
## 1465           рассуждать      V
## 1466          растерянный      A
## 1467          расходиться      V
## 1468              рваться      V
## 1469          реагировать      V
## 1470              ребенок      S
## 1471            ребеночек      S
## 1472            ревновать      V
## 1473             ревность      S
## 1474                резко    ADV
## 1475            репетитор      S
## 1476        репетиторство      S
## 1477             ресторан      S
## 1478               ресурс      S
## 1479               решать      V
## 1480              решение      S
## 1481            решимость      S
## 1482           решительно    ADV
## 1483          решительный      A
## 1484              рисунок      S
## 1485                  род      S
## 1486             родитель      S
## 1487         родительница      S
## 1488          родственник      S
## 1489          родственный      A
## 1490              родство      S
## 1491               рожать      V
## 1492              розовый      A
## 1493                 роль      S
## 1494            романтика      S
## 1495        романтический      A
## 1496          романтичный      A
## 1497                  рот      S
## 1498               ругать      V
## 1499             ругаться      V
## 1500                 рука      S
## 1501                рывок      S
## 1502                рядом    ADV
## 1503                    с     PR
## 1504                  сад      S
## 1505             садиться      V
## 1506             салиться      V
## 1507                  сам   APRO
## 1508           самооценка      S
## 1509         самоуважение      S
## 1510                самый   APRO
## 1511                 сара      S
## 1512              сбегать      V
## 1513              сборная      S
## 1514            сверстник      S
## 1515           свершаться      V
## 1516                 свет      S
## 1517              светлый      A
## 1518             светский      A
## 1519             свидание      S
## 1520              свидос?      S
## 1521              свобода      S
## 1522                 свой   APRO
## 1523                 свой   SPRO
## 1524            связанный      A
## 1525            связывать      V
## 1526                связь      S
## 1527           сглаживать      V
## 1528            сдаваться      V
## 1529              сделать      V
## 1530           сдержанный      A
## 1531           сдерживать      V
## 1532                 себя   SPRO
## 1533              сегодня    ADV
## 1534                  сей   APRO
## 1535               сейчас    ADV
## 1536           секретарша      S
## 1537             семейный      A
## 1538                семья      S
## 1539       сепарироваться      V
## 1540               сервис      S
## 1541              сердито    ADV
## 1542              сережка      S
## 1543             серьезно    ADV
## 1544            серьезный      A
## 1545               сестра      S
## 1546            сестренка      S
## 1547                сзади    ADV
## 1548                сзади     PR
## 1549               сигара      S
## 1550             сигарета      S
## 1551               сидеть      V
## 1552                 сила      S
## 1553               сильно    ADV
## 1554              сильный      A
## 1555      симпатизировать      V
## 1556          симпатичный      A
## 1557             ситуация      S
## 1558              сказать      V
## 1559               сказка      S
## 1560              скандал      S
## 1561         сканирование      S
## 1562             склонный      A
## 1563           склоняться      V
## 1564              сколько   CONJ
## 1565     сконцентрировать      V
## 1566                скоро    ADV
## 1567             скрывать      V
## 1568           скрываться      V
## 1569                скука      S
## 1570            скуривать      V
## 1571               скучно    ADV
## 1572                слева    ADV
## 1573               слегка    ADV
## 1574              следить      V
## 1575            следовать      V
## 1576            следующий      A
## 1577              слезать      V
## 1578            сливаться      V
## 1579              слишком    ADV
## 1580            словесный      A
## 1581               словно   CONJ
## 1582                слово      S
## 1583               сложно    ADV
## 1584             служанка      S
## 1585               случай      S
## 1586             случайно    ADV
## 1587            случайный      A
## 1588            случаться      V
## 1589              слушать      V
## 1590              слышать      V
## 1591                смена      S
## 1592              сменить      V
## 1593             смеяться      V
## 1594             смотреть      V
## 1595                смочь      V
## 1596              смущать      V
## 1597             смятение      S
## 1598              сначала    ADV
## 1599              снимать      V
## 1600       снисходительно    ADV
## 1601                снова    ADV
## 1602                   со     PR
## 1603               собака      S
## 1604        собеседование      S
## 1605           собираться      V
## 1606           соблазнять      V
## 1607           собственно    ADV
## 1608              событие      S
## 1609           совершенно    ADV
## 1610              совесть      S
## 1611                совет      S
## 1612           совместный      A
## 1613              соврать      V
## 1614               совсем    ADV
## 1615             согласие      S
## 1616          соглашаться      V
## 1617            создавать      V
## 1618          сомневаться      V
## 1619         сомнительный      A
## 1620             сообщать      V
## 1621       соответственно    ADV
## 1622      соответствовать      V
## 1623             соперник      S
## 1624          соперничать      V
## 1625                сосед      S
## 1626             соседний      A
## 1627      сосредотачивать      V
## 1628      сосредоточивать      V
## 1629            состояние      S
## 1630        состоятельный      A
## 1631           состояться      V
## 1632       сосуществовать      V
## 1633            сохранять      V
## 1634              спалить      V
## 1635            спасаться      V
## 1636                спать      V
## 1637           специалист      S
## 1638           специально    ADV
## 1639                спина      S
## 1640               спинка      S
## 1641             спокойно    ADV
## 1642            спокойный      A
## 1643          спокойствие      S
## 1644               способ      S
## 1645            способный      A
## 1646       справедливость      S
## 1647          справляться      V
## 1648           спрашивать      V
## 1649               спустя     PR
## 1650             спутница      S
## 1651              средний      A
## 1652                ссора      S
## 1653          стандартный      A
## 1654          становиться      V
## 1655            стараться      V
## 1656            старинный      A
## 1657              старший      A
## 1658               старый      A
## 1659            статичный      A
## 1660        стихотворение      S
## 1661                  сто    NUM
## 1662               стоить      V
## 1663                 стол      S
## 1664               столик      S
## 1665             столовая      S
## 1666              сторона      S
## 1667               стоять      V
## 1668              странно    ADV
## 1669             странный      A
## 1670             страшный      A
## 1671           стремиться      V
## 1672               ступор      S
## 1673               стыдно    ADV
## 1674               судить      V
## 1675                 судя    ADV
## 1676                 судя     PR
## 1677              супруга      S
## 1678          супружеский      A
## 1679                сутки      S
## 1680         существовать      V
## 1681     сфотографировать      V
## 1682              сходить      V
## 1683                сцена      S
## 1684           счастливый      A
## 1685              считать      V
## 1686            считаться      V
## 1687                  сын      S
## 1688                 сюда ADVPRO
## 1689                сюжет      S
## 1690              сюрприз      S
## 1691                табак      S
## 1692         таинственный      A
## 1693                  так ADVPRO
## 1694               так-то   PART
## 1695                также    ADV
## 1696                 таки   PART
## 1697                такой   APRO
## 1698               талант      S
## 1699                  там ADVPRO
## 1700               тандем      S
## 1701            танцевать      V
## 1702                 твой   APRO
## 1703            телевизор      S
## 1704                 тело      S
## 1705                 тема      S
## 1706               темный      A
## 1707               теперь    ADV
## 1708                тепло      S
## 1709               теплый      A
## 1710                 тест      S
## 1711              тетушка      S
## 1712                  тип      S
## 1713             типичный      A
## 1714                тиран      S
## 1715                   тк      S
## 1716                   то   CONJ
## 1717                   то   SPRO
## 1718                   то   PART
## 1719                тогда ADVPRO
## 1720                 тоже   PART
## 1721               только   PART
## 1722                  том      S
## 1723                  тон      S
## 1724                  тот   APRO
## 1725                точка      S
## 1726                точно    ADV
## 1727              тратить      V
## 1728           требование      S
## 1729            требовать      V
## 1730              тревога      S
## 1731            тревожный      A
## 1732              трезвый      A
## 1733               трепет      S
## 1734          треугольник      S
## 1735              трещина      S
## 1736                  три    NUM
## 1737              трогать      V
## 1738               трубка      S
## 1739         трудолюбивый      A
## 1740            тряпичный      A
## 1741                 туда ADVPRO
## 1742                 тупо    ADV
## 1743                  тут ADVPRO
## 1744               тучный      A
## 1745                   ты   SPRO
## 1746               тяжело    ADV
## 1747              тяжелый      A
## 1748             тянуться      V
## 1749                    у     PR
## 1750              убегать      V
## 1751             убеждать      V
## 1752           убеждаться      V
## 1753              убивать      V
## 1754              убирать      V
## 1755            убираться      V
## 1756              уважать      V
## 1757               увезти      V
## 1758             уверенно    ADV
## 1759          уверенность      S
## 1760            уверенный      A
## 1761              уверять      V
## 1762              увидеть      V
## 1763             увлекать      V
## 1764         увлеченность      S
## 1765          уговаривать      V
## 1766               угодно   PART
## 1767                 угол      S
## 1768             угрожать      V
## 1769            удаваться      V
## 1770              удалять      V
## 1771            удаляться      V
## 1772                 удар      S
## 1773              ударять      V
## 1774              уделять      V
## 1775           удерживать      V
## 1776            удивление      S
## 1777            удивленно    ADV
## 1778           удивленный      A
## 1779             удивлять      V
## 1780           удивляться      V
## 1781       удовлетворение      S
## 1782        удовлетворять      V
## 1783         удовольствие      S
## 1784           удрученный      A
## 1785              ужасный      A
## 1786                  уже    ADV
## 1787                 ужин      S
## 1788              ужинать      V
## 1789             узнавать      V
## 1790            указывать      V
## 1791           уклоняться      V
## 1792              украсть      V
## 1793            улаживать      V
## 1794                улица      S
## 1795               уловка      S
## 1796            улыбаться      V
## 1797               улыбка      S
## 1798                   ум      S
## 1799                уметь      V
## 1800                умный      A
## 1801            умоляющий      A
## 1802               упасть      V
## 1803           упертость?      S
## 1804            упираться      V
## 1805           упрашивать      V
## 1806                упрек      S
## 1807             упрекать      V
## 1808                 урок      S
## 1809              уронить      V
## 1810              условно    ADV
## 1811             услышать      V
## 1812               уснуть      V
## 1813             успевать      V
## 1814          успокаивать      V
## 1815        успокаиваться      V
## 1816             уставать      V
## 1817            усталость      S
## 1818           устраивать      V
## 1819         устраиваться      V
## 1820           утверждать      V
## 1821              утешать      V
## 1822             уточнять      V
## 1823                 ууу?      S
## 1824               ухажер      S
## 1825            ухаживать      V
## 1826              ухмылка      S
## 1827              уходить      V
## 1828               учение      S
## 1829              училище      S
## 1830              учитель      S
## 1831          учительница      S
## 1832            учитывать      V
## 1833                учить      V
## 1834              учиться      V
## 1835           физический      A
## 1836                фильм      S
## 1837                флирт      S
## 1838           флиртовать      V
## 1839                  фон      S
## 1840           фортепьяно      S
## 1841             фотограф      S
## 1842           фотография      S
## 1843                фраза      S
## 1844          французский      A
## 1845                ха-ха   INTJ
## 1846                ханжа      S
## 1847           харассмент      S
## 1848              хватить      V
## 1849                хитро    ADV
## 1850               хитрый      A
## 1851               хмурый      A
## 1852                хобби      S
## 1853                  ход      S
## 1854               ходить      V
## 1855        хозяйственный      A
## 1856            хозяйство      S
## 1857                 холл      S
## 1858              холодно    ADV
## 1859           холодность      S
## 1860             холодный      A
## 1861          холостяцкий      A
## 1862              хороший      A
## 1863               хорошо    ADV
## 1864               хотеть      V
## 1865             хотеться      V
## 1866                 хоть   CONJ
## 1867                 хотя   CONJ
## 1868                 хотя   PART
## 1869                 цвет      S
## 1870           целоваться      V
## 1871                целое      S
## 1872                целый      A
## 1873                 цель      S
## 1874                центр      S
## 1875            цепляться      V
## 1876                  чад      S
## 1877                  чай      S
## 1878                  час      S
## 1879            частность      S
## 1880                часть      S
## 1881                чашка      S
## 1882              человек      S
## 1883                  чем   CONJ
## 1884                через     PR
## 1885               черный      A
## 1886                черта      S
## 1887               чилита      S
## 1888                число      S
## 1889                чисто    ADV
## 1890               читать      V
## 1891             читаться      V
## 1892                  что   CONJ
## 1893                  что   SPRO
## 1894             что-либо   SPRO
## 1895           что-нибудь   SPRO
## 1896               что-то   SPRO
## 1897                 чтоб   CONJ
## 1898                чтобы   CONJ
## 1899              чувство      S
## 1900          чувствовать      V
## 1901        чувствоваться      V
## 1902                чудно    ADV
## 1903               чуждый      A
## 1904                чулок      S
## 1905               чуткий      A
## 1906                 чуть    ADV
## 1907                  шаг      S
## 1908              шалость      S
## 1909           шампанское      S
## 1910              шептать      V
## 1911             шкатулка      S
## 1912                  шок      S
## 1913           шокировать      V
## 1914               шутить      V
## 1915                шутка      S
## 1916                  щас    ADV
## 1917                    э   INTJ
## 1918                    э      S
## 1919     эгоцентричность?      S
## 1920         эмоционально    ADV
## 1921        эмоциональный      A
## 1922               эмоция      S
## 1923             эскапизм      S
## 1924               эскорт      S
## 1925          эскортница?      S
## 1926               эталон      S
## 1927                  это   SPRO
## 1928                  это   PART
## 1929                 этот   APRO
## 1930                   эх   INTJ
## 1931                 юмор      S
## 1932                 юный      A
## 1933                    я   SPRO
## 1934                 явно    ADV
## 1935                 язык      S
## 1936                яркий      A
## 1937                 ярко    ADV
## 1938               ярость      S

# Words <- data.frame(W1 = types(Tokens_S)
#        , W2 = str_replace(types(Tokens_S)
#                          , "([[:alpha:]]+)(_[[:alpha:]]+)"
#                         , "\\1")
#                     , stringsAsFactors = FALSE)
# nrow(Words)
# arrange(Words, W1)

Существительные

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_S") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_S") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_S") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество испытуемых")

Таблица Клиническая

Существительные в Клинической группе, которые использовали более двух раз.

frequency - количество раз во всех текстах rank - ранг по общему количеству использования docfreq - количество текстов в которых слово встретилось (количество испытуемых, которые его использовали)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_S") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##         Lemma frequency rank docfreq
## 1     женщина        83    1      23
## 2     мужчина        69    2      21
## 3     девочка        55    3      16
## 4     девушка        35    4      16
## 6        мама        31    6      15
## 5     ребенок        35    4      14
## 10       рука        21    9      14
## 11    будущее        19   11      12
## 7        дочь        30    7      10
## 9        мать        21    9      10
## 18     сестра        12   15      10
## 8        лицо        23    8       9
## 16   картинка        12   15       9
## 12      кукла        17   12       8
## 13       жена        16   13       8
## 21   ситуация         9   20       8
## 14    человек        13   14       7
## 17      дочка        12   15       7
## 15       друг        12   15       6
## 24    картина         8   23       6
## 25     взгляд         7   25       6
## 30      семья         6   28       6
## 20        муж         9   20       5
## 26      книга         7   25       5
## 28    чувство         6   28       5
## 34       брат         5   33       5
## 19       няня        12   15       4
## 22   младенец         9   20       4
## 23     эмоция         8   23       4
## 27       дело         7   25       4
## 29      мысль         6   28       4
## 31       план         6   28       4
## 33  отношение         5   33       4
## 35   конфликт         5   33       4
## 36     трубка         5   33       4
## 39   внимание         4   38       4
## 46       урок         4   38       4
## 32    нянечка         6   28       3
## 41 знакомство         4   38       3
## 43     измена         4   38       3
## 44     столик         4   38       3
## 45        тип         4   38       3
## 47     момент         4   38       3
## 49  выражение         4   38       3
## 50   проблема         4   38       3
## 52     голова         3   51       3
## 53      время         3   51       3
## 56       кафе         3   51       3
## 58      ссора         3   51       3
## 60    интерес         3   51       3
## 61   знакомый         3   51       3
## 62      диван         3   51       3
## 63     книжка         3   51       3
## 68      выход         3   51       3
## 69       глаз         3   51       3
## 70   разговор         3   51       3
## 71        год         3   51       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_S") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##           Lemma frequency rank docfreq
## 1       мужчина       131    1      28
## 2       девушка       104    2      27
## 3       женщина        96    3      24
## 4       девочка        85    4      23
## 8          дело        33    8      20
## 10         рука        27   10      20
## 5      ситуация        55    5      19
## 6       ребенок        52    6      18
## 7          мама        38    7      13
## 9          няня        28    9      12
## 15        кукла        18   14      12
## 19        время        16   17      12
## 12      человек        19   12      11
## 14       момент        18   14      11
## 21     внимание        15   21      11
## 22      сторона        15   21      11
## 16         мать        17   16      10
## 17    отношение        16   17      10
## 25         лицо        14   24      10
## 11      картина        22   11       9
## 23      будущее        15   21       9
## 13       диалог        19   12       8
## 18     картинка        16   17       8
## 33     конфликт        10   31       8
## 20       работа        16   17       7
## 24         друг        14   24       7
## 28         пара        12   28       7
## 31        дочка        10   31       7
## 36      игрушка         8   36       7
## 41       взгляд         7   41       7
## 29        мысль        11   29       6
## 37        место         8   36       6
## 38        книга         8   36       6
## 47         глаз         6   46       6
## 51        диван         6   46       6
## 58          дом         6   46       6
## 26     разговор        13   26       5
## 32         кафе        10   31       5
## 42        повод         7   41       5
## 43      чувство         7   41       5
## 45       сестра         7   41       5
## 50    удивление         6   46       5
## 52       эмоция         6   46       5
## 55     родитель         6   46       5
## 57      комната         6   46       5
## 66    помещение         5   60       5
## 27         дочь        13   26       4
## 35          раз         9   35       4
## 44     младенец         7   41       4
## 48     обучение         6   46       4
## 54         игра         6   46       4
## 60      решение         5   60       4
## 61       платье         5   60       4
## 62         план         5   60       4
## 64        жизнь         5   60       4
## 67        ссора         4   67       4
## 68     агрессия         4   67       4
## 69          рот         4   67       4
## 70         итог         4   67       4
## 71   фотография         4   67       4
## 72          тон         4   67       4
## 73      интерес         4   67       4
## 75          тип         4   67       4
## 80          год         4   67       4
## 86       голова         4   67       4
## 87       забота         4   67       4
## 30     служанка        11   29       3
## 34         жена        10   31       3
## 39          муж         8   36       3
## 40         отец         8   36       3
## 46      желание         6   46       3
## 53       вопрос         6   46       3
## 56         урок         6   46       3
## 63        семья         5   60       3
## 74    выражение         4   67       3
## 76          фон         4   67       3
## 77         стол         4   67       3
## 78      контакт         4   67       3
## 81         день         4   67       3
## 82         сила         4   67       3
## 83         дама         4   67       3
## 85        драка         4   67       3
## 90       сигара         3   90       3
## 91  непонимание         3   90       3
## 92         окно         3   90       3
## 93         поза         3   90       3
## 94         тема         3   90       3
## 96     проблема         3   90       3
## 97     сигарета         3   90       3
## 98          вид         3   90       3
## 99        слово         3   90       3
## 101       точка         3   90       3
## 108     занятие         3   90       3
## 112   заведение         3   90       3
## 113     общение         3   90       3
## 114    ощущение         3   90       3
## 115    ресторан         3   90       3
## 118       малыш         3   90       3
## 121       спина         3   90       3
## 122  информация         3   90       3

Глаголы

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_V") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_V") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_V") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество испытуемых")

Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_V") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##               Lemma frequency rank docfreq
## 1              быть        87    1      24
## 2            хотеть        38    2      18
## 6            сидеть        29    5      17
## 3          пытаться        34    3      15
## 5              мочь        29    5      14
## 8           уходить        24    8      12
## 9           сказать        22    9      12
## 10         смотреть        22    9      12
## 4            думать        32    4      11
## 7             знать        25    7      10
## 11          держать        19   11      10
## 13        подходить        12   13      10
## 15    познакомиться        11   15      10
## 14        приходить        12   13       9
## 16        нравиться        11   15       8
## 20           делать        10   17       8
## 27            пойти         8   25       8
## 12      чувствовать        13   12       7
## 17         казаться        10   17       7
## 18         понимать        10   17       7
## 19           читать        10   17       7
## 22      происходить         9   21       7
## 23         удивлять         9   21       7
## 25           решать         8   25       7
## 24         говорить         9   21       6
## 26       заниматься         8   25       6
## 29      успокаивать         7   29       6
## 33         напугать         6   32       6
## 35           давать         6   32       6
## 30       изображать         7   29       5
## 32       удерживать         6   32       5
## 37           курить         5   36       5
## 40       находиться         5   36       5
## 21           видеть         9   21       4
## 31           играть         7   29       4
## 34          сделать         6   32       4
## 36         изменять         5   36       4
## 38        объяснять         5   36       4
## 42         начинать         5   36       4
## 44          просить         4   44       4
## 45     поддерживать         4   44       4
## 46         обнимать         4   44       4
## 47      расходиться         4   44       4
## 48       поговорить         4   44       4
## 53       спрашивать         4   44       4
## 55         уставать         4   44       4
## 56         отдыхать         4   44       4
## 28 заинтересовывать         8   25       3
## 39          слушать         5   36       3
## 41    разговаривать         5   36       3
## 43       испытывать         5   36       3
## 49         помогать         4   44       3
## 50        случаться         4   44       3
## 51        выглядеть         4   44       3
## 52       продолжать         4   44       3
## 54         узнавать         4   44       3
## 58       сдерживать         3   57       3
## 60         общаться         3   57       3
## 61      встречаться         3   57       3
## 63         получать         3   57       3
## 64         замечать         3   57       3
## 65       отстранять         3   57       3
## 66       оставаться         3   57       3
## 67      застукивать         3   57       3
## 69         обращать         3   57       3
## 70           лежать         3   57       3
## 73         садиться         3   57       3
## 74         вставать         3   57       3
## 75           рожать         3   57       3
## 76         отдавать         3   57       3
## 80     рассказывать         3   57       3
## 83      понравиться         3   57       3
## 84            ждать         3   57       3
## 86        улыбаться         3   57       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_V") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##                Lemma frequency rank docfreq
## 2             хотеть        90    2      28
## 1               быть       132    1      27
## 3             думать        85    3      25
## 4               мочь        72    4      24
## 5             сидеть        49    5      24
## 8            сказать        32    8      20
## 10          говорить        29   10      20
## 6           пытаться        42    6      19
## 7            уходить        41    7      19
## 9           смотреть        31    9      17
## 17       происходить        25   17      16
## 20        заниматься        23   20      16
## 16            делать        26   15      15
## 14          понимать        27   13      14
## 15             пойти        26   15      14
## 18         подходить        25   17      14
## 23           держать        18   21      13
## 11             знать        29   10      12
## 21           сделать        18   21      12
## 13        изображать        27   13      11
## 19            видеть        25   17      11
## 24        продолжать        16   24      11
## 25           слушать        16   24      11
## 12          казаться        28   12      10
## 22            играть        18   21      10
## 33         приходить        11   29      10
## 26          удивлять        15   26       9
## 27       чувствовать        15   26       9
## 30        спрашивать        11   29       9
## 29        находиться        11   29       8
## 31        удерживать        11   29       8
## 35          выходить        10   34       8
## 38            читать         9   37       8
## 42           ожидать         8   39       8
## 44         объяснять         8   39       8
## 28      рассказывать        12   28       7
## 37        оставаться         9   37       7
## 40     разговаривать         8   39       7
## 49           увидеть         7   45       7
## 51            стоять         7   45       7
## 53          хотеться         7   45       7
## 55            давать         7   45       7
## 56         нравиться         7   45       7
## 32         выглядеть        11   29       6
## 34              идти        10   34       6
## 36       успокаивать        10   34       6
## 39  заинтересовывать         8   39       6
## 45        переживать         7   45       6
## 46            решать         7   45       6
## 52          узнавать         7   45       6
## 54        поговорить         7   45       6
## 48        обращаться         7   45       5
## 58          находить         7   45       5
## 59          напугать         7   45       5
## 60          захотеть         6   60       5
## 61          начинать         6   60       5
## 63         принимать         6   60       5
## 64     заканчиваться         6   60       5
## 66        собираться         6   60       5
## 68         разрешать         5   68       5
## 70        появляться         5   68       5
## 71          увлекать         5   68       5
## 72       расходиться         5   68       5
## 75          получать         5   68       5
## 47           злиться         7   45       4
## 57        испытывать         7   45       4
## 62         попросить         6   60       4
## 65          замечать         6   60       4
## 67          поиграть         6   60       4
## 69         случаться         5   68       4
## 73        показывать         5   68       4
## 74     повертываться         5   68       4
## 78        заставлять         5   68       4
## 79          вступать         5   68       4
## 81     отвертываться         5   68       4
## 83        передавать         5   68       4
## 84    отворачиваться         5   68       4
## 85     останавливать         4   85       4
## 87         послушать         4   85       4
## 88          подумать         4   85       4
## 89      расстраивать         4   85       4
## 92      игнорировать         4   85       4
## 93            бежать         4   85       4
## 94          отвечать         4   85       4
## 98            ругать         4   85       4
## 102        оставлять         4   85       4
## 104      наклоняться         4   85       4
## 41    предшествовать         8   39       3
## 43          уставать         8   39       3
## 50        направлять         7   45       3
## 76            искать         5   68       3
## 77          избегать         5   68       3
## 80          задавать         5   68       3
## 90          садиться         4   85       3
## 91          помогать         4   85       3
## 95        шокировать         4   85       3
## 96            писать         4   85       3
## 97          отдыхать         4   85       3
## 99        приставать         4   85       3
## 100           любить         4   85       3
## 101        наблюдать         4   85       3
## 106     переубеждать         3  105       3
## 107     развлекаться         3  105       3
## 108         потерять         3  105       3
## 110       готовиться         3  105       3
## 111    познакомиться         3  105       3
## 113     отстраняться         3  105       3
## 114       относиться         3  105       3
## 115      разбираться         3  105       3
## 116      воспитывать         3  105       3
## 117        выполнять         3  105       3
## 119           давить         3  105       3
## 120       удивляться         3  105       3
## 122          учиться         3  105       3
## 124        вернуться         3  105       3
## 125            зайти         3  105       3
## 126          убегать         3  105       3
## 127          просить         3  105       3
## 128  восстанавливать         3  105       3
## 130       предлагать         3  105       3
## 131        стараться         3  105       3
## 132          научать         3  105       3
## 133       попытаться         3  105       3
## 134          позвать         3  105       3
## 135      уговаривать         3  105       3

Прилагательные

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_A") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_A") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_A") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество текстов")

Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_A") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##          Lemma frequency rank docfreq
## 1  недовольный         8    1       6
## 2      старший         8    1       5
## 4      прошлый         7    4       5
## 5      хороший         6    5       5
## 6    маленький         6    5       5
## 9     красивый         5    9       5
## 10      задний         5    9       5
## 3    возможный         8    1       4
## 7      молодой         6    5       4
## 8       данный         6    5       4
## 11   спокойный         5    9       4
## 12        злой         5    9       4
## 14      равный         4   14       4
## 13     младший         5    9       3
## 16     готовый         3   15       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_A") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##          Lemma frequency rank docfreq
## 1      молодой        27    1      15
## 2       данный        12    2       7
## 3    маленький        10    3       6
## 5     красивый         9    4       6
## 7        общий         8    7       6
## 8      хороший         8    7       6
## 10  интересный         6   10       6
## 11    приятный         6   10       6
## 13      старый         6   10       6
## 4      старший         9    4       5
## 6      похожий         9    4       5
## 12      задний         6   10       5
## 14      прямой         6   10       5
## 16   небольшой         5   15       5
## 9      готовый         8    7       4
## 15     должный         5   15       4
## 17  неприятный         5   15       4
## 18     прошлый         5   15       4
## 19      плохой         4   19       4
## 21    знакомый         4   19       4
## 22      важный         4   19       4
## 25    странный         4   19       4
## 20      личный         4   19       3
## 23   возможный         4   19       3
## 26     близкий         3   26       3
## 27     большой         3   26       3
## 28   спокойный         3   26       3
## 29   обыденный         3   26       3
## 30   следующий         3   26       3
## 33     детский         3   26       3
## 35    подобный         3   26       3
## 36   довольный         3   26       3
## 37 симпатичный         3   26       3

Наречия

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_ADV") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_ADV") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_ADV") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество текстов")

Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_ADV") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##         Lemma frequency rank docfreq
## 1    возможно        32    1      11
## 3       очень        15    2      10
## 5      далеко        12    5      10
## 2       скоро        15    2       8
## 4      сейчас        13    4       6
## 7       нужно         6    7       6
## 6       можно         7    6       5
## 10        все         5    9       5
## 8       видно         6    7       4
## 9     кажется         5    9       4
## 11    немного         5    9       4
## 12   наверное         4   12       4
## 13        нет         4   12       4
## 15     хорошо         4   12       3
## 17      много         3   17       3
## 18      сзади         3   17       3
## 19        уже         3   17       3
## 20       явно         3   17       3
## 21   например         3   17       3
## 22     больше         3   17       3
## 23      точно         3   17       3
## 24        еще         3   17       3
## 25  испуганно         3   17       3
## 27 неожиданно         3   17       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_ADV") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##          Lemma frequency rank docfreq
## 1     возможно        64    1      20
## 2        скоро        60    2      18
## 3        очень        52    3      16
## 5          еще        24    5      13
## 9        рядом        13    9      13
## 4     наверное        32    4      12
## 7       сейчас        19    7      12
## 6          уже        21    6      11
## 8       вообще        18    8      10
## 12     немного        11   12      10
## 24       много         8   24       8
## 15       нужно        10   15       7
## 17       домой        10   15       7
## 18      вместе        10   15       7
## 19      сильно         9   19       7
## 22      далеко         9   19       7
## 26      хорошо         7   26       7
## 11    например        12   11       6
## 13      совсем        11   12       6
## 14       более        11   12       6
## 20       может         9   19       6
## 28         нет         6   28       6
## 29      больше         6   28       6
## 16        надо        10   15       5
## 25       можно         8   24       5
## 31     наконец         5   31       5
## 21    вероятно         9   19       4
## 23      просто         9   19       4
## 27       особо         7   26       4
## 30      теперь         6   28       4
## 32 неправильно         5   31       4
## 33    спокойно         5   31       4
## 34       видно         5   31       4
## 35     наверно         4   35       4
## 36  неожиданно         4   35       4
## 38       давно         4   35       4
## 40        судя         4   35       4
## 43    немножко         4   35       4
## 44       сзади         4   35       4
## 10        явно        13    9       3
## 37      близко         4   35       3
## 41        чуть         4   35       3
## 46   интересно         4   35       3
## 47     сначала         3   47       3
## 48       точно         3   47       3
## 49  изначально         3   47       3
## 52         щас         3   47       3
## 53         все         3   47       3
## 55    наоборот         3   47       3
## 56      похоже         3   47       3
## 57  достаточно         3   47       3
## 58       долго         3   47       3
## 60        рано         3   47       3
## 61  настойчиво         3   47       3
## 63      стыдно         3   47       3
## 64   правильно         3   47       3

Местоимение-существительное

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_SPRO") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_SPRO") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_SPRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество текстов")

Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_SPRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##     Lemma frequency rank docfreq
## 1     она       223    1      25
## 2      он       135    2      23
## 3     это        71    3      22
## 5     они        45    5      22
## 4       я        56    4      20
## 6     все        26    6      14
## 7  что-то        25    7      14
## 8      то        21    8      12
## 9     что        13    9       9
## 11  ничто         7   11       6
## 10     ты        10   10       5
## 12    оно         3   12       3
## 13 кто-то         3   12       3
## 16  никто         3   12       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_SPRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##         Lemma frequency rank docfreq
## 1         она       470    1      30
## 2          он       259    2      30
## 5         они        99    5      29
## 4         это       121    4      26
## 7      что-то        72    7      26
## 6         все        85    6      25
## 3           я       135    3      23
## 8          то        53    8      21
## 10       себя        21    9      14
## 9         что        21    9      12
## 14     кто-то        11   13      10
## 12      ничто        15   12       9
## 11         ты        16   11       7
## 13         вы        11   13       7
## 15         мы        10   15       6
## 16        кто         4   16       4
## 17      никто         3   17       3
## 18 что-нибудь         3   17       3

Союз

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_CONJ") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_CONJ") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_CONJ") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество текстов")

Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_CONJ") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##    Lemma frequency rank docfreq
## 2    что       105    2      24
## 1      и       139    1      23
## 3      а        75    3      21
## 7    как        19    7      13
## 4     но        26    4      12
## 6    или        20    6      11
## 5     то        22    5       9
## 8  чтобы        13    8       9
## 10  если        10   10       6
## 11 будто         8   11       6
## 9   либо        11    9       4
## 12    да         4   12       4
## 13  чтоб         3   13       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_CONJ") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##     Lemma frequency rank docfreq
## 1       и       333    1      30
## 2     что       226    2      30
## 3       а       118    3      27
## 4      но        68    4      24
## 5     или        56    5      19
## 6     как        54    6      19
## 7   чтобы        36    7      18
## 9      то        21    9      10
## 8    либо        31    8       9
## 10   если        10   10       9
## 11     да        10   10       8
## 13  когда         8   13       8
## 12   пока         9   12       6
## 15   хотя         4   15       4
## 14 однако         7   14       3
## 16 причем         3   16       3
## 17    чем         3   16       3

PART частица

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_PART") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_PART") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_PART") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество текстов")

Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_PART") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##       Lemma frequency rank docfreq
## 1        не       129    1      24
## 3        ну        23    3      12
## 6       это        18    6      12
## 2     будто        39    2      11
## 7    просто        15    7      11
## 4        бы        23    3      10
## 5       вот        23    3      10
## 8       нет         8    8       6
## 12 все-таки         5   12       5
## 13       то         5   12       5
## 9        же         6    9       4
## 10     даже         6    9       3
## 11       ли         6    9       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_PART") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##       Lemma frequency rank docfreq
## 1        не       222    1      29
## 4    просто        47    4      21
## 5        бы        40    5      20
## 2       вот       115    2      19
## 6       это        30    6      17
## 3        ну        58    3      16
## 7     будто        30    6      16
## 8        же        29    8      15
## 9      даже        18    9      13
## 13 все-таки         9   13       8
## 14   только         8   14       8
## 10       ли        11   10       7
## 11     тоже        11   10       7
## 12      нет        10   12       6
## 15       то         7   15       6
## 18    вроде         5   16       5
## 16       ни         5   16       4
## 19    прямо         4   19       3

APRO местоимение-прилагательное

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_APRO") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_APRO") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_APRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество текстов")

Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_APRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##       Lemma frequency rank docfreq
## 2      этот        30    2      15
## 3      свой        29    3      15
## 1  какой-то        33    1      12
## 4     такой        23    4      11
## 7   который        12    7      10
## 5        ее        16    5       9
## 6       его        13    6       8
## 9       тот         8    9       8
## 8    другой        11    8       7
## 10     весь         5   10       5
## 11     один         5   10       5
## 12       их         4   12       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_APRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##           Lemma frequency rank docfreq
## 1          этот       115    1      29
## 3          свой        75    3      26
## 2      какой-то       109    2      23
## 5       который        41    5      19
## 6            ее        34    6      18
## 4         такой        66    4      17
## 7        другой        28    7      15
## 8          весь        19    8      12
## 9           его        14    9      10
## 10         один        13   10       9
## 12          тот        10   12       7
## 11        какой        11   11       6
## 13           их         7   13       6
## 14          сам         7   13       5
## 15        самый         6   15       4
## 17 какой-нибудь         4   16       4
## 16       каждый         4   16       3
## 18    некоторый         3   18       3

ADVPRO местоименное наречие

set.seed(100)

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>
  tokens_keep(pattern = "*_ADVPRO") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Клиническая группа")

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>
  tokens_keep(pattern = "*_ADVPRO") |> 
  tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
  dfm() |> 
     dfm_weight(scheme = "boolean") |> 
  textplot_wordcloud(max_words = 50, min_size = 1, rotation = 0)
title("Контрольная группа")

tstat_S <-Tokens_S3 |>
   tokens_keep(pattern = "*_ADVPRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество текстов")

Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
   tokens_keep(pattern = "*_ADVPRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##     Lemma frequency rank docfreq
## 2     так        20    2      12
## 3     тут        17    3      12
## 1     как        36    1       9
## 4   потом        12    4       8
## 5     там        11    5       8
## 6  потому        10    6       8
## 7  как-то         8    7       5
## 9   здесь         5    8       5
## 8 поэтому         5    8       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
   tokens_keep(pattern = "*_ADVPRO") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##        Lemma frequency rank docfreq
## 1        так        82    1      26
## 2        как        60    2      22
## 4     как-то        38    4      16
## 3        там        39    3      15
## 5     потому        25    5      13
## 6    куда-то        19    6      10
## 7      здесь        16    7      10
## 8    поэтому        16    7      10
## 11     потом         6   11       6
## 12      куда         6   11       6
## 10       тут         7   10       5
## 13       где         6   11       5
## 9     где-то         8    9       4
## 15 почему-то         4   15       4
## 14    почему         5   14       3
## 16      туда         3   16       3

N-grams

tstat_S <-Tokens_S3 |>
 
   #tokens_keep(pattern = "*_S") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   tokens_ngrams()|>
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество испытуемых")

tstat_S <-Tokens_S3 |>
 
   #tokens_keep(pattern = "*_S") |> 
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   tokens_ngrams(n = 3L)|>
   dfm() |> 
   dfm_weight(scheme = "boolean") |> 
   textstat_frequency(groups = Sample, n = 20)

ggplot(data = tstat_S, aes(x = factor(nrow(tstat_S):1), y = frequency)) +
    geom_point() +
    facet_wrap(~ group, scales = "free") +
    coord_flip() +
    scale_x_discrete(breaks = nrow(tstat_S):1,
                       labels = tstat_S$feature) +
    labs(x = NULL, y = "Количество испытуемых")

## Таблица Клиническая

Tokens_S3 |>
  tokens_subset(Sample == "Clinical") |>  
    
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   tokens_ngrams(n = 3L)|>
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##               Lemma frequency rank docfreq
## 3  она_не_нравиться         5    3       5
## 2   не_мочь_сказать         6    2       4
## 5           у_она_в         4    5       4
## 6        она_в_рука         4    5       4
## 8        что_она_не         4    5       4
## 9     как_будто_она         4    5       4
## 10    она_как_будто         4    5       4
## 11  к_она_подходить         4    5       4
## 12       то_что_она         4    5       4
## 13    она_не_хотеть         4    5       4
## 15   на_задний_план         4    5       4
## 4    я_казаться_что         5    3       3
## 7      не_знать_что         4    5       3
## 17 мочь_сказать_что         3   17       3
## 18 на_этот_картинка         3   17       3
## 19    в_будущее_они         3   17       3
## 22  смотреть_на_она         3   17       3
## 25     он_не_хотеть         3   17       3
## 28   на_он_смотреть         3   17       3

Таблица Контрольная

Tokens_S3 |>
  tokens_subset(Sample == "Control") |>  
    
   tokens_replace(Dictionary$Word_POS, Dictionary$Word, valuetype = "fixed") |> 
   tokens_ngrams(n = 3L)|>
   dfm() |> 
   textstat_frequency() |>
   filter(docfreq > 2) |> 
   rename(Lemma = feature) |> 
   as.data.frame() |> # Почему не работает на исходном объекте select?
 arrange(desc(docfreq)) |>  # Сортировка по убыванию по полю docfreq
  select(-group)              # Удаление колонки group

##                         Lemma frequency rank docfreq
## 1                я_думать_что        32    1      13
## 2        заниматься_свой_дело        11    2       9
## 4                  то_что_она        10    4       8
## 5                как_будто_бы         9    5       8
## 8             к_она_подходить         8    6       6
## 11                рядом_с_она         6   10       6
## 12                 что_она_не         6   10       6
## 7             на_этот_картина         8    6       5
## 13          мужчина_и_женщина         5   13       5
## 14                  то_что_он         5   13       5
## 15            в_данный_момент         5   13       5
## 16              потому_что_он         5   13       5
## 17               скоро_все_он         5   13       5
## 18              скоро_все_это         5   13       5
## 20            сидеть_на_диван         5   13       5
## 21             держать_в_рука         5   13       5
## 23                думать_о_то         5   13       5
## 25             думать_что_она         5   13       5
## 3              я_казаться_что        11    2       4
## 6                 и_скоро_все         8    6       4
## 9               мочь_быть_она         7    9       4
## 10                 до_это_они         6   10       4
## 19                не_то_чтобы         5   13       4
## 24             думать_что_это         5   13       4
## 26             потому_что_она         5   13       4
## 27                   о_то_что         5   13       4
## 29          они_просто_сидеть         4   28       4
## 30            не_понимать_что         4   28       4
## 32              скоро_все_она         4   28       4
## 33                    у_она_в         4   28       4
## 34                 она_в_рука         4   28       4
## 35               в_рука_книга         4   28       4
## 41              она_не_хотеть         4   28       4
## 44               не_знать_что         4   28       4
## 45                  что_у_она         4   28       4
## 46             я_казаться_она         4   28       4
## 47             она_не_ожидать         4   28       4
## 48              не_хотеть_это         4   28       4
## 22     на_картинка_изображать         5   13       3
## 37              так_скоро_все         4   28       3
## 38               в_свой_мысль         4   28       3
## 39          женщина_на_задний         4   28       3
## 40             на_задний_план         4   28       3
## 42          не_хотеть_слушать         4   28       3
## 52                  это_у_они         3   51       3
## 54         а_женщина_пытаться         3   51       3
## 55  пытаться_он_останавливать         3   51       3
## 56          женщина_и_мужчина         3   51       3
## 57             то_что_мужчина         3   51       3
## 58             это_они_просто         3   51       3
## 59               мама_и_дочка         3   51       3
## 60             сделать_не_так         3   51       3
## 61          женщина_с_мужчина         3   51       3
## 62          мужчина_скоро_все         3   51       3
## 63                на_то_чтобы         3   51       3
## 64             в_другой_место         3   51       3
## 65            место_а_женщина         3   51       3
## 66              скоро_все_они         3   51       3
## 67        мужчина_подходить_к         3   51       3
## 68           понимать_что_она         3   51       3
## 69              мочь_быть_что         3   51       3
## 70               быть_что_она         3   51       3
## 71         что_мужчина_хотеть         3   51       3
## 72              вот_мочь_быть         3   51       3
## 73               мочь_быть_он         3   51       3
## 74           в_другой_сторона         3   51       3
## 75              в_будущее_они         3   51       3
## 76     они_просто_расходиться         3   51       3
## 77               по_свой_дело         3   51       3
## 79          скоро_все_девушка         3   51       3
## 80               из-за_то_что         3   51       3
## 82           она_не_нравиться         3   51       3
## 83            смотреть_на_она         3   51       3
## 84              но_девочка_не         3   51       3
## 85              не_хотеть_она         3   51       3
## 87             этот_мужчина_и         3   51       3
## 89            думать_что_этот         3   51       3
## 90                не_хотеть_с         3   51       3
## 92                она_на_рука         3   51       3
## 94                 у_она_быть         3   51       3
## 95                  то_как_он         3   51       3
## 96                  об_это_не         3   51       3
## 98              как_будто_она         3   51       3
## 99                и_не_хотеть         3   51       3
## 100                он_не_мочь         3   51       3
## 102         девушка_как_будто         3   51       3
## 103                у_они_быть         3   51       3
## 104              потому_что_у         3   51       3
## 110                   к_она_и         3   51       3
## 111                что_он_так         3   51       3
## 113             она_как_будто         3   51       3

…

Сохранение объектов на диск

#save(Words, file = "Words.RData")

Word Frequency

2024-07-18

Техническая информация и библиотеки

Существительные

Таблица Клиническая

Таблица Контрольная

Глаголы

Таблица Клиническая

Таблица Контрольная

Прилагательные

Таблица Клиническая

Таблица Контрольная

Наречия

Таблица Клиническая

Таблица Контрольная

Местоимение-существительное

Таблица Клиническая

Таблица Контрольная

Союз

Таблица Клиническая

Таблица Контрольная

PART частица

Таблица Клиническая

Таблица Контрольная

APRO местоимение-прилагательное

Таблица Клиническая

Таблица Контрольная

ADVPRO местоименное наречие

Таблица Клиническая

Таблица Контрольная

N-grams

Таблица Контрольная

…