Sholokhov

Автор

Vlada Berlin

Дата публикации

21 февраля 2025 г.

Введение

В данной работе мы построим консенсусное дерево на основе датасета “Стилеметрические данные”Тихого Дона” и современной ему прозы”, созданного Б.В. Ореховым, и проаналаизируем получившиеся результаты.

Читаем датасет

Нам необходимо транспонировать таблицу для того, чтобы она приняла следующий вид: столбцы соответствуют переменным (слова), а ряды — наблюдениям (авторы и тексты).

library(stylo)

freq_table <- read.table('table_with_frequencies.txt') |>
  t()

Строим консенсусное дерево

Построим консенсусное дерево, чтобы понять, к чему ближе всего окажется “Тихий Дон”.

bct_result <- stylo(gui = FALSE, 
                    frequencies = freq_table,
                    analysis.type = "BCT",
                    mfw.min = 150,
                    mfw.max = 550,
                    mfw.incr = 100,
                    distance.measure = "wurzburg",
                    write.png.file = FALSE,
                    custom.graph.title = "Консенсусное дерево для Тихого Дона",
                    consensus.strength = 0.5,
                    plot.custom.width = 100, 
                    plot.custom.height = 0.5
                    )

Получилась довольно интересная картина: первые три книги оказались на одной ветке с Донскими рассказами Шолохова, а четвертая книга оказалась на отдельной ветке, причем ближе всего к Донским рассказам первая часть, вторая и третья больше схожи друг с другом, чем с первой или с Донскими Рассказами. Остальные произведения Шолохова оказались на другой ветви, что может объясняться тематикой произведений, так как и в Донских рассказах, и в Тихом Доне описывается жизнь донского казачества.

Заключение

Получившиеся консенсусное дерево говорит в пользу того факта, что “Тихий Дон” был написан Шолоховым.