library(stylo)
freq_table <- read.table('table_with_frequencies.txt') |>
t()Sholokhov
Введение
В данной работе мы построим консенсусное дерево на основе датасета “Стилеметрические данные”Тихого Дона” и современной ему прозы”, созданного Б.В. Ореховым, и проаналаизируем получившиеся результаты.
Читаем датасет
Нам необходимо транспонировать таблицу для того, чтобы она приняла следующий вид: столбцы соответствуют переменным (слова), а ряды — наблюдениям (авторы и тексты).
Строим консенсусное дерево
Построим консенсусное дерево, чтобы понять, к чему ближе всего окажется “Тихий Дон”.
bct_result <- stylo(gui = FALSE,
frequencies = freq_table,
analysis.type = "BCT",
mfw.min = 150,
mfw.max = 550,
mfw.incr = 100,
distance.measure = "wurzburg",
write.png.file = FALSE,
custom.graph.title = "Консенсусное дерево для Тихого Дона",
consensus.strength = 0.5,
plot.custom.width = 100,
plot.custom.height = 0.5
)Получилась довольно интересная картина: первые три книги оказались на одной ветке с Донскими рассказами Шолохова, а четвертая книга оказалась на отдельной ветке, причем ближе всего к Донским рассказам первая часть, вторая и третья больше схожи друг с другом, чем с первой или с Донскими Рассказами. Остальные произведения Шолохова оказались на другой ветви, что может объясняться тематикой произведений, так как и в Донских рассказах, и в Тихом Доне описывается жизнь донского казачества.
Заключение
Получившиеся консенсусное дерево говорит в пользу того факта, что “Тихий Дон” был написан Шолоховым.