library(tidyverse)
library(stylo)
<- read.table("table_with_frequencies.txt", header = TRUE, sep = " ") |>
data t() |>
as.data.frame()
::datatable(data, options = list(pageLength = 10)) DT
«Тихий Дон» М.А. Шолохова
Консенсусное дерево
«А написал-то кто?»
Зачем
В не самых приятных кругах всё ещё всплывают споры об авторстве “Тихого Дона”, хотя Б.В. Орехов уже потопил их статьёй «Стилеметрические данные «Тихого Дона» и современной ему прозы». Всё ещё не верят. Делать нечего — будем выполнять домашнее задание по R.
Как
Загружаем библиотеки и трансформируем таблицу с частотностями:
Строим консенсусное дерево:
<- stylo(gui = FALSE,
bct_result frequencies = data,
analysis.type = "BCT",
mfw.min = 100,
mfw.max = 300,
mfw.incr = 100,
distance.measure = "wurzburg",
write.png.file = FALSE,
consensus.strength = 0.5,
plot.custom.width = 8,
plot.custom.height = 6)
Красота? Нет! Пытаемся в визуализацию:
par(family = "sans",
cex.main = 1.2,
cex.axis = 1.5,
col.main = "darkblue",
cex = 0.8,
lwd = 1.5,
mar = c(5, 4, 4, 8)
)
<- stylo(gui = FALSE,
bct_result frequencies = data,
analysis.type = "BCT",
mfw.min = 100,
mfw.max = 300,
mfw.incr = 100,
distance.measure = "wurzburg",
write.png.file = FALSE,
consensus.strength = 0.5,
plot.custom.width = 8,
plot.custom.height = 6,
custom.graph.title = "Тихий Дон")
Красота? Нет, но уже лучше. Теперь комментарий.
Итого
Ошибки в бесспорных случаях не допущены: булгаковский роман “Мастер и Маргарита” на минимальном расстоянии от “Белой гвардии”, произведения других соврменников М.А. Шолохова тоже рядом друг с другом.
Интересно, что первые 3 тома “Тихого Дона” соседствуют с ранними в творчестве писателя “Донскими рассказами”, а последний, 4-ый том, с более поздними: “Судьбой Человека”, “Они сражались за родину” и “Поднятой целиной”. Это даёт основание пологать, что если вышеперечисленные произведения написал М.А. Шолохов (а это вопрос уже другой работы), то и “Тихий Дон” написан именно этим автором.