— Страничка с эмбеддингами (Описание в кластерах)

umap <- read_csv("UMAP.csv")
## Rows: 1328 Columns: 9
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (5): Title, category, country, description, lem
## dbl (4): V1, V2, id, cluster
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
mycolors <- c("#A499AA","#746C78", "#D2691E", "#8B7355", "#8B4513","red", "cornsilk3", "cornsilk4", "darkgoldenrod1", "darkgoldenrod3", "#EE7600", "#CD919E", "#FF6347", "#CD6889", "#B22222", "#CD5C5C", "#EE6363", "#CDCDC1", "lightsalmon1", "#FFE4E1", "#BA8FCF")
g1 <- ggplot(data = umap) + geom_point(aes(x = V1, y = V2, colour = as.factor(cluster), label=Title), check_overlap = T, nudge_x = 0.25, nudge_y = 0.25, alpha = 1/2) + labs(color='Кластер') + xlab("") + ylab("") + theme_classic() + scale_color_manual(values = mycolors)
## Warning: Ignoring unknown parameters: check_overlap, nudge_x, nudge_y
## Warning: Ignoring unknown aesthetics: label
end <- ggplotly(g1, tooltip = c("label"))
end
umap$cluster <-as.factor(umap$cluster)
g2 <- ggplot(umap) + geom_bar(aes(x = category, fill = cluster), position = "fill", alpha = 0.8) + theme_minimal() + coord_flip() +scale_fill_manual(values = mycolors) + labs(x = "Категория", y = "", fill = "Кластер")
end2 <- ggplotly(g2, tooltip = c("fill"))
end2

топ слова у кластера -> эмбеддинги крутые, по сути это то насколько обще производители описывают товары, есть лексика для пива, есть на что обращают внимание только производители крепкого я завтра распишу текст

words <- read_delim("words.csv", delim = ";", 
    escape_double = FALSE, trim_ws = TRUE)
## Rows: 15 Columns: 21
## -- Column specification --------------------------------------------------------
## Delimiter: ";"
## chr (21): 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19,...
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
words[21]# тут нужно кнопочку с выбором от 1 до 21
## # A tibble: 15 x 1
##    `21`           
##    <chr>          
##  1 угольный       
##  2 очистка        
##  3 ректифицировать
##  4 крупа          
##  5 ледниковый     
##  6 очищенная      
##  7 вода           
##  8 хлебец         
##  9 этиловый       
## 10 питьевой       
## 11 люкс           
## 12 предусматривать
## 13 кристальный    
## 14 ладожский      
## 15 кремль