Алгоритм кластеризации k-средних итеративно разделяет данные на k кластеров, оптимизируя расположение центроидов.
Количество кластеров (k=3) было определено методом “локтя” с использованием графика внутрикластерной суммы квадратов (WSS).
В данной примере использовались реальные данные массовых долей элементов в образцах. Визуализация результатов проводилась методом главных компонент (PCA), что позволило отобразить группировку точек в двумерном пространстве. Полученные результаты показали четкое разделение наблюдений на три ранее определенных кластера.
Также можно использовать функцию fviz_cluster() из пакета factoextra, которая создает визуализацию результатов кластерного анализа. В данном примере отображены центроиды, которые представляют собой средние точки каждого кластера.
Также внизу отображено иерархическое древовидное представление данных, в котором кластеры, полученные методом k-средних, выделены различными цветами. Такая визуализация в виде дендрограммы позволяет наглядно продемонстрировать иерархическую структуру данных и взаимосвязи между кластерами.