Analisis_Cluster Técnicas_Disponibles Ventajas Desventajas

Jerárquico

Los llamados métodos jerárquicos tienen por objetivo agrupar clúster para formar uno nuevo o bien separar alguno ya existente para dar origen a otros dos, de tal forma que, si sucesivamente se va efectuando este proceso de aglomeración o división, se minimice alguna distancia o bien se maximice alguna medida de similitud. Está comprendido en dos grandes grupos: Agrupamiento Aglomerativo y Disociativo. Los métodos aglomerativos también conocidos como ascendentes, comienzan el análisis con tantos grupos como individuos haya mientras que los métodos disociativos también llamados descendentes, constituyen el proceso inverso al anterior. </td>

Aglomerativo:

• Linkage Simple

• Linkage Completo

• Promedio entre grupos

• Método del centroide

• Método de la mediana

• Método de Ward

• Dendograma

• Mapa de Calor

Disociativo:

• Linkage Simple

• Linkage Completo

• Promedio entre grupos

• Método del centroide

• Método de la mediana

• Método de Ward

• Análisis de asociación

• Detector Automático de Interacción.

• La principal ventaja del método jerarquico es que insinua el número de cluster

• No es necesario especificar el número de clusteres necesarios para el algoritmo

• El clustering jerárquico es fácil de implementar

• El dendrograma producido es muy útil para comprender los datos

• Nos permite visualizar simultaneamente, grupos de muestras y caracteristicas

• Una vez que un elemento se agrega a un grupo, no puede pertenecer a otro, a esto se le conoce como anidamiento, el principal problema es que puede que dicha asignación no sea ideal

• No es necesario especificar el número de clusteres necesarios para el algoritmo

• El clustering jerárquico es fácil de implementar

• El dendrograma producido es muy útil para comprender los datos

No Jerárquico

La agrupación en clústeres de particiones son métodos de agrupación que se utilizan para clasificar observaciones, dentro de un conjunto de datos, en varios grupos en función de su similitud. Los algoritmos requieren analista para especificar el número de conglomerados que se generarán. </td>

Métodos de Reasignación:

• Centroides

• PAM

• CLARA

• K-medias

• Quick-Cluster

• Método de Forgy

• Nubes Dinámicas

Búsqueda de densidad:

• Aproximación Tipológica

• Análisis Modal

• Método Taxmap

• Método de Fortín

Aprobación Probabilística:

• Método de Wolf

Métodos Directos: Block-Clustering

Métodos Reductivos: Análisis Factorial tipo Q

• Fácil de entender, fácil de adaptar

• Trabaja bien con conjuntos de datos grandes o pequeños, es eficiente y tiene buen desempeño

• K-medoids es un método de clustering más robusto que K-means, por lo es más adecuado cuando el set de datos contiene outliers o ruido

• Necesita que el usuario defina el número de clústeres

• Necesito conocer k de antemano

• Sensible a ruido

• El resultado puede variar en base a las semillas elegidas al inicio

• Presenta problemas de robustez

• Algunas semillas pueden resultar en una tasa de convergencia menor

• La selección de semillas se puede basar en heurísticas o resultados obtenidos por otros métodos

• Puede caer en mínimos locales

• No trata datos nominales (K-Modes).
* Elaboración propia en base el texto Alboukadel Kassambara,2017