K-means es un método o algoritmo de agrupamineto. Este traba de buscar grupos (tambien llamdos clusters) de datos que contengan algunas caracteristicas similares.

Pasos

  • Determinar el numero de clusters con el que se va a trabajar.
  • K = n

  • Aleatoriamente seleccionar datos en la recta en base la cantidad de clusters especificado anteriormete.
  • Medir la distancia desde el primer hacia los 3 clusters.
  • Asignar el primer dato con el cluster mas cercano
  • Volvemos a medir las distancias y a asignar los datos a los clusters mas cercanos con los datos restantes.
  • Calculamos la media de cada cluster.
  • Una vez obtenidad las medias de cada cluster, volvemos a determinar los datos mas cercanos a esta posición y los asignamos. Así hasta que ya no exista ningun cambio
  • Por último determimos la calidad de los clusters sumando la varianza de los datos de cada dato.
  • Para tratar de obtener mejores resultados, se vuelven a tomar tres datos de la recta y nuevamente se realizar todo el proceso anterior. Para de esta manera obtener diferentes disposiciones y poder comparar cual tiene mayor calidad según su variación.



    Video de referencia: youtube.com/watch?v=4b5d3muPQmA&t=214s