MINERÍA la mejor puerta de acceso al sector minero MINERÍA / AGOSTO 2022 / EDICIÓN 539 42 Distancia cuadrada euclidiana La herramienta más comúnmente utilizada en K-Means es la distancia cuadrada de Euclides. Un ejemplo de esta entre dos puntos x e y en el espacio m-dimensional es: Aquí, j es la dimensión j (o columna de características) de los puntos de muestra x e y. Inercia de los clústeres La inercia del clúster es el nombre dado a la Suma de Errores Cuadrados dentro del contexto del clustering, y se representa de la siguiente manera: Donde μ(j) es el centroide del clúster j, y w(i,j) es 1 si la muestra x(i) está en el clúster j y 0 en caso contrario. K-Means puede ser entendido como un algoritmo que intentará minimizar el factor de inercia del clúster. Objetivo Estimación del número óptimo de clúster “K” para el contenido de óxido (%Tox) en un mineral y su relación con la recuperación en un proceso de flotación de cobre mediante la aplicación del algoritmo K-Means Machine Learning. Desarrollo del algoritmo K-Means Machine Learning Los algoritmos de clustering son considerados de aprendizaje no supervisado y buscan patrones en los datos sin tener una predicción específica como objetivo. En lugar de tener una salida, los datos solo tienen una entrada que serían las múltiples variables que describen los datos. K-Means necesita como dato de entrada el número de grupos en los que se segmenta la población. A partir de este número k de clúster, el algoritmo coloca primero k puntos aleatorios (centroides). Luego asigna a cualquiera de esos puntos todas las muestras con las distancias más pequeñas. A continuación, el punto se desplaza a la media de las muestras más cercanas. Esto generará una nueva asignación de muestras, ya que algunas están ahora más cerca de otro centroide. Este proceso se repite de forma iterativa y los grupos se van ajustando hasta que la asignación no cambia más moviendo los puntos. Este resultado final representa el ajuste que maximiza la distanFuente: CC BY-SA 4.0 creativecommons.org Figura 2. Movimiento de los límites de los clústeres es cada vez menor, llegando a un nivel de convergencia en la iteración 14.
RkJQdWJsaXNoZXIy MTM0Mzk2