REVISTA MINERÍA 539 | EDICIÓN AGOSTO 2022

MINERÍA la mejor puerta de acceso al sector minero MINERÍA / AGOSTO 2022 / EDICIÓN 539 46 K-Medias encontrará las configuraciones iniciales que conducen a la variación más pequeña dentro del clúster. Como no se sabe de antemano cuántos clústeres son óptimos, se creará dos gráficos diferentes que ayudarán a decidir el valor de K óptimo: Número de conglomerados frente al total dentro de la suma de cuadrados Primero, se usa la función fviz_nbclust () para crear una gráfica del número de clústeres frente al total dentro de la suma de cuadrados mediante la siguiente línea de código: > fviz_nbclust(Recup_Vs_Tox, pam, method = "wss") Normalmente, cuando se crea este tipo de gráfico buscamos un «codo» donde la suma de cuadrados comienza a «doblarse» o nivelarse. Este suele ser el número óptimo de clústeres. Para este gráfico, parece que hay un poco de codo o «curvatura» en k = 2 o 3 conglomerados. Número de conglomerados frente a la función Silhouette Otra forma de determinar el número óptimo de conglomerados es utilizar esta métrica mediante la siguiente línea de código: fviz_nbclust(Recup_Vs_Tox, pam, method = "silhouette") En la gráfica se puede ver que la estadística es más alta en k = 2 conglomerados, lo que coincide con el método del codo que se aplicó anteriormente. Paso 4: realizar la agrupación en clústeres de K-Medias con Optimal K Por último, se puede realizar la agrupación de K-Medias en el conjunto de datos utilizando el valor óptimo para k de 2 mediante la siguiente línea de código en RStudio: > k2 <- kmeans(Recup_Vs_Tox, centers = 2, nstart = 25) > k2 Se puede visualizar los grupos en un diagrama de dispersión que muestra los dos primeros componentes principales en los ejes usando la siguiente línea de código: fivz_cluster () : > fviz_cluster(k2, data = Recup_Vs_Tox) Para que el algoritmo pueda determinar el número de clúster de una gráfica tradicional, debe normalizar la data con la finalidad de dar el mismo peso a cada variable (Valores X e Y de la Figura 7) y así no sesgar la información. Resultados Inicialmente mediante una gráfica estadística tradicional no se pudo observar que existían dos clústeres y esto se logró con el algoritmo K-Means, lo que permitiría generar un mejor blending desde mina, siendo el caso si se desea maximizar la recuperación.  El número medio del %Tox en el clúster 1 es de 9.28% que corresponde a una recuperación media de cobre de 82.43%.  El número medio del %Tox en el clúster 2 es de 6.9% que corresponde a una recuperación media de cobre de 88.91%. Figura 6. Se asignaron 196 datos al 1er. grupo y 412 datos fueron asignados al 2do.

RkJQdWJsaXNoZXIy MTM0Mzk2