MINERÍA la mejor puerta de acceso al sector minero MINERÍA / MAYO 2023 / EDICIÓN 548 40 datos de entrada y salida, hay que encontrar los pesos que minimicen la función de costo de la red neuronal, lo que suele hacerse con el algoritmo de descenso de gradiente[42]. Este algoritmo es un método de optimización numérica que calcula el gradiente de la función de costo relativa a los pesos de la red neuronal y da pequeños pasos en la dirección más empinada hasta encontrar el punto óptimo. El método de retropropagación utiliza la regla de la cadena para descomponer el gradiente en varias derivadas más simples basadas en funciones conocidas. Este proceso es ampliamente conocido y se explica con detalle en otras fuentes[35]. El algoritmo de clasificación presentado en este trabajo consiste en un conjunto de redes neuronales que operan en paralelo, donde cada una está especializada en clasificar un mineral específico. Comprobamos que el uso de redes neuronales paralelas de una contra todas conseguía mejores resultados de clasificación que el uso de una sola red neuronal multiclase. Cuando el algoritmo se entrena con los vectores de características del grupo de rocas 1 y las etiquetas creadas por el geólogo, utiliza cuatro redes neuronales porque hay cuatro clases principales de minerales. Por el contrario, cuando el algoritmo se entrena con los vectores de características del grupo de rocas 2 y las etiquetas son creadas binarizando la ley de la roca con la de corte, solo utiliza una red neuronal que predice si cada subimagen es mineral o estéril, ya que el problema se reduce a una clasificación binaria. Todas las redes neuronales utilizadas en este trabajo tienen una capa de entrada, dos capas ocultas y una capa de salida. El uso de dos capas ocultas o más permite al algoritmo encontrar límites de decisión arbitrariamente complejos, a diferencia del uso de una capa oculta, que limita el algoritmo a límites convexos[35]. Cada capa oculta consta de 200 unidades neuronales con la función de activación de la unidad lineal rectificada (ReLU). La capa de salida de cada red neuronal solo tiene una neurona y utiliza la función de activación logística, que asigna la salida de las redes a una probabilidad entre 0,1. Cada red neuronal de la etapa de clasificación tiene la misma entrada, que es una matriz XCT de dimensiones Nv × 36 que contiene las 24 características de color y las 12 de textura de todas las Nv subimágenes válidas de la roca. Antes de ser clasificadas por las redes neuronales, el algoritmo normaliza todas las columnas de la matriz XCT calculando su puntuación z, que tiene media cero y una escala similar para todas las columnas. Normalizar la matriz de características puede reducir el número de iteraciones necesarias para que el peso de la red converja[43]. Una vez normalizada la matriz de entrada, es procesada por las redes neuronales en paralelo, y cada una de ellas produce un vector de probabilidades ŷm de dimensiones Nv × 1. Cada elemento de este vector es un número entre 0,1, que representa la probabilidad de que cada subimagen válida pertenezca a la clase mineral m. Cuando el modelo se entrena con los vectores de características del grupo de rocas 1 y las etiquetas minerales identificadas por el geólogo, las redes neuronales generan cuatro vectores de probabilidad: ŷ VE, ŷ BX, ŷ AN, and ŷ AA. En cambio, cuando el modelo se entrena con imágenes del grupo de rocas 2 y las etiquetas son obtenidas binarizando la ley de la roca con la de corte, solo produce un vector de probabilidad ŷ mineral. Mediante el seguimiento de la ubicación espacial de las subimágenes válidas, el algoritmo reorganiza los vectores en mapas de probabilidad, denotados por MVE, MBX, MAN, MAA y More. La Figura 10 muestra los cuatro mapas de probabilidad de una roca de brecha (BX) generados por el modelo cuando se entrena con las etiquetas elaboradas por el geólogo (Figura 10 b-e) y el mapa de probabilidad generado al entrenar el modelo con las etiquetas obtenidas mediante ensayos químicos (Figura 10 f).
RkJQdWJsaXNoZXIy MTM0Mzk2