X
Logo Minería
login

Inicie sesión aquí

CLASIFICACIÓN DE MINERALES EN TIEMPO REAL MEDIANTE ANÁLISIS DE COLOR Y TEXTURA

Por: David G. Shatwell, Hochschild Mining PLC y Facultad de Ingeniería Eléctrica, Universidad de Ingeniería y Tecnología; Víctor Murray, John A. Paulson School of Engineering and Applied Sciences, Harvard University and Facultad de Ingeniería Eléctrica e Informática, Universidad de Nuevo México, y Augusto Barton, Hochschild Mining PLC. 


Resumen

La clasificación de minerales mediante sensores es una tecnología utilizada para clasificar las rocas mineralizadas de alta ley de las estériles de baja ley, con el fin de reducir los costos de las operaciones. En el pasado se han propuesto muchos algoritmos de clasificación de minerales mediante imágenes a color, pero solo unos pocos validan sus resultados utilizando leyes minerales u optimizan los algoritmos para clasificar las rocas en tiempo real. 

Este artículo presenta un algoritmo de clasificación de minerales basado en el procesamiento de imágenes y el Machine Learning capaz de seleccionar las rocas de una mina aurífera y argentífera en función de su ley. El algoritmo consta de cuatro etapas principales: (1) segmentación y partición de la imagen, (2) extracción de características de color y textura, (3) clasificación de subimágenes por medio de redes neuronales, y (4) un sistema de votación para determinar la clasificación general de la roca. 

El algoritmo se entrenó utilizando imágenes de rocas que un geólogo clasificó manualmente según su contenido mineral y luego se validó utilizando un conjunto diferente de rocas analizadas en un laboratorio para determinar sus leyes de oro y plata. El método propuesto logró un coeficiente de correlación de Matthews de 0.961 puntos, superior al de otros algoritmos de clasificación basados en máquinas de vectores de soporte y redes neuronales convolucionales, y un tiempo de procesamiento inferior a 44 ms, prometedor para aplicaciones de clasificación de minerales en tiempo real.

Introducción

La ley del oro no ha dejado de disminuir a lo largo de los años, ya que la mayoría de los yacimientos de alta ley se explotan actualmente o ya se han agotado[1,2]. Esta tendencia también se ha observado en metales como el cobre[1] y el manganeso[3]. La explotación de yacimientos de baja ley requiere más recursos que los de alta ley para producir la misma cantidad de concentrado, lo que se traduce en un aumento de los costos de operación y menores beneficios[4]. Se están desarrollando nuevas tecnologías mineras para optimizar el tratamiento y hacer más accesible la minería de baja ley para seguir el ritmo de la creciente demanda de metales.

Por lo general, el proceso de extracción aurífera consta de varias etapas que forman una cadena de valor de operaciones, entre las que se incluyen la minería, el chancado, la molienda y la recuperación del oro[5]. La clasificación de minerales mediante sensores es una tecnología de preconcentración que suele aplicarse entre las fases de chancado y molienda para seleccionar las rocas mineralizadas de las estériles. La clasificación tiene como objetivo reducir la cantidad de material que entra en la planta de procesamiento sin disminuir significativamente la recuperación de minerales[6].

Esta clasificación consta de tres etapas principales. En la primera, se utilizan sensores para medir las propiedades físicas de las rocas. Por ejemplo, pueden usarse cámaras a color para producir imágenes, sensores de transmisión de rayos X para medir la densidad atómica, láseres y cámaras de triangulación para estimar la geometría de las rocas o cámaras hiperespectrales de infrarrojo cercano para producir curvas espectrales[7,8]. 

Tras medir las propiedades de las partículas, los datos recogidos por los sensores se envían a una unidad de procesamiento, que utiliza algoritmos de clasificación para determinar si las rocas están mineralizadas. Por último, las rocas se separan físicamente expulsándolas mediante un sistema de toberas de chorro a alta presión en función de si la unidad de tratamiento las clasifica como mineral o roca estéril.

El oro y la plata suelen estar dispersos en concentraciones mínimas dentro de una matriz de otras rocas o minerales, lo que dificulta su detección directa. Sin embargo, la ley de oro y plata de muchos yacimientos está estrechamente relacionada con la presencia de minerales o elementos indirectos, que pueden detectarse utilizando el conjunto adecuado de sensores[9]. 

El problema de este enfoque es que cada mina tiene una mineralogía única que incluso puede variar en distintas zonas de la misma. Dado que los clasificadores comerciales utilizan algoritmos de clasificación estándar, a veces no es posible detectar con gran precisión los minerales o elementos correlacionados con la ley de oro o plata. 

En esos casos, algunas de las rocas mineralizadas se clasifican como estériles y algunas de estas como mineral. Cuando esto ocurre, la ley más alta del mineral enviado a la planta no justifica el valor perdido en el material rechazado por el clasificador, y el uso de la clasificación tradicional de minerales no es económicamente viable.

La clasificación visual de minerales es un problema difícil porque su eficacia depende de varios factores diferentes, como el tamaño de las partículas, la velocidad de alimentación y las características ópticas de los minerales[10]. 

En general, ningún método funciona para todos los tipos de minerales. La diversidad y complejidad de los métodos suelen depender en gran medida del sistema mineral[11]. Sin embargo, en los últimos años, varios trabajos han demostrado que es posible clasificar minerales con una precisión relativamente alta utilizando únicamente imágenes, por ejemplo, de cámaras a color, que son poco costosas y más accesibles de mantener que otros sensores, como los de transmisión de rayos X (XRT), lo que podría permitir una clasificación de bajo costo en el futuro.

Los métodos de clasificación visual pueden agruparse en dos categorías: ingeniería de características y aprendizaje de características. Los métodos de ingeniería de características suelen utilizar distintos algoritmos para extraer características de color y textura de una imagen. En[12,13], los autores propusieron un algoritmo de clasificación de minerales para seleccionar partículas de roca de una planta metalúrgica de ferromanganeso utilizando color, textura de Haralick y redes neuronales. 

De forma similar, en[11], los autores propusieron un nuevo algoritmo de clasificación de minerales utilizando vectores de carga como características de color, wavelets como características de textura y máquinas de vectores de soporte. En[14], los autores proponen dos mejoras sobre el método presentado por[11]. El primero utilizó el algoritmo de mínima redundancia y máxima relevancia (MRMR) para reducir el espacio de características de color y textura, mientras que el segundo usó el algoritmo de segmentación por cuencas y un sistema de votación para decidir la clasificación final de la roca. 

Después, en[15], los autores propusieron otra mejora del método, que consistía en extraer características de textura de los canales RGB (rojo, verde y azul) y HSV (tono, saturación y valor) de las imágenes utilizando filtros de Gabor sin selección de características. 

Los métodos de ingeniería de características también se han utilizado en otras áreas de la minería, como la identificación de trazas de roca usando características extraídas de nubes de puntos 3D[16].

Más recientemente, se han propuesto diferentes métodos de aprendizaje de características basados en redes neuronales convolucionales (CNN) para resolver problemas en minería y otros campos. En[17], los autores exploraron posibles soluciones utilizando modelos de CNN con diferentes profundidades, estructuras y tamaños de conjuntos de datos para la clasificación de minerales de carbón. En[18], los autores utilizaron una CNN para estimar el rango de densidad de partículas de carbón bajo diferentes fuentes de luz.

En otros campos, en[19], los autores propusieron un nuevo tipo de CNN que utiliza la energía de las imágenes producidas por la última capa de convolución de la red para generar características de textura. 

Después, en[20], los autores propusieron un modelo de CNN que combina arquitecturas de CNN tradicionales con análisis multiresolución utilizando ondículas de Haar. Por último, en[21], los autores presentaron una red neuronal convolucional multiescala invariante a la rotación (MRCNN) para clasificar diferentes texturas pulmonares usando imágenes Gabor-LBP (patrones binarios locales) como entradas a una CNN.

Aunque los métodos antes mencionados alcanzaron rendimientos de clasificación relativamente altos para diferentes sistemas minerales, ninguno de ellos se centró en la clasificación de oro y plata. Además, estos métodos solo se centran en clasificar los fragmentos de roca según el tipo de mineral, pero no presentan resultados de clasificación según la ley del mineral ni el tiempo de procesamiento necesario para realizar la selección.

Este artículo presenta un algoritmo de clasificación de minerales utilizado para clasificar rocas de una mina subterránea de los Andes peruanos, propiedad de Hochschild Mining PLC. A diferencia de algunos clasificadores de mineral comerciales, el método propuesto solo utiliza cámaras a color, que son más baratas y fáciles de manejar que otros sensores de clasificación de mineral. 

Las imágenes tomadas por la cámara se utilizan para extraer características de color y textura de la roca mediante algoritmos de procesamiento de imágenes. Luego, las características se usan para entrenar un modelo de clasificación basado en redes neuronales. 

El modelo de clasificación se entrenó con dos conjuntos de datos diferentes: (1) imágenes de rocas secas estáticas que fueron clasificadas en cuatro clases diferentes por un geólogo experto y (2) imágenes de rocas secas estáticas, que fueron analizadas en un laboratorio para determinar sus leyes de oro y plata. Se evaluó el rendimiento de la selección y se optimizó el algoritmo para reducir su tiempo de procesamiento de cara a una futura clasificación de minerales en tiempo real. Por último, se realizaron pruebas adicionales con imágenes de rocas húmedas en movimiento para determinar el rendimiento del algoritmo en un entorno que se asemeja más a una planta de clasificación real.

La estructura de este documento es la siguiente. La sección 2 describe los minerales de la mina seleccionada y el sistema de visión. La sección 3 presenta los métodos de procesamiento digital de imágenes y Machine Learning del sistema propuesto. Por último, la sección 4 presenta el rendimiento del método propuesto y lo compara con otros que utilizan diferentes algoritmos de clasificación.

Sistemas minerales y de visión

La mina seleccionada es una mina subterránea de oro y plata situada en los Andes peruanos, a más de 4,200 m sobre el nivel del mar. Esta se caracteriza por sistemas mineralizados epitermales de baja y alta sulfuración alojados en vetas, brechas y diseminación dentro de rocas volcánicas terciarias. Esta sección presenta las características de los cuatro tipos de minerales más abundantes encontrados en una de las vetas de la mina seleccionada y el sistema utilizado para implementar el algoritmo de clasificación de minerales.

Características minerales

Todos los fragmentos de roca utilizados en este trabajo se extrajeron de una veta, compuesta principalmente por cuarzo rodeado de roca encajonante volcánica. La veta tiene aproximadamente 2 m de ancho y está orientada en un ángulo de 45°. La transición entre la veta principal y la roca encajonante no es abrupta, ya que hay una zona intermedia en la que la roca encajonante contiene vetas de cuarzo y sulfuros más pequeños. 

Las rocas que se encuentran en esta zona intermedia se denominan brechas. La Figura 1 muestra una imagen de la veta seleccionada, en la que pueden verse claramente la brecha, la veta de cuarzo y la roca encajonante.

Las rocas extraídas de la veta principal (VE) están compuestas de cuarzo (SiO2) y calcita (CaCO3). Aunque el cuarzo no es un mineral económicamente valioso, su presencia está positivamente correlacionada con altas leyes de oro y plata[22]. Esto se debe principalmente a la diseminación de sulfuros[23], como acantita y argentita (Ag2), electrum (una aleación de oro y plata) y oro libre, que se depositan en la veta por fluidos hidrotermales. En la mina seleccionada, los sulfuros suelen estar dispersos en pequeñas partículas y solo son visibles como una ligera coloración en la roca.

Los fragmentos de roca de brecha (BX) consisten principalmente en vetas de cuarzo y calcita encapsuladas en una matriz de andesita. Las rocas clasificadas como brechas suelen tener una alta ley por la misma razón que las rocas de veta, es decir, porque los fluidos hidrotermales depositan partículas de oro y plata en el mineral. En las rocas BX también pueden encontrarse sulfuros como acantita, galena, esfalerita, pirrotita y pirita.

La roca encajonante se compone principalmente de andesita, un tipo de roca volcánica[24]. En la mina seleccionada, dos tipos de rocas tienen poco o ningún valor económico: la andesita pura (AN) y la andesita alterada (AA). La diferencia entre los dos tipos de roca estéril es el color y la alteración: AN tiene un color verde y gris oscuro y ninguna alteración significativa, mientras que AA tiene un color gris violáceo debido a la presencia de óxidos y arcilla. 

Otros minerales que se encuentran en la roca encajonante son pirita y finas vetas de cuarzo, que pueden contener partículas de oro o plata en raros casos. La Figura 2 muestra imágenes de los cuatro tipos de minerales descritos anteriormente.

Dado que el oro y la plata no pueden detectarse visualmente, para clasificarlos como mineral o roca estéril se utilizan correlaciones entre las distintas clases de minerales y sus respectivas leyes equivalentes de plata. La Tabla 1 muestra las estadísticas de ley para las cuatro clases minerales diferentes adquiridas en dos campañas de ensayo diferentes realizadas de enero a marzo de 2020 y enero de 2022. 

Todas las rocas se extrajeron de la misma veta en distintos momentos. Las rocas de 2020 fueron seleccionadas manualmente por un geólogo y son en su mayoría muestras ideales de cada clase mineral. En cambio, las rocas de 2022 se seleccionaron al azar y son más heterogéneas, ya que una pequeña parte de ellas contenía varias clases de minerales. Observamos que las rocas de 2022 tenían una ley media más baja y una desviación estándar más alta, lo que podría explicarse por el hecho de que la sección de la veta que se minó en enero de 2022 tenía leyes más bajas en general, y también porque las rocas seleccionadas en la primera campaña de ensayos eran en su mayoría muestras ideales de las clases minerales. 

Esta diferencia puede apreciarse también en el porcentaje de rocas por encima de la ley de corte en ambas campañas, que también se muestra en la Tabla 1 y gráficamente en la Figura 3. En 2020, todas las rocas de mineral estaban por encima de la ley de corte, pero en 2022 solo el 66% de ellas seguían esta tendencia. A pesar de la diferencia, en ambas campañas, las rocas de brecha (BX) tuvieron la ley media más alta, seguidas de las rocas de veta (VE), la andesita (AN) y la andesita alterada (AA).

Sistema de visión

Un sistema de visión típico se compone del hardware utilizado para capturar y procesar las imágenes, y del software, que consta de las imágenes y los algoritmos utilizados para analizarlas. Esta sección describe los componentes del hardware y las imágenes capturadas y procesadas por este.

Hardware

El hardware utilizado para probar los algoritmos de clasificación de minerales consta de cuatro partes principales: una cámara a color, una estructura para sujetar la cámara, una caja de luz profesional para iluminar las rocas de manera uniforme y una unidad de procesamiento que contiene los algoritmos. 

La cámara utilizada en el sistema de visión es una Sony DSC-HX90V. Se trata de una cámara de fotografía de consumo que puede capturar imágenes de alta resolución utilizando un sensor Exmor RTM CMOS de 1/2,3" (7,82 mm)[25]. Posteriormente, también realizamos pruebas adicionales con una cámara semi-industrial en condiciones más realistas. Los ajustes utilizados para capturar las imágenes son una distancia focal de 50 mm, un tiempo de exposición de 1/40 s y una velocidad ISO de 200. 

La estructura utilizada para sostener la cámara se fabricó con tablones de MDF (tablero de fibra de densidad media) cortados con una fresadora CNC (control numérico por ordenador), tubos de aluminio y un cabezal de trípode. La estructura se utilizó para ajustar manualmente el ángulo de la cámara y la distancia entre esta y las rocas. 

En este trabajo, todas las imágenes se tomaron a una distancia de 25 cm y un ángulo de 70°. Además, una tela negra cubría la estructura para evitar que la luz exterior alterara las mediciones. La caja de luz utilizada para iluminar las rocas con luz uniforme fue una gti PDV-2e/M3[26], que incluye cuatro bombillas incandescentes y tres fluorescentes de tipo D65 con una temperatura de color de 5,000 K. Para este sistema de visión, solo se utilizaron tres bombillas fluorescentes. 

Por último, para desplegar los algoritmos de análisis y clasificación, el sistema de visión utilizó una MacBook Pro de 2014 con un procesador Intel Core i7 de 4 núcleos que ejecutaba el sistema operativo macOS Catalina. La cámara, la estructura y la caja de luz se muestran en la Figura 4.

Conjunto de datos de imágenes

Las imágenes digitales son matrices numéricas bidimensionales o tridimensionales que contienen información espacial sobre una escena y se capturan mediante un dispositivo de imagen, como una cámara a color. Las imágenes digitales a color suelen representarse mediante un conjunto de tres matrices, donde cada una es una imagen monocromática que capta la intensidad de la luz en los canales rojo, verde o azul, centrados en las longitudes de onda de 665, 550 y 470 nm, respectivamente. Matemáticamente, las imágenes a color suelen representarse mediante l(m, n, c), donde m y n representan las coordenadas espaciales verticales y horizontales, y c representa el canal de color o espectral.

La cámara Sony utilizada en este sistema de visión captura imágenes con una resolución espacial de 3,672 x 4,896 píxeles y utiliza el espacio de color RGB estándar (sRGB). La información de los píxeles se codifica en cadenas de tres bytes, donde cada byte representa la intensidad de uno de los canales de color. 

Además, las imágenes se guardan en formato JPEG (Joint Photographic Experts Group) con la opción de calidad fina de la cámara, que utiliza menos compresión al almacenar las imágenes[25]. Aunque las imágenes se tomaron con la cámara de consumo Sony DSC-HX90V, en pruebas posteriores utilizamos una cámara semi-industrial Basler con una resolución de 5 megapíxeles.

Por ello, para poder trabajar con una resolución similar a la de la cámara industrial, las imágenes se diezmaron por un factor de dos utilizando un filtro de paso bajo para evitar el aliasing. Este procedimiento generó nuevas imágenes con una resolución espacial de 1,836 x 2,448 píxeles. Dado que las imágenes representaban una superficie de 151 mm x 201 mm, el uso de la nueva resolución permitió a los algoritmos analizar estructuras minerales de hasta 82 µm, lo que equivale a una densidad de píxeles de 12.2 px/mm. Todas las imágenes contienen una sola roca, como los ejemplos de la Figura 2.

Para diseñar y probar los algoritmos de clasificación de minerales, se construyeron tres conjuntos de datos de imágenes de rocas. Inicialmente, Hochschild Mining PLC proporcionó 196 muestras de roca extraídas de una de las principales vetas de la mina seleccionada en 2020. Se seleccionó esta veta porque (1) en los últimos años ha proporcionado casi el 17% del mineral extraído, y (2) el mineral es altamente representativo de toda la mina. 

Las 196 rocas fueron seleccionadas manualmente por un geólogo y contenían características "ideales" de cada clase mineral. Las rocas de este conjunto de datos son en su mayoría homogéneas, lo que significa que una región seleccionada al azar en la roca es aproximadamente equivalente a cualquier otra región. Estas se dividieron en dos grupos: el primero con 156 muestras (79.6%) y el segundo con 40 muestras (20.4%), lo que sigue la típica división del conjunto de datos 80%/20% que se hace para validar algoritmos de Machine Learning. 

El segundo grupo, con 40 muestras, contiene principalmente rocas de cuarzo y andesita, con solo unas pocas muestras de las clases de brecha y andesita alterada. Inicialmente, el plan era incluir más rocas de las dos últimas clases, sin embargo, hacerlo no fue posible debido a las limitaciones presupuestarias del momento. 

Se capturaron de una a cinco imágenes de cada roca, ya que las imágenes solo pueden captar una cara de la roca, y las rocas pueden tener múltiples caras con diferentes propiedades visuales. En total, se capturaron 465 imágenes para el primer grupo y 155 para el segundo, como se muestra en la Tabla 2. 

Posteriormente, en 2022, Hochschild Mining PLC proporcionó otras 435 muestras de la misma veta para validar aún más el algoritmo utilizando imágenes de rocas en movimiento en el banco de pruebas recién creado. Las muestras correspondientes al tercer grupo se fotografiaron con una cámara semi-industrial, lo que produjo 867 nuevas imágenes. 

Tras formar el conjunto de datos de imagen, las muestras de los grupos dos y tres se enviaron a un laboratorio geoquímico para realizar ensayos y estimar sus leyes de oro y plata. Los métodos utilizados por el laboratorio para estimar las leyes fueron los ensayos al fuego y el agua regia, que son los procesos de análisis estándar de la industria. El intervalo de detección de los ensayos fue de 0.005-10 ppm para el oro y de 10-1000 ppm para la plata. Una vez estimadas las leyes individuales de cada roca del segundo y tercer grupo, se calculó la ley de plata equivalente (GAgEq) de la siguiente manera:

GAgEq = GAg + ƒGAu (1)

donde GAg es la ley de plata; GAu la ley de oro; y ƒ un factor de conversión que se basa en la relación entre el precio del oro y el de la plata. Este documento utiliza ƒ = 81 para calcular la ley de plata equivalente.

Cabe mencionar que, aunque los ensayos se realizan en toda la roca, las imágenes captadas con las cámaras a color solo contienen información sobre la superficie. Esto significa que puede haber rocas que parezcan estériles en la superficie pero que en realidad estén mineralizadas y viceversa. Sin embargo, debido al pequeño tamaño de las rocas (malla entre ¾" -5"), suponemos que la superficie de la roca contiene aproximadamente las mismas propiedades físicas que el interior, lo que también hacen la mayoría de los sensores y algoritmos de las clasificadoras comerciales.

Procesamiento de imágenes y algoritmos de Machine Learning

Esta sección describe los principales métodos propuestos para el algoritmo de clasificación de minerales. En primer lugar, se presenta el problema de visión artificial para contextualizar los algoritmos desde la perspectiva del procesamiento de imágenes y, a continuación, se describen los algoritmos de análisis y clasificación. El método consta de cuatro etapas principales: (1) segmentación y partición de las imágenes de entrada, (2) extracción de características, (3) clasificación de las subimágenes y (4) algoritmo de votación para decidir la clasificación general de las rocas.

Desafío de la visión artificial

En la mayoría de los casos, la clasificación de minerales no es un problema trivial porque los algoritmos que se necesitan dependen en gran medida de los tipos de minerales que se encuentran en la mina específica[11]. En la última década se han propuesto varias arquitecturas de redes neuronales convolucionales (CNN) para resolver diversos problemas de clasificación de imágenes. 

Este nuevo tipo de algoritmos puede aprender automáticamente las representaciones de características a partir de las imágenes de entrada[27], eliminando así la necesidad de utilizar una etapa manual de extracción de características. Sin embargo, las CNN suelen requerir grandes conjuntos de datos, que son costosos y difíciles de crear en la minería. Esto es especialmente cierto en el caso de los algoritmos de clasificación de minerales, en los que los resultados de la clasificación deben validarse realizando ensayos químicos a las rocas en el conjunto de prueba y, a menudo, también en el conjunto de entrenamiento.

En la mina seleccionada, el desarrollo de algoritmos de clasificación de minerales presenta desafíos adicionales. Aunque las rocas de veta (VE) y andesita (AN) pueden clasificarse fácilmente utilizando características de color, las rocas de brecha (BX) y andesita alterada (AA) tienen colores muy similares. La única diferencia son los tonos claros de morado que se encuentran en AA en comparación con BX. 

El otro reto relacionado con BX y AA es su gran variabilidad. La cantidad de cuarzo presente en BX y la cantidad de arcilla blanca presente en AA pueden cambiar drásticamente en cada roca. Como el cuarzo tiene un color similar al de la arcilla, esto crea más problemas en su clasificación. Clasificar correctamente estos dos tipos de minerales es crucial porque las rocas BX suelen tener una ley alta, mientras que las rocas AA suelen tener una ley baja.

Finalmente, el último desafío relacionado con el desarrollo de algoritmos de clasificación es el tiempo de procesamiento. Las clasificadoras comerciales pueden utilizar velocidades de cinta de hasta 3 m/s para procesar el material extraído de las minas. Considerando una superficie de imagen de 151 mm x 201 mm, que es el área de la escena captada por la cámara en la fase de prueba de concepto, el tiempo total de procesamiento de una sola imagen debería ser inferior a 70 ms, lo que equivale a una frecuencia de imagen de 14.3 fps (fotogramas por segundo). Este requisito limita en gran medida la cantidad de características de color y textura que pueden utilizarse para la clasificación, ya que cada característica adicional que se calcula aumenta el tiempo de procesamiento del sistema. Por esta razón, es conveniente utilizar funciones que requieran un bajo número de operaciones para computar o que sean altamente paralelizables.

Para resolver el problema de la visión artificial se requiere una cadena de procesamiento compuesta por varias etapas (Figura 5). En la primera fase, cada imagen se segmenta y se divide en varias subimágenes. El uso de subimágenes permite al algoritmo identificar todos los posibles minerales presentes en la roca y utilizar distintas estrategias para decidir si deben enviarse a la planta de tratamiento o al vertedero. 

La segunda etapa consiste en extraer las características de color y textura de cada subimagen mediante algoritmos estadísticos y de procesamiento de imágenes. En la tercera, se utilizan una o varias redes neuronales en paralelo para asignar una clase mineral a cada subimagen, creando mapas de distribución de minerales. Por último, la cuarta fase utiliza un algoritmo de votación para asignar una única clase a toda la imagen contando el número de subimágenes que pertenecen a cada clase mineral.

Segmentación y subimágenes

Esta sección presenta los métodos utilizados en la primera etapa del algoritmo, que contiene los bloques de segmentación y partición de la imagen, mostrados en la Figura 5. La entrada de esta etapa es la imagen a color l(m.n.c), y su salida es un conjunto de Nv subimágenes de la roca. En este caso, Nv representa el número de subimágenes válidas que no contienen parte del fondo, como se explicará más adelante. La Figura 6 muestra un diagrama de bloques detallado que representa todas las operaciones realizadas en esta fase.

Muchas de las rocas de un entorno minero real contienen más de un tipo de mineral. Los casos más comunes son las rocas andesíticas con pequeñas vetas de cuarzo, que pueden tener una ley baja o media en función del número de vetas en la roca. Identificar la distribución de los distintos minerales en las rocas es esencial para clasificarlas correctamente como mineral o estéril. Por este motivo, el algoritmo divide la imagen de entrada en 1,064 subimágenes con dimensiones de 64 x 64 píxeles (5.25 mm x 5.25 mm), denotadas por Sp(m,n,c), donde p =1, ..., 1,064. Dado que cada subimagen Sp(m,n,c) contiene información sobre el color y la textura locales de la imagen, clasificar subimágenes en lugar de imágenes enteras tiene dos ventajas principales: (1) cada subimagen tiene una mayor probabilidad de contener un único tipo de mineral debido a su pequeño tamaño, y (2) la clasificación a nivel de subimagen genera un número mucho mayor de muestras de entrenamiento, lo que hace que el algoritmo de clasificación sea más robusto y preciso.

Para evitar clasificar subimágenes que forman parte del fondo y no contienen ninguna parte de la roca, el algoritmo utiliza un método de segmentación básico pero eficaz. Este consta de dos pasos: en primer lugar, produce una imagen en escala de grises sumando los tres canales de color de la imagen a color l(m,n,c) y, a continuación, umbraliza la imagen para obtener una máscara binaria, denotada por M(m,n). Matemáticamente, este método se define por:

(2)

donde  representa la suma de los canales rojo, verde y azul de la imagen; C = 3 el número total de canales de color, y TM el umbral de decisión, determinado experimentalmente como TM = 100, utilizando histogramas de intensidad de imagen. Como la imagen y la máscara tienen el mismo número de píxeles, a cada subimagen le corresponde una submáscara SM(m,n) de 64 x 64 píxeles. Por lo tanto, para decidir si una subimagen debe procesarse, el algoritmo cuenta el número de píxeles de la submáscara iguales a 1, que representan los que contienen una sección de la roca. 

Si al menos el 90% de los píxeles de la submáscara es igual a 1, la subimagen se procesa en las etapas posteriores del algoritmo (la Figura 7 es un ejemplo del proceso). Como se ha mencionado anteriormente, el resultado de esta etapa es un conjunto de subimágenes válidas Nv Sp (m,n,c) que contienen secciones de la roca pero no del fondo.

Extracción de características

Esta sección presenta los métodos utilizados en la segunda etapa del algoritmo, que contiene los bloques de extracción de características de color y textura, mostrados en la Figura 5. La entrada a esta etapa es el conjunto de Nv subimágenes de color válidas, y la salida es un conjunto de Nv vectores de características, cada uno con 24 características de color y 12 de textura (36 en total). La Figura 8 muestra un diagrama de bloques detallado que representa los algoritmos utilizados en esta fase.

Una vez identificadas todas las subimágenes válidas, la siguiente etapa del algoritmo consiste en extraer un vector de características de cada una de ellas. Como se menciona al inicio, varios trabajos, como[11,14,15], han demostrado que las características de color y textura pueden utilizarse para clasificar distintos tipos de minerales. 

Las características de color utilizadas con éxito en el pasado incluyen estadísticas de color y análisis multidireccional de componentes principales (MPCA), mientras que las de textura incluyen características de Haralick, wavelets, filtros de Gabor, o modulación de amplitud y frecuencia (AM-FM)[28]. 

Este artículo presenta una etapa de extracción de características que utiliza estadísticas de color, análisis de componentes principales y ondículas. También se evaluaron otros métodos, como las características de Haralick y los patrones binarios locales (LBP), aunque los resultados no se presentan debido a su elevado tiempo de cálculo.

Extracción de características de color

La etapa de extracción de características de color comienza normalizando cada subimagen Sp(m,n,c) a 0.1 y almacenando los valores resultantes en la nueva subimagen SRGB(m,n,c). A continuación, la subimagen se transforma del espacio de color RGB al espacio de color HSV, produciendo la nueva subimagen SHSV(m,n,c). El espacio de color HSV describe los colores de forma similar a como los interpretan los seres humanos. El tono es una característica que describe los colores puros, la saturación se refiere a lo diluido que está el color con el blanco y el valor está relacionado con el brillo del color. 

Las ecuaciones utilizadas para convertir un color del espacio RGB al HSV son ampliamente conocidas y pueden encontrarse en[29]. En las primeras fases de desarrollo del algoritmo, comprobamos que el uso de ambos conjuntos de canales producía mejores resultados de clasificación en el conjunto de entrenamiento que el uso exclusivo del espacio de color RGB. 

La principal ventaja de utilizar el espacio de color HSV, además del espacio de color RGB, es que separa el color de la intensidad, proporcionando una nueva forma de realizar la extracción de características sobre los canales. Otra ventaja es que proporciona más características de color para los algoritmos de clasificación en etapas posteriores, y realizar la transformación es poco costoso desde el punto de vista informático.

Las subimágenes RGB y HSV se componen de tres canales de color cada una, que se representan mediante las subimágenes en escala de grises SR(m,n), SG(m,n), SB(m,n), SH(m,n), SS(m,n) y SV(m,n). Las 12 primeras características de color calculadas para las subimágenes son los vectores de medias (µRGB, µHSV) y varianzas (σ2RGB, σ2HSV) de los píxeles en cada espacio de color. Estos dos parámetros estadísticos son características de color útiles en este problema de clasificación de minerales porque su cálculo ya es necesario en el algoritmo de análisis de componentes principales (ACP), por lo que no requieren costos computacionales adicionales.

El siguiente conjunto de características de color son los componentes principales de las subimágenes RGB y HSV, que contienen información sobre las direcciones de la varianza más significativa de ambos espacios de color. A diferencia de parámetros estadísticos como la media y la varianza, los componentes principales tienen en cuenta la correlación entre los canales de color, lo que los convierte en buenos descriptores del color y el contraste generales de la imagen[30]. 

El uso de los componentes principales y de la media y la varianza de cada espacio de color permite al algoritmo representar completamente la información de color de las subimágenes. El PCA puede calcularse utilizando varios métodos, como la descomposición en valores singulares (SVD)[31], la descomposición en valores propios de la matriz de covarianza[32] y el algoritmo de mínimos cuadrados alternos[33]. El método propuesto en este trabajo utiliza la descomposición en valores propios de la matriz de covarianza para calcular los componentes principales porque es el algoritmo más rápido de los tres mencionados anteriormente.

El primer paso para calcular los componentes principales de una subimagen SCS(m, n, c) con dimensiones 64 x 64 x 3 es remodelarla en una matriz XPCA con dimensiones 1,064 x 3, donde el subíndice CS puede utilizarse para representar los espacios de color RGB o HSV. 

El objetivo principal del PCA es encontrar un nuevo conjunto de variables no correlacionadas que maximicen la varianza de los datos minimizando la pérdida de información[34]. Estas nuevas variables, denominadas componentes principales (PC), se representan mediante vectores ortonormales, cuyas direcciones se estiman calculando los vectores propios de la matriz de covarianzas del conjunto de datos.

Matemáticamente, un punto de datos que pertenece a la matriz XPCA puede representarse mediante un vector columna x = (x1, x2,. . ., xn)T de tamaño n x 1, donde cada valor x1, x2,. . ., xn representa una variable aleatoria y T es el operador de transposición. Para hallar los componentes principales de un conjunto de datos, el primer paso consiste en calcular la matriz de covarianzas dada por:

Cx = E{(x - mx) (x - mx)T} (3)

donde mx es un vector compuesto por el valor medio de cada variable aleatoria en x. El siguiente paso es encontrar los valores propios λ1, λ2,..., λn y los vectores propios e1, e2,..., en de la matriz de covarianza Cx. En el PCA, los valores propios son proporcionales a la contribución de varianza de su respectivo vector propio. Así, el vector propio con el valor propio más alto se considera el primer componente principal, seguido del segundo vector propio con el valor propio más alto, y así sucesivamente. 

A continuación, los vectores propios pueden concatenarse horizontalmente para formar una nueva matriz-A ϵ Rnxn, que se denomina la transformada de Hotelling[35]. Esta transformada asigna a cada punto de datos, representado por x, un nuevo vector y, cuyos componentes no están correlacionados.

Dado que los vectores propios con valores más bajos representan una pequeña parte de la varianza total de los datos, es posible descartarlos para reconstruir XPCA con una pérdida mínima de información. En este caso, la matriz Ak, que se compone de los k vectores propios con valores propios más altos, se utiliza para reconstruir el conjunto de datos de modo que la aproximación de cada punto de datos x viene dada por:

(4)

Aplicando el algoritmo de PCA a las subimágenes RGB y HSV se obtienen, en total, seis componentes principales PCi,RGB y PCi,HSV, donde i = 1, 2, 3, y cada componente es un vector de dimensiones 3 x 1. La etapa de extracción de características de color propuesta en este trabajo solo utiliza los componentes principales primero y segundo porque representan, en promedio, el 99.93% de la varianza en las subimágenes RGB y el 99.54% de la varianza en las subimágenes HSV. 

Estos dos valores se hallaron experimentalmente analizando la varianza acumulada de los componentes principales de cada subimagen del conjunto de datos. Dado que los cuatro componentes principales seleccionados son vectores tridimensionales, el algoritmo produce 12 características de color adicionales en total. A continuación, las 12 características del PCA se concatenan con las 12 características derivadas de las estadísticas de canal para formar un vector de características de color para cada subimagen con dimensiones 1 x 24.

Extracción de características de textura

La textura visual de una imagen se define por las variaciones locales de intensidad generadas por la rugosidad o irregularidad de la superficie de un objeto[36]. La descomposición wavelet es un método utilizado habitualmente para analizar texturas de imágenes que descompone una imagen en escala de grises en un conjunto de imágenes de menor resolución que contienen información de frecuencia a diferentes escalas[35]. 

El análisis wavelet descompone una imagen utilizando bancos de filtros de paso alto y paso bajo, que deben cumplir unas propiedades específicas para que la imagen pueda reconstruirse a la perfección[37]. A continuación, las imágenes filtradas se deciman por un factor 2, reduciendo su resolución a la mitad y eliminando la información redundante. Los filtros utilizados para descomponer la imagen están estrechamente relacionados con una familia específica de wavelets, elegida en función de la aplicación concreta.

El análisis de una imagen en escala de grises mediante wavelets produce cuatro nuevas matrices. La primera, denominada imagen de aproximación, contiene las frecuencias más bajas de la imagen original. La segunda, tercera y cuarta matrices, denominadas imágenes detalladas horizontal, vertical y diagonal, contienen información de alta frecuencia sobre la imagen original en sus respectivas direcciones. Dado que la imagen de aproximación es solo una versión de menor resolución de la imagen original, el análisis wavelet puede aplicarse recursivamente a la imagen de aproximación un número arbitrario de veces para producir un análisis multirresolución[38].

Los filtros utilizados por la etapa de extracción de características de textura propuesta están asociados a la ondícula de Haar de dos coeficientes. Aunque se pueden utilizar muchas ondículas para descomponer una imagen, la ondícula de Haar es la más sencilla de implementar y la menos exigente computacionalmente[39], lo cual es deseable en un sistema de clasificación en tiempo real. 

Los filtros asociados a este tipo de wavelet son

 donde hϕ(n) es el filtro de paso bajo y hψ(n) es el filtro de paso alto. La etapa de extracción de características propuesta utiliza estos filtros para generar los tres primeros niveles de análisis wavelet, que incluyen 4 aproximaciones y 8 imágenes detalladas. El análisis de textura Wavelet (WTA) es un método para extraer información de textura de imágenes aproximadas y detalladas. El método más común para extraer la información de textura consiste en calcular la energía (E) de cada matriz[40], definida por:

(5)

donde SGS (m, n) es la subimagen en escala de grises, m y n son las coordenadas verticales y horizontales de cada píxel; M el número de filas de la subimagen, y N el número de columnas de la subimagen. El WTA se basa en el supuesto de que los vectores de características de texturas similares forman conglomerados en el espacio de características, que son diferentes de otros conglomerados que pertenecen a texturas diferentes. Por este motivo, el algoritmo propuesto utiliza la energía de las 12 matrices resultantes como vectores de características de textura para caracterizar la textura de cada subimagen.

Tras las etapas de extracción de características de color y textura, las Nv subimágenes válidas se transforman en vectores de características xp con 36 elementos, donde los 12 primeros proceden de las estadísticas de color, los 12 siguientes de los coeficientes vectoriales obtenidos mediante PCA y los 12 últimos del análisis de textura wavelet. Estos vectores son una representación de baja dimensión de las subimágenes, lo que reduce el espacio dimensional de valores de intensidad de 12,228 píxeles (4,096 para cada canal de color) a solo 36 números decimales reales, lo que permite utilizar algoritmos de clasificación sencillos en etapas posteriores.

Modo de clasificación

Esta sección presenta los métodos utilizados en la tercera etapa del algoritmo, que contiene los modelos de Machine Learning utilizados para clasificar las subimágenes como se muestra en la Figura 5. La entrada a esta fase es el conjunto de Nv vectores de características, cada uno de los cuales representa el color y la textura de una subimagen, y la salida es un conjunto de mapas de probabilidad. 

En función del conjunto de datos utilizado para entrenar el algoritmo, los mapas de probabilidad representan la posibilidad de que las subimágenes pertenezcan a cada una de las cuatro clases de minerales o de que las subimágenes estén mineralizadas. La Figura 9 muestra un diagrama de bloques detallado que representa los algoritmos utilizados en las etapas de clasificación y votación.

Tras extraer las 36 características de color y textura de cada subimagen, la siguiente etapa utiliza modelos de clasificación para encontrar sus respectivas clases. Los algoritmos propuestos en este trabajo usan únicamente redes neuronales artificiales (RNA) en la etapa de clasificación, aunque también se probaron otros métodos.

Las RNA son una clase de algoritmos de regresión y clasificación que pueden utilizarse para aproximar funciones desconocidas a partir de una colección de puntos de datos de entrada y salida. Una de las principales ventajas de las redes neuronales frente a otros algoritmos de regresión y clasificación es que no requieren un conocimiento previo de la distribución de los datos, lo que resulta especialmente útil cuando se trabaja con datos con un gran número de variables[41].

Las redes neuronales están compuestas por unidades básicas, llamadas neuronas artificiales o unidades neuronales, que son funciones no lineales que toman como entrada un vector de características x ϵ Rd, un vector de pesos w ϵ Rd, y un sesgo b ϵ Rd. La salida de la unidad neuronal viene dada por:

(6)

donde g(.) es una función no lineal conocida como función de activación. Para entrenar una red neuronal a partir de un conjunto de puntos de datos de entrada y salida, hay que encontrar los pesos que minimicen la función de costo de la red neuronal, lo que suele hacerse con el algoritmo de descenso de gradiente[42]. Este algoritmo es un método de optimización numérica que calcula el gradiente de la función de costo relativa a los pesos de la red neuronal y da pequeños pasos en la dirección más empinada hasta encontrar el punto óptimo. 

El método de retropropagación utiliza la regla de la cadena para descomponer el gradiente en varias derivadas más simples basadas en funciones conocidas. Este proceso es ampliamente conocido y se explica con detalle en otras fuentes[35].

El algoritmo de clasificación presentado en este trabajo consiste en un conjunto de redes neuronales que operan en paralelo, donde cada una está especializada en clasificar un mineral específico. Comprobamos que el uso de redes neuronales paralelas de una contra todas conseguía mejores resultados de clasificación que el uso de una sola red neuronal multiclase. Cuando el algoritmo se entrena con los vectores de características del grupo de rocas 1 y las etiquetas creadas por el geólogo, utiliza cuatro redes neuronales porque hay cuatro clases principales de minerales. Por el contrario, cuando el algoritmo se entrena con los vectores de características del grupo de rocas 2 y las etiquetas son creadas binarizando la ley de la roca con la de corte, solo utiliza una red neuronal que predice si cada subimagen es mineral o estéril, ya que el problema se reduce a una clasificación binaria. 

Todas las redes neuronales utilizadas en este trabajo tienen una capa de entrada, dos capas ocultas y una capa de salida. El uso de dos capas ocultas o más permite al algoritmo encontrar límites de decisión arbitrariamente complejos, a diferencia del uso de una capa oculta, que limita el algoritmo a límites convexos[35]. Cada capa oculta consta de 200 unidades neuronales con la función de activación de la unidad lineal rectificada (ReLU). La capa de salida de cada red neuronal solo tiene una neurona y utiliza la función de activación logística, que asigna la salida de las redes a una probabilidad entre 0,1.

Cada red neuronal de la etapa de clasificación tiene la misma entrada, que es una matriz XCT de dimensiones Nv × 36 que contiene las 24 características de color y las 12 de textura de todas las Nv subimágenes válidas de la roca. Antes de ser clasificadas por las redes neuronales, el algoritmo normaliza todas las columnas de la matriz XCT calculando su puntuación z, que tiene media cero y una escala similar para todas las columnas. Normalizar la matriz de características puede reducir el número de iteraciones necesarias para que el peso de la red converja[43].

Una vez normalizada la matriz de entrada, es procesada por las redes neuronales en paralelo, y cada una de ellas produce un vector de probabilidades ŷm de dimensiones Nv × 1. Cada elemento de este vector es un número entre 0,1, que representa la probabilidad de que cada subimagen válida pertenezca a la clase mineral m. Cuando el modelo se entrena con los vectores de características del grupo de rocas 1 y las etiquetas minerales identificadas por el geólogo, las redes neuronales generan cuatro vectores de probabilidad: ŷ VE, ŷ BX, ŷ AN, and ŷ AA. 

En cambio, cuando el modelo se entrena con imágenes del grupo de rocas 2 y las etiquetas son obtenidas binarizando la ley de la roca con la de corte, solo produce un vector de probabilidad ŷ mineral. Mediante el seguimiento de la ubicación espacial de las subimágenes válidas, el algoritmo reorganiza los vectores en mapas de probabilidad, denotados por MVE, MBX, MAN, MAA y More. La Figura 10 muestra los cuatro mapas de probabilidad de una roca de brecha (BX) generados por el modelo cuando se entrena con las etiquetas elaboradas por el geólogo (Figura 10 b-e) y el mapa de probabilidad generado al entrenar el modelo con las etiquetas obtenidas mediante ensayos químicos (Figura 10 f).

Sistema de votación

Tras generar los mapas de probabilidad, la etapa de clasificación utiliza un sistema de votación que analiza la probabilidad de cada subimagen para decidir si una roca está mineralizada o no y, en consecuencia, si debe enviarse a la planta de tratamiento o al vertedero. Los datos de entrada de esta fase son los mapas de probabilidad, y el dato de salida es un único valor de clasificación, que toma un valor de 1 si el algoritmo decide que la roca es mineralizada, o de 0 si decide que la roca es estéril. El sistema de votación corresponde a la cuarta etapa del algoritmo propuesto, representada gráficamente en la Figura 5.

El sistema de votación consta de dos etapas principales. En la primera, el algoritmo analiza cada subimagen y compara la puntuación dada por cada mapa de probabilidad. El mapa con la puntuación más alta para una subimagen dada determina su clase mineral cuando el algoritmo se entrena utilizando las etiquetas del geólogo. En cambio, cuando el algoritmo se entrena con las etiquetas obtenidas mediante la realización de ensayos químicos, determina si la subimagen es mineralizada o no comparando la probabilidad predicha con un umbral binario, cuyo valor se determina experimentalmente en la etapa de entrenamiento. 

Tras asignar una clase a cada subimagen, el algoritmo produce un mapa de distribución de minerales, representado por MMD. Este proceso se presenta gráficamente en la Figura 11.

La segunda etapa del sistema de votación cuenta el número de subimágenes que pertenecen a cada clase de mineral, la que tiene la mayor cantidad de subimágenes determina la clase global de la roca. Cuando se entrena con las etiquetas de los geólogos, si la roca en su conjunto se clasifica como veta (VE) o brecha (BX), el algoritmo asume que la roca está mineralizada y debe enviarse a la planta de procesamiento, y si la roca es andesita pura (AN) o andesita alterada (AA), debe enviarse al vertedero. Este proceso de decisión se basa en el hecho de que, por término medio, VE y BX tienen una ley por encima de la de corte.

Resultados y discusión

El algoritmo propuesto se entrenó y probó primero utilizando las imágenes de rocas estáticas, que corresponden a los grupos de rocas uno y dos.

Esta primera prueba se utilizó como ensayo de concepto para validar el algoritmo en un entorno ideal, con muestras de roca seca muy representativas de cada clase mineral y fotografiada con una imagen de alta resolución. A continuación, tras validar el algoritmo en este entorno ideal, se realizaron más pruebas con imágenes de rocas en movimiento correspondientes al grupo tres, que se fotografiaron en un nuevo banco de pruebas con una cámara industrial. Aunque se realizan en un laboratorio, estas pruebas son más representativas de las condiciones que cabría esperar en una clasificadora real, ya que las rocas se fotografían moviéndose a una velocidad constante mientras siguen estando húmedas. 

Entrenamiento de los modelos de clasificación

Para entrenar y probar el modelo de clasificación en la fase de prueba de concepto, el conjunto de datos de imágenes se dividió en un conjunto de entrenamiento y un conjunto de prueba. Como se explicó, el geólogo clasificó las 196 rocas de los grupos de rocas 1 y 2 en cuatro clases minerales, mientras que las 40 rocas del grupo 2 también se analizaron en un laboratorio geoquímico para obtener sus leyes de oro y plata. Debido al pequeño tamaño de las rocas (malla entre ¾"-5"), el algoritmo supone que toda la roca es homogénea y asigna la misma etiqueta a todas las subimágenes de la misma roca. Esto se aplica tanto a las etiquetas de los geólogos como a las leyes obtenidas en los ensayos. 

Todas las imágenes obtenidas del grupo de rocas 1 se utilizaron para entrenar el algoritmo de clasificación utilizando las etiquetas de los geólogos, mientras que solo el 80% de las imágenes del grupo 2 se usaron para entrenar el algoritmo con las etiquetas obtenidas mediante ensayos químicos. El 20% restante de imágenes del grupo 2 se utilizó para probar el algoritmo entrenado con ambos conjuntos de etiquetas. 

Cabe mencionar que, debido a la menor cantidad de rocas en el grupo 2 en comparación con el 1, las etapas de entrenamiento y prueba se realizaron en 100 iteraciones, eligiendo aleatoriamente las rocas de entrenamiento y prueba del grupo 2. La Figura 12 explica claramente este proceso mostrando una representación gráfica de cómo se dividieron los grupos de rocas en conjuntos de entrenamiento y de prueba.

Tras elegir las rocas del conjunto de entrenamiento, sus imágenes se procesaron mediante los métodos descritos para crear matrices de características y vectores de etiquetas. Para duplicar el número de subimágenes en el conjunto de entrenamiento, también se utilizó el aumento de datos mediante un desplazamiento al dividir las imágenes en subimágenes. Este método crea efectivamente una nueva subimagen a partir de cada cuatro subimágenes adyacentes, como se ilustra en la Figura 13.

Como había un número diferente de imágenes para cada clase de mineral, las matrices de características y los vectores de etiquetas estaban desequilibrados. Entre los problemas de clasificación, tener un conjunto de datos desequilibrado puede dar lugar a un rendimiento pobre para los algoritmos estándar[44], como las redes neuronales. Así pues, para evitar este problema, las matrices de características y los vectores de etiquetas se remuestrearon para que coincidieran con el tamaño de la clase objetivo, de modo que los algoritmos pudieran entrenarse con el mismo número de puntos de datos positivos y negativos. Esto significa que la mitad de las filas de la matriz de características y del vector de etiquetas contenían datos del mineral objetivo, mientras que la otra mitad contenía datos del resto de minerales, como se muestra en la Tabla 3.

Después de equilibrar las matrices de características y los vectores de etiquetas, se dividieron en un conjunto de entrenamiento utilizado para entrenar los modelos y un conjunto de validación utilizado para ajustar los parámetros del modelo y evaluar el rendimiento a nivel de subimagen. 

Las redes neuronales se entrenaron mediante el algoritmo Adam (Adaptive Moment Estimation). Este algoritmo es un método de optimización estocástica basado en el algoritmo de descenso de gradiente que encuentra los pesos óptimos de la red neuronal combinando las principales ventajas de los algoritmos Ada-Grad y RMSProp[45]. 

Además, el algoritmo propuesto utiliza el método de regularización dropout, en el que las neuronas de las capas ocultas tienen una probabilidad fija de ser eliminadas temporalmente en una iteración del proceso de entrenamiento. Este método hace que la red neuronal dependa menos de una neurona en particular, lo que significa que los pesos de la red se mantienen pequeños[46]. Todas las redes neuronales de los modelos propuestos se entrenaron durante 200 pruebas, registrando el valor de la función de costo en cada iteración para verificar la convergencia.

Pruebas de los modelos de clasificación

El rendimiento de clasificación del modelo se evaluó primero con subimágenes de prueba de las matrices de características y después con imágenes del grupo de rocas 2. La primera prueba, que evalúa la precisión del algoritmo en la clasificación de subimágenes, es un buen indicador de qué minerales son más difíciles de clasificar y proporciona información sobre el rendimiento de las redes neuronales individuales. En cambio, la segunda evalúa el rendimiento del algoritmo a la hora de clasificar imágenes completas como minerales o estériles, que es la métrica más importante a la hora de comparar algoritmos de clasificación de minerales.

Pruebas con subimágenes

El rendimiento del modelo en la clasificación de subimágenes se evaluó utilizando el conjunto de validación de las matrices de características. La métrica utilizada para evaluar el rendimiento de las redes neuronales es el coeficiente de correlación de Matthews (MCC), también conocido como coeficiente phi, que viene dado por:

(7)

donde PP = TP + FP, P = TP + FN, N = TN + FP, PN = TN + FN, TP es el número de verdaderos positivos; FP los falsos positivos; FN los falsos negativos y TN los verdaderos negativos. El MCC es una métrica de clasificación utilizada para evaluar clasificadores binarios que produce una puntuación alta solo si la predicción obtuvo buenos resultados en todas las cuatro categorías de la matriz (verdaderos positivos, falsos negativos, verdaderos negativos y falsos positivos), proporcionalmente tanto al tamaño de los elementos positivos como al de los elementos negativos en el conjunto de datos[47]. 

El MCC es un número decimal real entre +1 y -1, donde un valor de +1 significa que el modelo clasificó todas las muestras correctamente, 0 significa que no encontró ninguna relación entre entradas y salidas y está funcionando como un clasificador aleatorio, y un valor de -1 significa que el modelo clasificó todas las muestras incorrectamente. El rendimiento de clasificación de las redes neuronales también se evaluó utilizando métricas más comunes, como la tasa de verdaderos positivos (TPR), la tasa de verdaderos negativos (TNR), el valor predictivo positivo (PPV) y el valor predictivo negativo (NPV).

Los resultados de las pruebas de subimágenes se presentan en la Tabla 4. Los resultados VE, BX, AN y AA corresponden a la prueba única realizada para evaluar el rendimiento del modelo cuando se entrena con las etiquetas del geólogo. Por el contrario, los resultados de clasificación asociados al clasificador de mineral frente a estériles se obtuvieron cuando el modelo se entrenó con las leyes de plata equivalentes y se presenta como la media obtenida en 100 iteraciones. 

El modelo propuesto alcanzó un excelente rendimiento de clasificación, cuantificado por el MCC, para los clasificadores VE (0,938) y AN (0,902) y un buen rendimiento para los clasificadores BX (0,723) y AA (0,779). Las rocas VE y AN son más fáciles de clasificar porque tienen características de color muy diferentes del resto de minerales. VE es casi totalmente blanca debido a su alto contenido en cuarzo, mientras que AN tiene un color entre verde oscuro y negro debido a su alto contenido en andesita. 

Los clasificadores de minerales BX y AA tienen menor precisión que los demás porque son visualmente muy parecidos. Ambos minerales son grises con secciones blancas. En el caso del BX, las secciones blancas están compuestas principalmente de cuarzo, mientras que las del mineral AA contienen arcilla. 

Si se observan las subimágenes presentadas en la Figura 14, puede verse claramente que la mayoría de las subimágenes de la clase BX que se clasificaron erróneamente son muy similares a las subimágenes de la clase AA, con algunas excepciones que se asemejan a los minerales VE y AN. Lo mismo ocurre con las subimágenes mal clasificadas de la clase AA, que se parecen a las de la clase BX. El clasificador de mineral vs estéril también obtuvo un buen rendimiento de clasificación (0.778), que fue 0.055 puntos superior al clasificador BX pero 0.001 puntos inferior al clasificador AA.

Pruebas con imágenes completas

Tras entrenar las redes neuronales y comprobar el rendimiento de la clasificación utilizando subimágenes, se evaluó el modelo con ambos conjuntos de etiquetas utilizando las imágenes completas. Las pruebas se realizaron sobre 100 iteraciones, utilizando 31 imágenes de rocas elegidas al azar del grupo 2 no utilizadas para el entrenamiento de los modelos. A continuación, las imágenes de prueba se procesaron utilizando los métodos de segmentación, partición y extracción de características, produciendo un conjunto de vectores de características para cada imagen. 

Después, las redes neuronales clasificaron los vectores de características para obtener un único valor de predicción para cada imagen. Se consideró que una imagen estaba correctamente clasificada si la predicción coincidía con la ley de la roca. Por ejemplo, si la predicción de uno de los modelos era "mineral" y la roca asociada a la imagen tenía una ley de plata equivalente superior a la de corte, se consideraba que la clasificación era correcta. Lo mismo se aplicaba si la predicción del modelo era "estéril" y la ley estaba por debajo de la ley de corte. 

Es importante señalar que se utilizaron las mismas imágenes de prueba para evaluar ambos modelos en cada iteración con el fin de comparar los resultados de clasificación. Al igual que en las pruebas con subimágenes, el rendimiento de la clasificación con imágenes completas se cuantifica mediante el MCC.

La Tabla 5 muestra los resultados de las pruebas de imágenes completas. El modelo entrenado con las etiquetas de los geólogos (NN-G) logró un MCC superior al modelo entrenado con las etiquetas obtenidas mediante ensayos químicos (NN-A) en cada iteración de la prueba, cuya media fue 0.032 puntos superior. Los modelos se comparan mediante la tasa de verdaderos positivos (TPR), la tasa de verdaderos negativos (TNR), el valor predictivo positivo (PPV), el valor predictivo negativo (NPV) y el coeficiente de correlación de Mathews (MCC). Métricas como TPR, TNR, PPV y NPV también fueron superiores para el modelo entrenado con las etiquetas del geólogo, lo que demuestra que el modelo es el método por excelencia para la clasificación de minerales para este sistema mineral en particular.

Tras realizar las pruebas de imagen completas, se analizaron las imágenes mal clasificadas por el modelo entrenado con las etiquetas del geólogo para determinar la causa de los errores. Solo 3 de 155 imágenes del grupo 2 se clasificaron erróneamente. Las dos primeras imágenes de la Figura 15 proceden de la misma roca, que el geólogo y el algoritmo probablemente clasificaron como andesita alterada (AA) por sus tonos morados. Sin embargo, tras analizar la roca mediante ensayos químicos, se descubrió que su ley de plata equivalente era superior a la ley de corte, lo que significa que el geólogo y el algoritmo deberían haberla clasificado como mineral. 

Este ejemplo en particular es un valor atípico en la categoría de andesita alterada, y se infiere que la mayor parte del contenido de oro y plata se aloja en pequeñas vetas de cuarzo en la roca. La tercera imagen mal clasificada es una roca clasificada correctamente por el geólogo como andesita alterada, pero mal clasificada por el algoritmo como brecha (BX). En este caso, el algoritmo clasificó correctamente como estéril la otra imagen de la misma roca.

Comparación con otros algoritmos de clasificación

En trabajos anteriores se han utilizado otros métodos, además de las redes neuronales, en los algoritmos de clasificación de minerales. Uno de los más comunes son las máquinas de vectores de soporte (SVM), que son algoritmos de clasificación y regresión cuyo objetivo es encontrar la frontera de decisión que maximice la separación entre dos clases, en el caso de la clasificación, o encontrar la curva que mejor se ajuste a la tendencia de un conjunto de datos, en el caso de la regresión. Por ejemplo[11,14,15], utilizaron SVM para clasificar con éxito rocas de sistemas minerales de níquel.

Otro método que se ha utilizado ampliamente para resolver muchos desafíos relacionados con la clasificación de imágenes son las redes neuronales convolucionales (CNN). Las CNN son una clase de redes neuronales especializadas en el procesamiento de datos dispuestos en una cuadrícula, como las imágenes digitales. Estos clasificadores comprenden al menos una capa convolucional que contiene bancos de filtros cuyos coeficientes se aprenden en una etapa supervisada[48]. 

Los modelos CNN aprenden a identificar estructuras arbitrariamente complejas sin necesidad de diseñar un sistema previo de extracción de características[48,49]. Debido a su buen potencial de clasificación y a su facilidad de uso, las CNN se han convertido en uno de los algoritmos dominantes en varias áreas de la visión por computador. Por ejemplo, en aplicaciones de clasificación de minerales, las CNN fueron utilizadas con éxito por[17,50] para seleccionar diferentes clases de minerales de carbón.

El algoritmo propuesto en este trabajo también se comparó con algoritmos basados en SVM y CNN para confirmar que nuestro enfoque es la mejor opción para el problema de clasificación de minerales. El algoritmo basado en SVM utilizó el mismo método de extracción de características que el modelo propuesto, pero en lugar de redes neuronales, utilizó una SVM de regresión con un núcleo gaussiano para predecir la clase de las subimágenes. 

El algoritmo basado en CNN, a diferencia del de SVM, no utilizó las características de color y textura de la roca, sino que empleó las subimágenes en bruto como entradas. Utilizamos una versión modificada del modelo VGG-19 [51], que es una CNN de uso común para muchos problemas de clasificación. Esta red se compone de 16 capas de convolución, 5 capas max pool, 3 capas totalmente conectadas y una capa SoftMax. Las modificaciones son las siguientes: 

(1) el tamaño de entrada de la imagen se redujo de 224 × 224 × 3 a 64 × 64 × 3, ya que las subimágenes tienen estas últimas dimensiones, (2) el tamaño de la capa totalmente conectada se redujo de 4,096 a 200 neuronas, porque ese era el número de neuronas utilizado por el modelo propuesto y solo queremos comparar la columna vertebral de extracción de características, y (3) la capa de salida se redujo de 1,000 a 4 neuronas porque solo queremos clasificar cuatro clases de minerales. 

Los resultados de los dos nuevos algoritmos, presentados en la Tabla 5, muestran que el modelo que utiliza redes neuronales e ingeniería de características logró un mejor rendimiento de clasificación, lo que evidencia que el algoritmo propuesto es la mejor alternativa para este problema específico.

Tiempo de procesamiento

El método propuesto se optimizó para clasificar rocas en tiempo real. El tiempo de procesamiento del algoritmo se midió desde el momento en que la imagen se cargaba de la memoria hasta que el algoritmo terminaba de contar el número de subimágenes de cada clase. No se tuvo en cuenta el tiempo que tarda el ordenador en cargar la imagen desde la memoria porque, en una implementación en tiempo real, la cámara transfiere los datos directamente al búfer de memoria[52]. 

La Figura 16 muestra la distribución de los tiempos de procesamiento de las imágenes del conjunto de prueba, con una media de 19.2 ms y una desviación estándar de 7.9 ms. El tiempo de procesamiento máximo fue de 44 ms y pertenecía a una roca de clase AA, la roca más grande del conjunto de prueba y de todo el conjunto de datos. Esto indica que el tiempo de procesamiento está dentro del límite propuesto por la empresa minera de 70 ms. Hay un excedente de 25 ms, que otra red neuronal podría utilizar para clasificar otras clases de minerales si fuera necesario.

Por otro lado, la Figura 17 muestra la correlación entre el número de subimágenes válidas de una imagen y el tiempo que se tarda en clasificarlas. Esta correlación es lineal y tiene un coeficiente de determinación R2 = 0.97, lo que indica una fuerte correlación entre el número de subimágenes y el tiempo de procesamiento. Para calcular el número máximo de subimágenes que el algoritmo puede clasificar, utilizamos la ecuación lineal hallada por el método de regresión lineal, que viene dada por:

t=0.0543n+9.7002 (8)

donde t es el tiempo de procesamiento en milisegundos y n el número de subimágenes. Resolviendo la Ec. (8) utilizando el máximo número posible de subimágenes en una imagen dada (n = 1,064) se obtiene un tiempo de procesamiento de solo 67.5 ms, inferior al límite de 70 ms necesario para la clasificación de minerales en tiempo real. Así, el algoritmo puede clasificar una imagen entera de 1,836 × 2,448 píxeles utilizando cuatro redes neuronales. El tiempo máximo de procesamiento se calculó utilizando una velocidad teórica de la cinta transportadora de 3 m/s. Sin embargo, esta velocidad podría cambiar en función del plan de extracción de la empresa.

Cabe mencionar que las estrategias de votación presentadas en este documento podrían optimizarse aún más para mejorar la precisión de la clasificación. Por ejemplo, el sistema de votación podría aceptar automáticamente el material cuando detecte una pequeña cantidad de un mineral específico, en lugar de la estrategia actual, en la que la roca solo se acepta si el mineral predominante es una mena. Como otro ejemplo, el sistema de votación podría mejorarse aún más utilizando un segundo umbral que determine la cantidad mínima de subimágenes clasificadas como mineral para clasificar la roca en su conjunto como mineral. Además, ambos sistemas pueden ajustarse para aceptar o rechazar más material, con el fin de maximizar los beneficios según un modelo financiero.

Prueba de rendimiento con rocas en movimiento

Tras realizar las pruebas con rocas estáticas para elegir el mejor algoritmo, se realizaron ensayos adicionales con rocas en movimiento en un banco de pruebas, que consta de una cinta transportadora y una estructura de MDF con la cámara y el sistema de iluminación, como se muestra en la Figura 18. La cámara es una Basler daA2500-14uc[53], situada perpendicularmente a una distancia de 500 mm de la cinta transportadora. Tiene una resolución de 1,342 × 1,960 píxeles y envía datos de imagen sin procesar al PC a través de un cable USB. 

Utilizando esta resolución y la distancia a la cinta transportadora, las imágenes tenían una densidad de píxeles de 6.25 px/mm, lo que representaba una escena con unas dimensiones de 215 mm × 317 mm. Las imágenes se iluminaron con 2 m de tiras de LED de 16.2 W/m, con una temperatura de color de 4,000 K. 

La cinta transportadora funcionaba a una velocidad de 1 m/s, que es solo un tercio de las clasificadoras comerciales. Sin embargo, estas utilizan cámaras de escaneado lineal y potentes barras LED, que son capaces de reducir el tiempo de exposición del sensor para obtener imágenes más nítidas.

Utilizando el banco de pruebas, adquirimos 867 imágenes de 435 rocas (54.4 kg) ya que, en la mayoría de los casos, se fotografiaron desde dos lados diferentes. Todas las rocas se extrajeron de la misma veta que las pruebas con rocas estáticas, pero aproximadamente dos años más tarde. 

Además, las rocas se lavaron antes de realizar las pruebas para eliminar el polvo y el barro de su superficie y luego se fotografiaron cuando aún estaban húmedas. Tras crear la base de datos de imágenes, las 460 rocas se secaron y se analizaron en un laboratorio geoquímico mediante ensayos al agua regia y al fuego para estimar sus leyes de oro y plata. Las estadísticas de ley de este grupo de rocas se muestran en la Tabla 1 y corresponden a la campaña de ensayos realizada en enero de 2022.

Se realizaron ensayos de clasificación utilizando el algoritmo seleccionado en las pruebas estáticas, que consiste en extraer características de color y textura de las subimágenes y clasificarlas después con redes neuronales entrenadas con etiquetas de geólogos. La única modificación que se introdujo en el algoritmo fue que las subimágenes tenían una longitud lateral de 32 píxeles en lugar de 64, debido a la menor resolución de la cámara y a la menor densidad de píxeles. 

El algoritmo se entrenó y probó en 100 iteraciones, eligiendo las imágenes de cada conjunto al azar. Sin embargo, a diferencia de las pruebas con rocas estáticas, el conjunto de pruebas con rocas en movimiento se formó eligiendo proporciones de minerales muy parecidas a las que se encuentran en la mina seleccionada. En concreto, las proporciones del conjunto de pruebas son 39% VE, 39% BX, 19% AN y 3% AA. Aunque estas proporciones pueden variar en diferentes vetas y periodos de tiempo, los valores representan medias y fueron validados por geólogos de la empresa minera.

Tras realizar las 100 iteraciones, comprobamos que el promedio de MCC de las pruebas con rocas en movimiento era de 0.901, inferior al promedio de MCC de 0.961 obtenido utilizando rocas estáticas. La disminución del rendimiento podría explicarse por uno o varios de los siguientes factores: leyes más bajas, muestras de roca no ideales, superficies húmedas, una menor resolución de la cámara y el desenfoque producido por el movimiento de las rocas. El desenfoque de movimiento es perjudicial para el algoritmo porque distorsiona la textura de la roca. 

Aunque los tres primeros factores no pueden controlarse, ya que dependen exclusivamente de las características del mineral, los dos últimos podrían controlarse en futuros trabajos utilizando mejores sensores. En particular, usar una cámara de barrido lineal y una fuente de luz más brillante es clave para reducir el tiempo de exposición del sensor y, por tanto, el desenfoque de movimiento.

El algoritmo también se evaluó utilizando dos métricas adicionales usadas habitualmente en la clasificación de minerales: la recuperación de minerales y la extracción de masa (también llamada rendimiento). La segunda es el porcentaje de masa que el algoritmo clasifica como "mineral", mientras que la recuperación es el porcentaje de la masa de oro y plata que puede recuperarse de las rocas clasificadas como "mineral". Estas dos métricas no se calcularon para las pruebas estáticas en roca porque necesitan proporciones minerales reales para ser interpretadas correctamente. 

En las pruebas de roca en movimiento, la recuperación y la extracción de masa se calcularon en cada una de las 100 iteraciones, como se muestra en la Figura 19. Comprobamos que la recuperación media era del 95.6%, mientras que la extracción de masa media era del 77.4%. Esto significa que si el algoritmo de clasificación se aplicara en una mina real, procesando solo el 77.4% del mineral se podría recuperar potencialmente el 95.6% del oro y la plata. 

Por último, calculamos la ley media ponderada de las rocas en los flujos de entrada y salida en cada iteración y descubrimos que el algoritmo propuesto aumenta la ley de plata equivalente de 151 a 186 g/t, lo que equivale a una mejora de la ley del 23.6%. Todas estas métricas podrían utilizarse en el futuro para estimar el beneficio económico potencial de aplicar el algoritmo propuesto en un entorno minero real.

Conclusiones

Este artículo presenta un novedoso algoritmo de clasificación de minerales capaz de clasificar partículas de roca en tiempo real mediante análisis de color y textura. El algoritmo se entrenó con dos conjuntos de datos diferentes. El primero estaba formado por rocas que un geólogo etiquetó manualmente según su contenido mineral, mientras que el segundo incluía rocas analizadas en un laboratorio geoquímico para determinar su ley. El algoritmo se probó con imágenes de rocas que contienen oro y plata extraídos de una mina subterránea de los Andes peruanos. El problema de la clasificación de minerales era especialmente difícil debido a las similitudes de color y textura entre las rocas de alta y baja ley. Los principales hallazgos son:

1) El mayor rendimiento se obtuvo al entrenar el algoritmo con etiquetas de clases minerales identificadas por un geólogo, con un MCC medio de 0.961 puntos. En cambio, cuando el algoritmo se entrena directamente utilizando las leyes minerales como etiquetas, su rendimiento es significativamente más bajo, con un MCC medio de 0.929 puntos.

2) El algoritmo que utiliza análisis de color y textura en la etapa de extracción de características y redes neuronales en la etapa de clasificación supera a otros algoritmos entrenados con las mismas imágenes. En concreto, el MCC del método propuesto es 0.052 puntos superior al que utiliza SVM en lugar de redes neuronales y 0.013 puntos superior al que utiliza una columna vertebral VGG-19 para la extracción de características.

3) El algoritmo es capaz de clasificar partículas de roca cribadas con una malla de ¾"-5" con un tiempo de procesamiento medio y máximo de 19.2 ms (52.1 fps) y 44 ms (22.7 fps), respectivamente.

4) Las pruebas del algoritmo con 54.4 kg adicionales de partículas de roca húmeda no ideal que se movían a una velocidad de 1 m/s en una cinta transportadora, con una cámara USB industrial de menor resolución y con proporciones de mineral reales produjeron un MCC de 0.901 puntos, que siguen siendo resultados muy deseables para la clasificación de minerales. Este rendimiento se traduce en una recuperación de oro y plata del 95.6% (o una mejora de la ley del 23.6%) y una extracción de masa del 77.4%.

Los resultados de nuestro algoritmo indican que podría aplicarse en una planta piloto para realizar la clasificación de minerales en tiempo real. Además, en el futuro, el método propuesto se combinará con el análisis hiperespectral mediante aprendizaje multimodal para mejorar su rendimiento de clasificación.

Referencias

[1] Priester M, Ericsson M, Dolega P, Löf O. Mineral grades: An important indicator for environmental impact of mineral exploitation. Miner Econ 2019;32 (1):49–73.

[2] Cho K, Kim H, Myung E, Purev O, Choi N, Park C. Recovery of gold from the refractory gold concentrate using microwave assisted leaching. Metals 2020;10(5):571.

[3] Elliott R, Barati M. A review of the beneficiation of low-grade manganese ores by magnetic separation. Can Metall Q 2020;59(1):1–16.

[4] Ulrich S, Trench A, Hagemann S. Grade-cost relationships within Australian underground gold mines—A 2014–2017 empirical study and potential value implications. Resour Policy 2019;61:29–48.

[5] La Brooy SR, Linge HG, Walker GS. Review of gold extraction from ores. Miner Eng 1994;7(10):1213–41.

[6] Lessard J, de Bakker J, McHugh L. Development of ore sorting and its impact on mineral processing economics. Miner Eng 2014;65:88–97.

[7] Lessard J, Sweetser W, Bartram K, Figueroa J, McHugh L. Bridging the gap: Understanding the economic impact of ore sorting on a mineral processing circuit. Miner Eng 2016;91:92–9.

[8] Robben C, Wotruba H. Sensor-based ore sorting technology in mining—Past, present and future. Minerals 2019;9(9):523.

[9] Simmons SF, White NC, John DA. Geological characteristics of epithermal precious and base metal deposits. Society of Economic Geologists (100th; anniversaryvol.); 2005.

[10] Gülcan E, Gülsoy ÖY. Performance evaluation of optical sorting in mineral processing—A case study with quartz, magnesite, hematite, lignite, copper and gold ores. Int J Miner Process 2017;169:129–41.

[11] Tessier J, Duchesne C, Bartolacci G. A machine vision approach to on-line estimation of run-of-mine ore composition on conveyor belts. Miner Eng 2007;20(12):1129–44.

[12] Singh V, Rao SM. Application of image processing and radial basis neural network techniques for ore sorting and ore classification. Miner Eng 2005;18 (15):1412–20.

[13] McCoy JT, Auret L. Machine learning applications in minerals processing: A review. Miner Eng 2019;132:95–109.

[14] Pérez CA, Estévez PA, Vera PA, Castillo LE, Aravena CM, Schulz DA, Medina LE. Ore grade estimation by feature selection and voting using boundary detection in digital image analysis. Int J Miner Process 2011;101(1–4):28–36.

[15] Pérez CA, Saravia JA, Navarro CF, Schulz DA, Aravena CM, Galdames FJ. Rock lithological classification using multi-scale Gabor features from sub-images, and voting with rock contour information. Int J Miner Process 2015;144:56–64.

[16] Chen JY, Huang HW, Cohn AG, Zhang DM, Zhou ML. Machine learning-based classification of rock discontinuity trace: SMOTE oversampling integrated with GBT ensemble learning. Int J Min Sci Technol 2022;32(2):309–22.

[17] Liu Y, Zhang ZL. Liu X, Wang L, Xia XH. Ore image classification based on small deep learning model: Evaluation and optimization of model depth, model structure and data size. Miner Eng 2021;172:107020.

[18] Bai FY, Fan MQ, Yang HL, Dong LP. Fast recognition using convolutional neural network for the coal particle density range based on images captured under multiple light sources. Int J Min Sci Technol 2021;31(6):1053–61.

[19] Andrearczyk V, Whelan PF. Using filter banks in convolutional neural networks for texture classification. Pattern Recognit Lett 2016;84:63–9.

[20] Fujieda S, Takayama K, Hachisuka T. Wavelet convolutional neural networks for texture classification. 2017:arXiv: 1707.07394.

[21] Wang QC, Zheng YJ, Yang GP, Jin WD, Chen XJ, Yin YL. Multiscale rotation-invariant convolutional neural networks for lung texture classification. IEEE J Biomed Health Inform 2018;22(1):184–95.

[22] Corbett G. Epithermal gold for explorationists. AIG Journal 2002;67:1–8.

[23] Sillitoe RH. Styles of high-sulphidation gold, silver and copper mineralisation in porphyry and epithermal environments. In: Proceedings of the Australasian Institute of Mining and Metallurgy. Parkville, Vic.: Australasian Institute of Mining and Metallurgy; 2000. p. 19–34.

[24] Gibson HL, Watkinson DH, Comba CDA. Silicification; hydrothermal alteration in an Archean geothermal system within the Amulet Rhyolite Formation, Noranda. Quebec Econ Geol 1983;78(5):954–71.

[25] Sony, Digital Still Camera-Instruction Manual-DSC-HX90V/DSC-HX90/DSC-HX80/DSC-WX500 (2015). URL.

[26] GTI Graphic Technology, Inc., PDV-2e/M Multi-Source Portable Desktop Viewers (Dec. 2017). URL.

[27] Rawat W, Wang ZH. Deep convolutional neural networks for image classification: A comprehensive review. Neural Comput 2017;29(9):2352–449.

[28] Loizou CP, Murray V, Pattichis MS, Pantziaris M, Nicolaides AN, Pattichis CS. Despeckle filtering for multiscale amplitude-modulation frequency-modulation (AM-FM) texture analysis of ultrasound images of the intimamedia complex. Int J Biomed Imaging 2014;2014:1–13.

[29] Ibraheem NA, Hasan M, Khan R, Mishra PK. Understanding color models: a review. ARPN J Sci Technol 2012;2(3):265–75.

[30] Yu HL, MacGregor JF. Multivariate image analysis and regression for prediction of coating content and distribution in the production of snack foods. Chemom Intell Lab Syst 2003;67(2):125–44.

[31] Edward JJ. A User’s Guide to Principal Components, Vol. 587. John Wiley & Sons; 2005.

[32] Jolliffe I. Principal Component Analysis. Encyclopedia of Statistics in Behavioral Science. 2005.

[33] Ilin A, Raiko T. Practical approaches to principal component analysis in the presence of missing values. J Mach Learn Res 2010;11:1957–2000.

[34] Jolliffe IT, Cadima J. Principal component analysis: A review and recent developments. Philos Trans Ser A Math Phys Eng Sci 2016;374 (2065):20150202.

[35] Gonzalez RC, Woods RE. Digital Image Processing. (2nd Edition). Pearson; 2017.

[36] Davies ER. Introduction to texture Analysis. In: Handbook of Texture Analysis. Imperial College Press; 2008. p.1-32.

[37] Strang G. Wavelets and dilation equations: A brief introduction. SIAM Rev 1989;31(4):614–27.

[38] Moulin P. Multiscale image decomposition and wavelets. In: The essential guide to image processing. Academic Press; 2009.

[39] Sun ZH, Miller R, Bebis G, Dimeo D. A real-time pre-crash vehicle detection system. In: Proceddings of the sixth IEEE workshop on applications of computer vision. Orlando: IEEE; 2003.

[40] Laine A, Fan J. Texture classification by wavelet packet signatures. IEEE Trans Pattern Anal Mach Intell 1993;15(11):1186–91.

[41] Bishop CM. Neural networks. In: In: Pattern recognition and machine learning. Springer; 2006. p. 225–90.

[42] Murphy KP. Machine learning: A probabilistic perspective. Cambridge, M Ass: MIT Press; 2012.

[43] LeCun Y, Bottou L, Orr GB, Müller KR. Efficient BackProp. Neural Networks: Tricks of the Trade. Berlin, Heidelberg: Springer, 2012:9–48.

[44] Zhang J, Mani I. KNN approach to unbalanced data distributions: A case study involving information extraction. Proc ICML’2003 Work Learn From Imbalanced Datasets 2003: pp. 1–7.

[45] Kingma DP, Ba J. Adam: A method for stochastic optimization. 2014:arXiv: 1412.6980.

[46] Srivastava N, Hinton G, Krizhevsky A, Sutskever I, Salakhutdinov R. Dropout: A simple way to prevent neural networks from overfitting. J Mach Learn Res 2014;15(1):1929–58.

[47] Chicco D, Jurman G. The advantages of the Matthews correlation coefficient (MCC) over F1 score and accuracy in binary classification evaluation. BMC Genomics 2020;21(1):6.

[48] Rosebrock A. Deep Learning for Computer Vision with Python (1st Ed., Vol.1). Starter Bundle, PyImageSearch, 2017.

[49] Yamashita R, Nishio M, Do RKG, Togashi K. Convolutional neural networks: An overview and application in radiology. Insights Imaging 2018;9(4):611–29.

[50] Liu Y, Zhang ZL, Liu X, Wang L, Xia XH. Deep learning-based image classification for online multi-coal and multi-class sorting. Comput Geosci 2021;157:104922.

[51] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition. 2014:arXiv: 1409.1556.

[52] Patterson DA, Hennessy JL. Computer Organization and Design (ARM Edition): The Hardware-Software Interface. Morgan Kaufmann; 2016.

[53] Basler AG. Basler product documentation: daa2500-14uc; 2022.

Artículos relacionados

Con apoyo de Las Bambas inauguran puente que conecta Cusco y Apurímac

Seguir leyendo

PERUMIN 37 anuncia programas y actividades que marcarán la ruta hacia la próxima convención minera

Seguir leyendo

El país requiere mayor desarrollo de la industria minera sostenible y la detención de actividades ilícitas

Seguir leyendo
X

Ingrese sus datos aquí

X

Recuperar Contraseña

X

Recuperar Contraseña

Si tiene problemas para recuperar su contraseña contáctese con el Área de Servicio al Asociado al teléfono 313-4160 anexo 218 o al correo asociados@iimp.org.pe

X

Ha ocurrido un error al iniciar sesión

Si tiene problemas para recuperar su contraseña contáctese con el Área de Servicio al Asociado al teléfono 313-4160 anexo 218 o al correo asociados@iimp.org.pe

X

Ingrese sus datos y nos pondremos en
contacto para poder completar su compra

X

Ingrese sus datos y nos pondremos en
contacto para poder completar su compra