REVISTA MINERÍA 581 | EDICIÓN FEBRERO 2026

MINERÍA la mejor puerta de acceso al sector minero EDICIÓN 581 / FEBRERO 2026 59 Azure Data Lake: actuó como repositorio centralizado para almacenar los datos crudos y transformados, asegurando trazabilidad y versionamiento. Databricks: plataforma de análisis colaborativo basada en Apache Spark, utilizada para:  Consolidary transformar grandes volúmenes de datos.  Generar la tabla maestra con variables limpias y enriquecidas.  Entrenar y validar los modelos de Machine Learning (XGBoost).  Ejecutar el algoritmo de optimización (DES).  Visualizar resultados y generar reportes. Recopilación y preprocesamiento de datos Se consolidó una base de datos histórica de tres años, proveniente de múltiples fuentes operativas (PI System, SAP, hojas Excel y registros manuales), que incluyó variables como:  Composición química del concentrado de estaño y materiales alimentados.  Consumo de carbón y gas natural por batch.  Temperatura de operación.  Parámetros de control del horno.  Recuperación real de metal crudo. El preprocesamiento implicó la limpieza de datos erróneos o incompletos, la imputación de valores faltantes, la estandarización de variables y la generación de nuevas variables derivadas relevantes para el comportamiento del sistema. Este proceso permitió construir una tabla maestra de datos robusta y confiable para el entrenamiento del modelo. Modelado predictivo con XGBoost El modelo de predicción fue desarrollado utilizando el algoritmo XGBoost (Extreme Gradient Boosting), una técnica de aprendizaje automático supervisado basada en árboles de decisión. Este algoritmo pertenece a la familia de métodos de Boosting, que consiste en construir modelos secuenciales donde cada nuevo modelo corrige los errores cometidos por los anteriores. Figura 4. Resultados del SHAP Importance Train para el modelo desarrollado para LingoSmelter. Figura 5. Resultados del SHAP Summary Train para el modelo desarrollado para LingoSmelter.

RkJQdWJsaXNoZXIy MTM0Mzk2