MINERÍA la mejor puerta de acceso al sector minero EDICIÓN 575 / AGOSTO 2025 98 Cada uno fue conectado al nodo Test and Score, lo que permitió evaluar el desempeño de los modelos mediante validación cruzada. No se aplicaron procesos adicionales de muestreo o discretización dentro de Orange, ya que el preprocesamiento fue ejecutado desde Excel. Resultados y análisis Los resultados evidenciaron que el algoritmo Random Forest ofreció el mejor rendimiento general, alcanzando un AUC de 0.800 y una precisión de 0.714. Este modelo mostró mayor robustez ante relaciones no lineales y múltiples variables simultáneamente, condiciones frecuentes en sistemas de flotación. Entre las variables más influyentes en la predicción destacaron: Contenido de talco. Porcentaje de MgO. Índice de trabajo (Wi). Tipo de reactivo utilizado. pH y consumo de agua. Los gráficos generados (matriz de confusión, box plots comparativos y curva ROC) permitieron visualizar el comportamiento diferencial de estas variables frente a la ocurrencia de sobreespumación, validando estadísticamente correlaciones ya observadas en campo y en estudios previos. Limitaciones y proyecciones Aunque el modelo mostró buen desempeño predictivo, su efectividad depende directamente de la calidad y cantidad de datos disponibles. En esta etapa, se trabajó con una base simulada y referencial, por lo que se recomienda su validación futura con datos reales de planta para afinar su precisión. El modelo desarrollado posee un alto potencial de aplicación práctica, ya que podría integrarse en sistemas de planificación minera o monitoreo metalúrgico para: Anticipar zonas de riesgo geometalúrgico. Ajustar estrategias de blending. Modificar condiciones operativas y tipos de reactivos en tiempo real. Fuente: elaboración propia. Nota: el modelo de bosque aleatorio destaca por su mayor precisión, detectando siete verdaderos positivos. El árbol de decisión también presenta buen desempeño, aunque con presencia de errores tipo I y II. Por su parte, la regresión logística muestra una distribución equilibrada entre clases, útil para evaluar las limitaciones del modelo frente a casos marginales. Figura 20. Matriz de confusión. Fuente: elaboración propia. Nota: representación visual de la metodología aplicada en Orange Data Mining. Desde la carga de datos hasta la evaluación de los modelos mediante validación cruzada y análisis ROC. Figura 19. Diagrama de flujo del modelo en Orange.
RkJQdWJsaXNoZXIy MTM0Mzk2