El rápido crecimiento en el uso de modelos de lenguaje grande (LLM) y agentes de IA como parte del desarrollo y la implementación de software está revolucionando el panorama de la tecnología de la información.
Si bien la generación de código recibe una atención significativa, una aplicación de mayor impacto radica en el uso de agentes de IA para la resiliencia operativa de los servicios en la nube, que actualmente requieren un esfuerzo humano significativo y conocimiento del dominio. Existe un creciente interés en la IA para operaciones de TI (AIOps), que tiene como objetivo automatizar tareas operativas complejas, como la localización de fallas y el análisis de la causa raíz, reduciendo así la intervención humana y el impacto en el cliente. Sin embargo, lograr la visión de nubes autónomas y autorreparables a través de AIOps se ve obstaculizado por la falta de marcos estandarizados para construir, evaluar y mejorar los agentes de AIOps. Este documento de visión sienta las bases para dicho marco al enmarcar primero los requisitos y luego analizar las decisiones de diseño que los satisfacen. También proponemos AIOpsLab, una implementación de prototipo que aprovecha la interfaz agente-nube que orquesta una aplicación, inyecta fallas en tiempo real utilizando ingeniería del caos e interactúa con un agente para localizar y resolver las fallas. Informamos resultados prometedores y sentamos las bases para construir un marco modular y sólido para construir, evaluar y mejorar agentes para nubes autónomas. arXiv:2407.12165 [cs.SE]. M. M. S., Y. Ch., G. S., M. M., Y. L. S., X. Z., J. M., P. L-C., S. M. G., S. N., C. B., S. R. Traducido al español