El Portal de las Tecnologías para la Innovación

¿Puede una IA personalizada ser más útil?

Los investigadores de IBM están probando una nueva aplicación y una plataforma de código abierto diseñada por IBM para aprender si agentes y aplicaciones de IA más personalizados pueden ayudar a los usuarios comerciales a extraer más valor de la IA generativa.

Los modelos de lenguaje grandes son buenos con las palabras, e incluso con el código, pero sus capacidades no siempre coinciden con el tipo de tareas monótonas y especializadas que pueden consumir la jornada laboral.

La nueva aplicación experimental de IBM, BeeAI , desarrollada sobre su plataforma de código abierto Bee Agent, tiene como objetivo explorar cómo los profesionales pueden recuperar parte de ese tiempo. Es parte de un proyecto de investigación más amplio para determinar cómo la IA generativa puede ayudar a acelerar y automatizar tareas repetitivas, independientemente de su experiencia técnica.

La aplicación prototipo cuenta con una interfaz de chat intuitiva que permite seguir paso a paso la ejecución de una tarea. BeeAI está diseñada para usarse de tres maneras diferentes:

Puedes usar su agente integrado, «Bee», para tareas típicas de un chatbot, como buscar en la web y generar contenido. También puedes asignarle a Bee nuevos roles, como contable o gerente de proyectos, y darle a tu agente herramientas personalizadas para que pueda conectarse a aplicaciones colaborativas como GitHub y Airtable.

https://www.youtube.com/embed/0elJ2eM2fRs?loop=0&enablejsapi=1&origin=https%3A%2F%2Fresearch.ibm.com&widgetid=1La interfaz de chat de BeeAI le permite interactuar con su agente de IA al tiempo que proporciona visibilidad paso a paso del proceso de razonamiento del agente y el uso de herramientas.

Una tercera forma de utilizar BeeAI es crear aplicaciones reutilizables basadas en inteligencia artificial para automatizar tareas recurrentes, como procesar facturas o resumir transcripciones de reuniones. Puede compartir estos widgets personalizados que le permitirán ahorrar tiempo con sus colegas simplemente copiando y pegando un enlace web.

“Con unas pocas palabras, se puede crear un panel de control o una aplicación interactiva”, afirmó Maya Murad, gerente de incubación de productos en IBM Research, quien colabora en la dirección de BeeAI. “Para alguien que no sabe programar, la capacidad de crear una interfaz de usuario dinámica resulta bastante mágica”.

En los dos años transcurridos desde que ChatGPT revolucionó la industria tecnológica, los LLM han pasado de ser asistentes independientes a sistemas de agentes diseñados para actuar en nombre de un usuario emulando la forma en que los humanos razonan sobre un problema y actúan. Gracias a esta capa adicional de software, estos nuevos agentes LLM pueden invocar herramientas externas y fuentes de conocimiento, y verificar y corregir su trabajo.

BeeAI surgió en medio de este cambio, ya que IBM y otras empresas del sector tecnológico han buscado hacer que los modelos de lenguaje sean más relevantes para los tipos de tareas cotidianas que las personas enfrentan en el trabajo. Existe un consenso cada vez mayor de que los modelos de lenguaje no serán más relevantes al incorporar más datos o agregar más ponderaciones, sino al conectarlos con el mundo exterior y otros modelos de lenguaje para mejorar la precisión y la versatilidad.

En consonancia con el compromiso de IBM con el software de código abierto , BeeAI se basa en componentes que la comunidad puede inspeccionar y mejorar. Entre ellos se incluyen la familia de modelos de lenguaje de última generación Granite y Llama de IBM y Meta; Bee Agent Platform de IBM , que cuenta con una arquitectura de estilo ReAct que brinda a los agentes la capacidad de planificar, llamar a herramientas y reflexionar en un formato paso a paso; y Docling , un kit de herramientas de investigación de IBM para convertir documentos comerciales no estructurados en un formato que los LLM puedan digerir.

Con unas pocas palabras, puedes crear un panel de control o una aplicación interactiva. Para alguien que no sabe programar, la capacidad de crear una interfaz de usuario dinámica resulta bastante mágica.

En conjunto, los componentes de BeeAI permiten que un usuario comercial con experiencia técnica limitada personalice e implemente sus propios agentes de IA y cree aplicaciones personalizadas impulsadas por IA que puedan compartirse con compañeros de trabajo.

«Puedo decir ‘soy un gerente de producto a cargo de un proyecto de código abierto y necesito un panel de control del proyecto para mostrarle a mi equipo de liderazgo'», dice Murad. «Puedo tenerlo en segundos y aplicar esta fórmula básica a cualquier trabajo».

Cómo utilizar BeeAI

BeeAI viene con un agente listo para usar, Bee, que resultará familiar para cualquiera que haya jugado con un chatbot LLM antes. Sin embargo, lo que hace que el agente de IBM sea diferente es su capacidad de observación y el uso de herramientas.

Bee invita a los usuarios a visualizar su proceso de «pensamiento» mientras funciona, para que puedan confiar más en sus resultados. Hazle una pregunta a Bee y te mostrará cómo planea encontrar la respuesta, en lugar de responder de inmediato como hacen la mayoría de los chatbots de LLM en la actualidad. Si Bee se decide por una búsqueda web, te mostrará los términos que utilizó para explorar Internet, los principales resultados que arrojó y la fuente que finalmente eligió para resumir y entregártela al usuario.

Detrás de esta ventana hay un protocolo de razonamiento y acción que permite que el LLM subyacente de Bee evalúe cada paso del proceso. En el ejemplo de búsqueda web, si el primer lote de resultados no muestra contenido alineado con su objetivo, intentará un nuevo término de búsqueda. Bee también puede acceder a bibliotecas de Python que le permiten convertir archivos CSV cargados en gráficos, entre otras capacidades avanzadas.

Bee funciona bien para tareas de uso general, pero a veces un trabajo requiere conocimientos y habilidades que solo un experto puede proporcionar. En estas situaciones, un agente personalizado con un alcance más limitado a menudo puede funcionar mejor. Para estos casos, BeeAI le permite crear agentes con sus propias personalidades, ya sea un contador que puede procesar facturas o un gerente de proyectos que puede traducir las quejas de los clientes en problemas de GitHub.

En cuestión de segundos, Bee se puede volver a implementar para estas nuevas tareas. Los usuarios con más conocimientos técnicos pueden escribir código Python para crear una herramienta personalizada que se pueda conectar a cualquier sistema con una API, incluidas aplicaciones colaborativas populares como GitHub, Airtable o Figma, para que otros en la oficina puedan retomar el trabajo donde lo dejó su agente.

BeeAI también se puede utilizar para crear aplicaciones basadas en IA, sin necesidad de codificación. Un LLM potencia tanto la experiencia de creación de aplicaciones como las aplicaciones que crean los usuarios. Los investigadores de IBM añadieron el creador de aplicaciones después de observar cómo las personas pedían repetidamente a los agentes que completaran una tarea que podría gestionarse de forma mucho más eficiente sin negociaciones de ida y vuelta con un chatbot.

La capacidad de creación de aplicaciones de BeeAI le permite crear aplicaciones reutilizables impulsadas por IA para tareas comerciales cotidianas a través de una interfaz de chat fácil de usar.

“Imagina una herramienta de resumen de reuniones que te permita cargar un archivo, seleccionar un formato de reunión y presionar “ir”, dice Kate Blair, directora de incubación de productos en IBM Research, que supervisa BeeAI. “Si esto es algo que haces todos los días, es más rápido arrastrar y soltar un archivo que tener que describir en un mensaje para el chatbot, después de cada reunión, cómo debe ser el resumen que quieres”.

Un abogado cuyo trabajo incluya revisar contratos comerciales podría diseñar una aplicación que tome el contrato cargado y lo analice en busca de señales de alerta comunes. Un analista de ventas a cargo de verificar facturas podría diseñar una aplicación que tome las facturas cargadas y se asegure de que cada una coincida con lo que se ordenó y recibió, para evitar errores o cargos fraudulentos.

“Estamos pidiendo al usuario empresarial que explore la posibilidad de crear sus propias interfaces para su trabajo diario como alternativa a intentar delegar todo a un chatbot”, dice Blair.

¿Qué sigue?

Dos años después del auge de los LLM, muchas personas aún no han incorporado modelos lingüísticos a su vida laboral de manera significativa. BeeAI se creó y lanzó con la idea de preguntar a los propios usuarios empresariales cómo se podría reconfigurar la tecnología para brindar más valor.

Los investigadores de IBM utilizarán los comentarios que obtengan de BeeAI para dar forma a su futuro. “Una interfaz de chat es flexible por naturaleza y puede ser una excelente manera de aprovechar la IA”, afirma Blair. “Pero no siempre es la mejor manera. A través de BeeAI queremos aprender más sobre la interacción del usuario y cómo los usuarios comerciales pueden obtener más beneficios de la IA generativa”. IBM News. Traducido al español

Artículos relacionados

Scroll al inicio