El Portal de las Tecnologías para la Innovación

IBM presenta Granite 3.0: modelos de IA de alto rendimiento diseñados para empresas

 Hoy, en el evento anual TechXchange de IBM (NYSE: IBM ), la compañía anunció el lanzamiento de su familia más avanzada de modelos de IA hasta la fecha, Granite 3.0 .

– Los nuevos modelos Granite 3.0 8B y 2B, lanzados bajo la licencia permisiva Apache 2.0, muestran un sólido desempeño en muchos puntos de referencia académicos y empresariales, capaces de superar o igualar a modelos de tamaño similar.

– Los nuevos modelos Granite Guardian 3.0 ofrecen las capacidades de protección más completas de IBM para promover una IA segura y confiable

– Los nuevos modelos Mixture-of-Experts de Granite 3.0 permiten una inferencia extremadamente eficiente y una baja latencia, adecuada para implementaciones basadas en CPU y computación de borde

– El nuevo modelo Granite Time Series logró un rendimiento de vanguardia en pronósticos de cero o pocos disparos, superando a modelos 10 veces más grandes

– IBM presenta la próxima generación de watsonx Code Assistant con tecnología Granite para codificación de propósito general; presenta nuevas herramientas en watsonx.ai para crear e implementar aplicaciones y agentes de IA

– Anuncia que Granite se convertirá en el modelo predeterminado de Consulting Advantage, una plataforma de entrega impulsada por IA utilizada por los 160.000 consultores de IBM para brindar nuevas soluciones a los clientes más rápidamente.

 Hoy , en el evento anual TechXchangede IBM (NYSE: IBM ), la compañía anunció el lanzamiento de su familia más avanzada de modelos de IA hasta la fecha, Granite 3.0 . Los modelos de lenguaje insignia Granite de tercera generación de IBM pueden superar o igualar a modelos de tamaño similar de los principales proveedores de modelos en muchos puntos de referencia académicos y de la industria, lo que demuestra un sólido rendimiento, transparencia y seguridad.

En consonancia con el compromiso de la empresa con la IA de código abierto, los modelos Granite se lanzan bajo la licencia permisiva Apache 2.0, lo que los hace únicos en la combinación de rendimiento, flexibilidad y autonomía que brindan a los clientes empresariales y a la comunidad en general.

La familia Granite 3.0 de IBM incluye:

  • Propósito general/idioma: Instrucción Granite 3.0 8B , Instrucción Granite 3.0 2B, Base Granite 3.0 8B , Base Granite 3.0 2B
  • Barandillas y seguridad: Granite Guardian 3.0 8B , Granite Guardian 3.0 2B
  • Mezcla de expertos: Instrucción de granito 3.0 3B -A800M , Instrucción de granito 3.0 1B -A400M, Base de granito 3.0 3B -A800M , Base de granito 3.0 1B -A400M

Los nuevos modelos de lenguaje Granite 3.0 8B y 2B están diseñados como modelos de «batalla» para la IA empresarial, y ofrecen un gran rendimiento para tareas como recuperación de información, generación aumentada (RAG), clasificación, resumen, extracción de entidades y uso de herramientas. Estos modelos compactos y versátiles están diseñados para ajustarse con precisión a los datos empresariales e integrarse sin problemas en diversos entornos o flujos de trabajo comerciales.

Si bien muchos modelos de lenguaje de gran tamaño (LLM) se entrenan con datos disponibles públicamente, una gran mayoría de los datos empresariales siguen sin explotarse. Al combinar un pequeño modelo Granite con datos empresariales, especialmente mediante la revolucionaria técnica de alineación InstructLab (presentada por IBM y RedHat en mayo), IBM cree que las empresas pueden lograr un rendimiento específico de tareas que rivaliza con modelos más grandes a una fracción del costo (según un rango observado de 3 a 23 veces menos costo que los modelos de frontera de gran tamaño en varias pruebas de concepto tempranas 1 ).

La versión 3.0 de Granite reafirma el compromiso de IBM de generar transparencia, seguridad y confianza en los productos de IA. El informe técnico y la guía de uso responsable de Granite 3.0 brindan una descripción de los conjuntos de datos utilizados para entrenar estos modelos, detalles de los pasos de filtrado, limpieza y curación aplicados, junto con resultados completos del rendimiento del modelo en los principales puntos de referencia académicos y empresariales.

Es fundamental que IBM proporcione una indemnización por propiedad intelectual para todos los modelos Granite en watsonx.ai para que los clientes empresariales puedan tener más confianza al fusionar sus datos con los modelos.

Subiendo el listón: puntos de referencia de Granite 3.0

Los modelos de lenguaje Granite 3.0 también demuestran resultados prometedores en el rendimiento bruto.

En los parámetros académicos estándar definidos por el OpenLLM Leaderboard de Hugging Face, el rendimiento general del modelo Granite 3.0 8B Instruct supera en promedio el rendimiento de vanguardia de los modelos de código abierto de tamaño similar de Meta y Mistral. En el parámetro de seguridad de vanguardia AttaQ de IBM, el modelo Granite 3.0 8B Instruct supera en todas las dimensiones de seguridad medidas a los modelos de Meta y Mistral. 

En las principales tareas empresariales de RAG, el uso de herramientas y las tareas en el dominio de la ciberseguridad, el modelo Granite 3.0 8B Instruct muestra un rendimiento líder en promedio en comparación con los modelos de código abierto de tamaño similar de Mistral y Meta. 3

Los modelos Granite 3.0 se entrenaron con más de 12 billones de tokens en datos extraídos de 12 lenguajes naturales diferentes y 116 lenguajes de programación diferentes, utilizando un novedoso método de entrenamiento en dos etapas, aprovechando los resultados de varios miles de experimentos diseñados para optimizar la calidad de los datos, la selección de datos y los parámetros de entrenamiento. Para finales de año, se espera que los modelos de lenguaje 3.0 8B y 2B incluyan compatibilidad con una ventana de contexto extendida de 128K y capacidades de comprensión de documentos multimodales.

Demostrando un excelente equilibrio entre rendimiento y costo de inferencia, IBM ofrece sus modelos de arquitectura Granite Mixture of Experts (MoE), Granite 3.0 1B -A400M y Granite 3.0 3B -A800M, como modelos más pequeños y livianos que podrían implementarse para aplicaciones de baja latencia, así como para implementaciones basadas en CPU.  

IBM también anuncia una versión actualizada de sus modelos de series temporales Granite preentrenados, cuyas primeras versiones se lanzaron a principios de este año. Estos nuevos modelos se entrenan con tres veces más datos y ofrecen un sólido rendimiento en los tres principales puntos de referencia de series temporales, superando a modelos diez veces más grandes de Google, Alibaba y otros. Los modelos actualizados también brindan una mayor flexibilidad de modelado con soporte para variables externas y pronósticos continuos. 4

Presentamos Granite Guardian 3.0: el comienzo de la próxima era de la IA responsable   

Como parte de este lanzamiento, IBM también presenta una nueva familia de modelos Granite Guardian que permiten a los desarrolladores de aplicaciones implementar medidas de seguridad verificando las indicaciones del usuario y las respuestas de LLM para una variedad de riesgos. Los modelos Granite Guardian 3.0 8B y 2B brindan el conjunto más completo de capacidades de detección de riesgos y daños disponibles en el mercado hoy en día.

Además de las dimensiones de daño como el sesgo social, el odio, la toxicidad, las blasfemias, la violencia, el jailbreaking y más, estos modelos también proporcionan una variedad de comprobaciones exclusivas específicas de RAG, como la conexión a tierra, la relevancia del contexto y la relevancia de la respuesta. En pruebas exhaustivas en 19 puntos de referencia de seguridad y RAG, el modelo Granite Guardian 3.0 8B tiene una mayor precisión general en la detección de daños en promedio que las tres generaciones de modelos Llama Guard de Meta. También mostró un rendimiento general similar en la detección de alucinaciones en promedio con los modelos especializados de detección de alucinaciones WeCheck y MiniCheck. 5

Si bien los modelos Granite Guardian se derivan de los modelos de lenguaje Granite correspondientes, se pueden usar para implementar barandillas junto con cualquier modelo de IA abierto o propietario.

Disponibilidad de los modelos Granite 3.0

El conjunto completo de modelos Granite 3.0 y los modelos de series temporales actualizados están disponibles para su descarga en HuggingFace bajo la licencia permisiva Apache 2.0. Las variantes de instrucción de los nuevos modelos de lenguaje Granite 3.0 8B y 2B y los modelos Granite Guardian 3.0 8B y 2B están disponibles hoy para uso comercial en la plataforma watsonx de IBM. Una selección de los modelos Granite 3.0 también estará disponible como microservicios NVIDIA NIM y a través de las integraciones de Vertex AI Model Garden de Google Cloud con HuggingFace.

Para ayudar a brindar opciones y facilidad de uso a los desarrolladores y brindar soporte a las implementaciones locales y de borde, un conjunto seleccionado de modelos Granite 3.0 también está disponible en Ollama y Replicate.

La última generación de modelos Granite amplía el sólido catálogo de código abierto de potentes LLM de IBM. IBM ha colaborado con socios del ecosistema como AWS, Docker, Domo, Qualcomm Technologies, Inc. a través de su Qualcomm® AI Hub , Salesforce, SAP y otros para integrar una variedad de modelos Granite en las ofertas de estos socios o hacer que los modelos Granite estén disponibles en sus plataformas, ofreciendo una mayor variedad de opciones a las empresas de todo el mundo. 

Asistentes de agentes: haciendo realidad el futuro de la IA empresarial 

IBM está impulsando la IA empresarial a través de una gama de tecnologías, desde modelos y asistentes hasta las herramientas necesarias para ajustar e implementar la IA específicamente para los datos y casos de uso exclusivos de las empresas. IBM también está allanando el camino para futuros agentes de IA que puedan autodirigirse, reflexionar y realizar tareas complejas en entornos empresariales dinámicos.

IBM continúa desarrollando su cartera de tecnologías de asistentes de IA: desde watsonx Orchestrate, que ayuda a las empresas a crear sus propios asistentes mediante herramientas y automatización de código reducido, hasta un amplio conjunto de asistentes prediseñados para tareas y dominios específicos, como atención al cliente, recursos humanos, ventas y marketing. Organizaciones de todo el mundo han utilizado watsonx Assistant para crear asistentes de IA para tareas como responder preguntas rutinarias de clientes o empleados, modernizar sus mainframes y aplicaciones de TI heredadas, ayudar a los estudiantes a explorar posibles trayectorias profesionales o brindar asistencia hipotecaria digital para compradores de viviendas. 

Hoy IBM también presentó el próximo lanzamiento de la próxima generación de Watsonx Code Assistant , impulsado por modelos de código Granite, para ofrecer asistencia de codificación de propósito general en lenguajes como C, C++, Go, Java y Python, con capacidades avanzadas de modernización de aplicaciones para aplicaciones Java empresariales. 6 Las capacidades de código de Granite ahora también son accesibles a través de una extensión de Visual Studio Code,  IBM Granite.Code .

IBM también planea lanzar nuevas herramientas para ayudar a los desarrolladores  a construir, personalizar e implementar IA de manera más eficiente a través de watsonx.ai, incluidos marcos de trabajo de agentes, integraciones con entornos existentes y automatizaciones de código bajo para casos de uso comunes como RAG y agentes. 7

IBM se centra en el desarrollo de tecnologías de agentes de IA capaces de lograr una mayor autonomía, razonamiento sofisticado y resolución de problemas en varios pasos. La versión inicial del modelo Granite 3.0 8B incluye compatibilidad con capacidades de agente clave, como razonamiento avanzado y una plantilla de chat altamente estructurada y un estilo de indicaciones para implementar flujos de trabajo de uso de herramientas. IBM también planea introducir una nueva función de chat de agente de IA en IBM Watson Orchestrate, que utiliza capacidades de agente para orquestar asistentes de IA, habilidades y automatizaciones que ayudan a los usuarios a aumentar la productividad en sus equipos. 8   IBM planea seguir desarrollando capacidades de agente en toda su cartera en 2025, incluidos agentes prediseñados para dominios y casos de uso específicos.

Plataforma de entrega ampliada impulsada por IA para potenciar a los consultores de IBM con IA 

IBM también anuncia una importante expansión de su plataforma de entrega impulsada por IA, IBM Consulting Advantage . La plataforma multimodelo contiene agentes, aplicaciones y métodos de IA, como marcos repetibles, que pueden permitir que 160.000 consultores de IBM brinden un valor mejor y más rápido a los clientes a un menor costo.

Como parte de la expansión, los modelos de lenguaje de Granite 3.0 se convertirán en el modelo predeterminado en Consulting Advantage. Aprovechando el rendimiento y la eficiencia de Granite, IBM Consulting podrá ayudar a maximizar el retorno de la inversión en los proyectos de inteligencia artificial generativa de los clientes de IBM. 

Otra parte clave de la expansión es la introducción de IBM Consulting Advantage for Cloud Transformation and Management e IBM Consulting Advantage for Business Operations. Cada una incluye agentes, aplicaciones y métodos de IA específicos de cada dominio, que incorporan las mejores prácticas de IBM para que los consultores de IBM puedan ayudar a acelerar las transformaciones de la nube y la IA de los clientes en tareas como la modernización de códigos y la ingeniería de calidad, o transformar y ejecutar operaciones en distintos dominios, como finanzas, recursos humanos y adquisiciones. IBM

Artículos relacionados

Scroll al inicio