– Granite 3.2 – pequeños modelos de IA que ofrecen capacidades de razonamiento, visión y barandilla con una licencia amigable para el desarrollador
– Modelos actualizados de series de tiempo Granite que ofrecen pronósticos de largo alcance con menos de 10M parámetros
ARMONK, N.Y., 26 De febrero de 2025 /PRNewswire/ — IBM (NYSE: IBM) hoy debutó la próxima generación de su familia Granite big language model (LLM), Granite 3.2, en un esfuerzo continuo por ofrecer IA empresarial pequeña, eficiente y práctica para el impacto en el mundo real.
Todos los modelos Granite 3.2 están disponibles bajo la licencia permisiva Apache 2.0 en Hugging Face. Los modelos seleccionados están disponibles hoy en IBM watsonx.ai, Ollama, Replicate y LM Studio, y se esperan pronto en RHEL AI 1.5 –, brindando capacidades avanzadas a las empresas y la comunidad de código abierto. Los puntos destacados incluyen:
- Un nuevo modelo de lenguaje de visión (VLM) para tareas de comprensión de documentos que demuestren un rendimiento que coincida o supere el de modelos significativamente más grandes – Llama 3.2 11B y Pixtral 12B – en los puntos de referencia empresariales esenciales DocVQA, ChartQA, AI2D y OCRBench1. Además de los sólidos datos de capacitación, IBM utilizó su propio código abierto Kit de herramientas de docling procesar 85 millones de PDF y generar 26 millones de pares de preguntas y respuestas sintéticas para mejorar la capacidad del VLM para manejar flujos de trabajo complejos con gran cantidad de documentos.
- Cadena de pensamiento capacidades para un razonamiento mejorado en el 3.2 2B y 8B modelos, con la capacidad de activar o desactivar el razonamiento para ayudar a optimizar la eficiencia. Con esta capacidad, el 8B modelo logra mejoras de dos dígitos de su predecesor en puntos de referencia de seguimiento de instrucciones como ArenaHard y Alpaca Eval sin degradación de la seguridad o el rendimiento en otros lugares2. Además, con el uso de nuevos métodos de escala de inferencia3.2, el granito 8B el modelo se puede calibrar para rivalizar con el rendimiento de modelos mucho más grandes como Claude 3.5 Sonnet o GPT-4o en puntos de referencia de razonamiento matemático como AIME2024 y MATH500.3
- Opciones de tamaño reducido para Guardián de Granito modelos de seguridad que mantienen el rendimiento de los modelos anteriores Granite 3.1 Guardian con una reducción del 30% en el tamaño. Los modelos 3.2 también introducen una nueva característica llamada confianza verbalizada, que ofrece una evaluación de riesgos más matizada que reconoce la ambigüedad en el monitoreo de seguridad.
La estrategia de IBM para ofrecer modelos de IA más pequeños y especializados para empresas continúa demostrando eficacia en las pruebas, con el Granite 3.1 8B modelo que recientemente produjo altas calificaciones en la precisión en el Salesforce LLM Benchmark para CRM.
La familia de modelos Granite cuenta con el apoyo de un sólido ecosistema de socios, incluidas las principales compañías de software que incorporan los LLM en sus tecnologías.
«En CrushBank, hemos visto de primera mano cómo los modelos de IA abiertos y eficientes de IBM ofrecen un valor real para la IA empresarial –, ofreciendo el equilibrio adecuado de rendimiento, rentabilidad y escalabilidad», dijo Tan David, CTO, CrushBank. «Granite 3.2 lo lleva más allá con nuevas capacidades de razonamiento, y estamos entusiasmados de explorarlos en la construcción de nuevas soluciones agentic.»
Granite 3.2 es un paso importante en la evolución de la cartera y la estrategia de IBM para ofrecer IA pequeña y práctica para las empresas. Si bien los enfoques de cadena de pensamiento para el razonamiento son poderosos, requieren un poder de cómputo sustancial que no es necesario para cada tarea. Es por eso que IBM ha introducido la capacidad de activar o desactivar la cadena de pensamiento programáticamente. Para tareas más simples, el modelo puede funcionar sin razonamiento para reducir la sobrecarga de cómputo innecesaria. Además, otras técnicas de razonamiento como el escalado de inferencia han demostrado que el Granito 3.2 8B el modelo puede igualar o exceder el rendimiento de modelos mucho más grandes en puntos de referencia de razonamiento matemático estándar. La evolución de métodos como la escala de inferencia sigue siendo un área clave de enfoque para los equipos de investigación de IBM.4
Junto con los modelos de instrucciones, visión y barandilla Granite 3.2, IBM está lanzando la próxima generación de sus modelos TinyTimeMixers (TTM) (sub 10M parámetros), con capacidades para pronósticos a más largo plazo hasta dos años en el futuro. Estos crean herramientas poderosas en el análisis de tendencias a largo plazo, incluidas las tendencias financieras y económicas, el pronóstico de la demanda de la cadena de suministro y la planificación de inventario estacional en el comercio minorista.
«La próxima era de la IA se trata de eficiencia, integración e impacto en el mundo real – donde las empresas pueden lograr resultados poderosos sin un gasto excesivo en computación», dijo Raghavan Sriram, VP, IBM AI Research. «Los últimos desarrollos de Granite de IBM centrados en soluciones abiertas demuestran otro paso adelante para hacer que la IA sea más accesible, rentable y valiosa para las empresas modernas.»
Para obtener más información sobre Granite 3.2, lea esto artículo técnico.
IBM News. Traducido al español