El Portal de las Tecnologías para la Innovación

IBM Cloud es el primer proveedor de servicios en implementar Intel Gaudi 3

Los nuevos puntos de referencia de Signal65 muestran ahorros de costos en comparación con los competidores de GPU, lo que abre nuevas opciones para la infraestructura de IA empresarial.

IBM es el primer proveedor de servicios en la nube que pone a disposición de sus clientes los aceleradores de inteligencia artificial Intel® Gaudi® 3 , una medida diseñada para hacer que las potentes capacidades de inteligencia artificial sean más accesibles y abordar directamente el alto costo del hardware de inteligencia artificial especializado.

Para Intel, la implementación en IBM Cloud marca el primer gran despliegue comercial de Gaudi 3, lo que ofrece opciones al mercado. Al aprovechar Intel Gaudi 3 en IBM Cloud, ambas compañías buscan ayudar a sus clientes a probar, innovar e implementar soluciones GenAI de forma rentable.

Según un pronóstico reciente de la firma de investigación Gartner, se espera que el gasto mundial en IA generativa (GenAI) alcance los 644 mil millones de dólares en 2025, lo que supone un aumento del 76,4 % con respecto a 2024. La investigación concluyó que «la GenAI tendrá un impacto transformador en todos los aspectos de los mercados de gasto en TI, lo que sugiere un futuro en el que las tecnologías de IA se volverán cada vez más integrales para las operaciones comerciales y los productos de consumo».

Para muchos clientes empresariales, los beneficios son evidentes cuando herramientas como GenAI automatizan tareas, mejoran los flujos de trabajo e impulsan la innovación. Sin embargo, implementar aplicaciones de IA exige una gran potencia de procesamiento, que a menudo requiere procesadores especializados y costosos que pueden impedir que muchas empresas se beneficien de la IA.

Los aceleradores de IA Gaudi 3 están diseñados específicamente para satisfacer la creciente demanda de GenAI, la inferencia de modelos grandes y el ajuste fino de modelos, a la vez que admiten un marco de desarrollo abierto. Gaudi 3 también es ideal para modelos de lenguaje grandes multimodales (LLM) y generación aumentada por recuperación (RAG).

“Al incorporar los aceleradores de IA Intel Gaudi 3 a IBM Cloud, permitimos a las empresas escalar cargas de trabajo de IA generativa con un rendimiento optimizado para la inferencia y el ajuste preciso”, afirmó Saurabh Kulkarni, vicepresidente de Estrategia de IA para Centros de Datos de Intel. “Esta colaboración subraya nuestro compromiso compartido de hacer que la IA sea más accesible y rentable para las empresas de todo el mundo”.

https://youtube.com/watch?v=MlOdwT33Zsc%3Ffeature%3Doembed

Cómo los clientes empresariales utilizan IBM Cloud

IBM Cloud presta servicios a una variedad de clientes empresariales, particularmente aquellos en industrias reguladas, como servicios financieros, atención médica y ciencias biológicas, y el sector público.

Los bancos y las aseguradoras utilizan la nube para la detección de fraudes o la atención al cliente personalizada, mientras que los proveedores de atención médica la utilizan para acelerar el descubrimiento y desarrollo de fármacos, el diagnóstico basado en IA, las plataformas de telemedicina y la monitorización de pacientes en tiempo real. Los minoristas utilizan la tecnología en la nube para plataformas de comercio electrónico o la gestión de inventario. También es una opción ideal para las empresas que buscan modernizar sistemas obsoletos sin sacrificar el control ni la seguridad.

Gaudi 3 ahora está disponible en las regiones de IBM Cloud de Frankfurt, Alemania; Washington, DC; y Dallas, Texas.

Gaudi 3 también se está integrando en la oferta más amplia de infraestructura de IA de IBM. Los clientes ya pueden usar Gaudi 3 a través de IBM Cloud Virtual Servers en IBM Virtual Private Cloud (VPC). También podrán implementarlo en diferentes arquitecturas a partir del segundo semestre de 2025. Se espera que la compatibilidad con Red Hat OpenShift y la plataforma de IA Watsonx de IBM esté disponible este trimestre.

“La capacidad de gestionar más datos y un mayor rendimiento impulsará una mayor adopción de la IA por parte de clientes de todo el mundo”, afirma Satinder Sethi, director general de IBM Cloud Infrastructure Services. “Intel Gaudi 3 ofrece a los clientes más opciones, más libertad y una plataforma más rentable para elegir el hardware de IA que desean utilizar”.

Comparaciones de costos y rendimiento

Los aceleradores de IA Intel Gaudi 3 están diseñados para afrontar el reto del coste equilibrando rendimiento y precio. Nuevas pruebas de referencia de inferencia de IA , realizadas por la firma de investigación Signal65 y encargadas por Intel, revelaron que Gaudi 3 ofrece un 92 % más de rentabilidad (rendimiento por dólar) que la competencia al ejecutarse en el modelo Llama-3.1-405B-Instruct-FP8 de Meta con contextos de gran tamaño .

La rentabilidad es una métrica crucial, ya que permite a las empresas realizar más procesamiento de IA con la misma inversión o la misma cantidad de procesamiento a un menor coste. Las mejoras de rendimiento buscan reducir la barrera de costes para las empresas que buscan implementar o perfeccionar modelos, especialmente a medida que se extiende la adopción de GenAI.

(~0 KB)

Las mediciones de rendimiento se refieren a la cantidad de procesamiento de IA que el acelerador puede realizar en cada instancia, también conocida como tokens por segundo. Gaudi 3 ofrece un procesamiento de IA significativamente más rápido que la competencia. En el modelo IBM Granite-3.1-8B-Instruct, Gaudi 3 proporcionó un 43 % más de tokens por segundo para cargas de trabajo de IA pequeñas¹ y un 36 % más de tokens por segundo con contextos de gran tamaño, en comparación con la competencia al ejecutar el modelo Llama-3.1-405B-Instruct-FP8 de Meta¹ .

Intel News. Traducido al español

Artículos relacionados

Scroll al inicio