IBM Cloud implementará aceleradores AMD Instinct™ MI300X para respaldar el rendimiento de las cargas de trabajo de IA generativa y las aplicaciones HPC
18 de noviembre de 2024 – Armonk, NY – IBM (NYSE: IBM ) y AMD han anunciado una colaboración para implementar los aceleradores AMD Instinct MI300X como servicio en IBM Cloud. Esta oferta, que se espera que esté disponible en la primera mitad de 2025, tiene como objetivo mejorar el rendimiento y la eficiencia energética de los modelos Gen AI, como las aplicaciones de computación de alto rendimiento (HPC) para clientes empresariales. Esta colaboración también permitirá el soporte para los aceleradores AMD Instinct MI300X dentro de la plataforma de datos e inteligencia artificial watsonx de IBM, así como el soporte de inferencia de inteligencia artificial de Red Hat® Enterprise Linux®.
“A medida que las empresas siguen adoptando modelos y conjuntos de datos de IA más grandes, es fundamental que los aceleradores dentro del sistema puedan procesar cargas de trabajo de alto consumo de recursos con alto rendimiento y flexibilidad para escalar”, afirmó Philip Guido, vicepresidente ejecutivo y director comercial de AMD. “Los aceleradores AMD Instinct combinados con el software AMD ROCm ofrecen un amplio soporte, incluidas las plataformas IBM Watsonx AI, Red Hat Enterprise Linux AI y Red Hat OpenShift AI, para crear marcos líderes utilizando estas potentes herramientas de ecosistema abierto. Nuestra colaboración con IBM Cloud tendrá como objetivo permitir a los clientes ejecutar y escalar la inferencia Gen AI sin obstaculizar los costos, el rendimiento o la eficiencia”.
(Crédito: AMD)
“AMD e IBM Cloud comparten la misma visión de llevar la IA a las empresas. Estamos comprometidos a llevar el poder de la IA a los clientes empresariales, ayudándolos a priorizar sus resultados y asegurándonos de que tengan el poder de elección cuando se trata de sus implementaciones de IA”, dijo Alan Peacock, gerente general de IBM Cloud. “Aprovechar los aceleradores de AMD en IBM Cloud les dará a nuestros clientes empresariales otra opción para escalar y satisfacer sus necesidades de IA empresarial, al mismo tiempo que buscamos ayudarlos a optimizar los costos y el rendimiento”.
IBM y AMD están colaborando para ofrecer aceleradores MI300X como servicio en IBM Cloud para ayudar a los clientes empresariales a aprovechar la IA. Para ayudar a los clientes empresariales de todos los sectores, incluidos aquellos que están fuertemente regulados, IBM y AMD tienen la intención de aprovechar las capacidades de seguridad y cumplimiento de IBM Cloud.
- Compatibilidad con inferencias de modelos de gran tamaño: equipados con 192 GB de memoria de gran ancho de banda (HBM3), los aceleradores AMD Instinct MI300X ofrecen compatibilidad con inferencias y ajustes de modelos de gran tamaño. La gran capacidad de memoria también puede ayudar a los clientes a ejecutar modelos de mayor tamaño con menos GPU, lo que potencialmente reduce los costos de inferencia.
- Rendimiento y seguridad mejorados: ofrecer aceleradores AMD Instinct MI300X como servicio en IBM Cloud Virtual Servers para VPC, así como a través del soporte de contenedores con IBM Cloud Kubernetes Service e IBM Red Hat OpenShift en IBM Cloud, puede ayudar a optimizar el rendimiento de las empresas que ejecutan aplicaciones de IA.
Para las cargas de trabajo de inferencia de IA generativa, IBM planea habilitar el soporte para los aceleradores AMD Instinct MI300X dentro de la plataforma de datos e IA watsonx de IBM, lo que brindará a los clientes de watsonx recursos de infraestructura de IA adicionales para escalar sus cargas de trabajo de IA en entornos de nube híbrida. Además, las plataformas Red Hat Enterprise Linux AI y Red Hat OpenShift AI pueden ejecutar modelos de lenguaje grande (LLM) de la familia Granite con herramientas de alineación mediante InstructLab en aceleradores MI300X.
Se espera que IBM Cloud con aceleradores AMD Instinct MI300X estén disponibles de forma generalizada en la primera mitad de 2025. Estén atentos a más actualizaciones de AMD e IBM en los próximos meses.
Para obtener más información sobre las ofertas de GPU y aceleradores de IBM, visite: https://www.ibm.com/cloud/gpu
Las declaraciones sobre la dirección e intención futuras de IBM están sujetas a cambios o retiro sin previo aviso y representan únicamente metas y objetivos. IBM News. Traducido al español