El Portal de las Tecnologías para la Innovación

AI Factories, Built Smarter: Nuevo Omniverse Blueprint Advances AI Factory Design and Simulation

El plan, conectado a las soluciones Cadence, ETAP, Schneider Electric y Vertiv, permite a los ingenieros diseñar, probar y optimizar una nueva generación de centros de datos de fabricación de inteligencia utilizando gemelos digitales.

La IA ahora es dominante e impulsa una demanda sin precedentes de AI fábricas — infraestructura especialmente diseñada dedicada a la capacitación e inferencia de IA — y la producción de inteligencia.

Muchas de estas fábricas de IA serán a escala de gigavatios. La creación de una sola fábrica de IA de gigavatios es un acto extraordinario de ingeniería y logística — que requiere decenas de miles de trabajadores en proveedores, arquitectos, contratistas e ingenieros para construir, enviar y ensamblar casi 5 mil millones de componentes y más de 210,000 millas de cable de fibra.

Para ayudar a diseñar y optimizar estas fábricas de IA, NVIDIA presentó hoy en GTC el Omniverso NVIDIA Plan para el diseño y las operaciones de la fábrica de IA.

Durante su Nota clave del GTC1, el fundador y CEO de NVIDIA, Jensen Huang, mostró cómo el equipo de ingeniería del centro de datos de NVIDIAia desarrolló una aplicación en el Plan Omniverse para planificar, optimizar y simular una fábrica de IA de 1 gigavatio. Conectados a herramientas de simulación líderes como Cadence Reality Digital Twin Platform y ETAP, los equipos de ingeniería pueden probar y optimizar la energía, la refrigeración y las redes mucho antes de que comience la construcción.

https://youtube.com/watch?v=TRc0z_qcze0%3Ffeature%3Doembed

Ingeniería AI Fábricas: Un Primer Enfoque de Simulación

El Plan Omniverso de NVIDIA para el diseño y las operaciones de fábrica de IA utiliza bibliotecas OpenUSD que permiten a los desarrolladores agregar datos 3D de fuentes dispares como el edificio en sí, los sistemas informáticos acelerados de NVIDIA y las unidades de energía o refrigeración de proveedores como Schneider Electric y Vertiv.

Al unificar el diseño y la simulación de miles de millones de componentes, el plan ayuda a los ingenieros a abordar desafíos complejos como:

  • Integración de componentes y optimización del espacio — Unificando el diseño y la simulación de NVIDIA DGX SuperPODs300 Sistemas GB NVL72 y sus 5 mil millones de componentes.
  • Rendimiento y eficiencia del sistema de enfriamiento — Usando Cadence Reality Digital Twin Platform, acelerado por NVIDIA CUDA y bibliotecas Omniverse, para simular y evaluar soluciones híbridas de refrigeración por aire y líquido de Vertiv y Schneider Electric.
  • Distribución y fiabilidad de la potencia — Diseño de sistemas eléctricos escalables y redundantes con ETAP para simular la eficiencia y confiabilidad del bloque de potencia.
  • Topología y lógica de redes — Ajuste de infraestructura de alto ancho de banda con Spectrum-X NVIDIA networking y el NVIDIA Aire plataforma.

Rompiendo Silos de Ingeniería con Omniverso

Uno de los mayores desafíos en la construcción de fábricas de IA es que diferentes equipos — de energía, refrigeración y redes — operan en silos, lo que lleva a ineficiencias y posibles fallas.

Usando el plano, los ingenieros pueden ahora:

  • Colaborar en contexto completo — Múltiples disciplinas pueden iterar en paralelo, compartiendo simulaciones en vivo que revelan cómo los cambios en un dominio afectan a otro.
  • Optimizar el uso de energía — Las actualizaciones de simulación en tiempo real permiten a los equipos encontrar los diseños más eficientes para las cargas de trabajo de IA.
  • Eliminar puntos de falla — Al validar las configuraciones de redundancia antes de la implementación, las organizaciones reducen el riesgo de costosos tiempos de inactividad.
  • Modele las condiciones del mundo real — Predice y prueba cómo las diferentes cargas de trabajo de IA afectarán el enfriamiento, la estabilidad de la energía y la congestión de la red.

Al integrar la simulación en tiempo real en todas las disciplinas, el plan permite a los equipos de ingeniería explorar varias configuraciones para modelar el costo de propiedad y optimizar la utilización de energía.

Simulaciones en Tiempo Real para una Toma de Decisiones Más Rápida

En la demostración de Huangangs, los ingenieros ajustan las configuraciones de fábrica de IA en tiempo real — y ven instantáneamente el impacto.

Por ejemplo, un pequeño ajuste en el diseño de enfriamiento mejoró significativamente la eficiencia — un detalle que podría haberse perdido en el papel. Y en lugar de esperar horas para obtener resultados de simulación, los equipos podrían probar y refinar estrategias en solo segundos.

Una vez que se finalizó un diseño óptimo, Omniverse simplificó la comunicación con los proveedores y los equipos de construcción — asegurando que lo que se construye coincida con el modelo, hasta el último detalle.

Prueba de futuro AI Fábricas

Las cargas de trabajo de IA no son estáticas. La próxima ola de aplicaciones de IA impulsará aún más las demandas de energía, refrigeración y redes. El Plan Omniverse para el diseño y las operaciones de la fábrica de IA ayuda a garantizar que las fábricas de IA estén listas al ofrecer:

  • Simulación consciente de la carga de trabajo — Predice cómo los cambios en las cargas de trabajo de IA afectarán la potencia y el enfriamiento a escala del centro de datos.
  • Pruebas de escenarios de falla — Modelo de fallas en la red, fugas de enfriamiento y picos de potencia para garantizar la resiliencia.
  • Actualizaciones escalables — Plan para expansiones de fábricas de IA y estimar las necesidades de infraestructura años antes.

Y al planificar las modificaciones y actualizaciones, los usuarios pueden probar y simular fácilmente el costo y el tiempo de inactividad — entregando una fábrica de IA a prueba de futuro.

Para los operadores de fábricas de IA, mantenerse a la vanguardia no se trata solo de eficiencia — se trata de prevenir fallas en la infraestructura que podrían costar millones de dólares por día.

Para una fábrica de IA de 1 gigavatio, cada día de tiempo de inactividad puede costar más de $100 millones. Al resolver los desafíos de infraestructura por adelantado, el plan reduce tanto el riesgo como el tiempo de implementación.

Camino a la IA Agéntica para la Operación de la Fábrica de IA

NVIDIA está trabajando en la próxima evolución del plan para expandirse a operaciones habilitadas para IA, trabajando con compañías clave como Vertech y Phaidra.

Vertech está colaborando con el equipo de ingeniería del centro de datos de NVIDIA en el avanzado sistema de control de fábrica de IA de NVIDIAia, que integra datos de tecnología operativa y de TI para mejorar la resiliencia y la visibilidad operativa.

Phaidra está trabajando con NVIDIA para integrar agentes de IA de aprendizaje por refuerzo en Omniverse. Estos agentes optimizan la estabilidad térmica y la eficiencia energética mediante la simulación de escenarios en tiempo real, creando gemelos digitales que se adaptan continuamente a las cambiantes condiciones de hardware y ambientales.

El AI Data Center Boom

AI está remodelando el panorama global del centro de datos. Con $1 billón proyectado para actualizaciones de centros de datos impulsadas por IA, la tecnología gemela digital ya no es opcional — es esencial.

El Plan Omniverso de NVIDIA para el diseño y las operaciones de la fábrica de IA está listo para ayudar a NVIDIA y su ecosistema de socios a liderar esta transformación — permitiendo a los operadores de fábricas de IA mantenerse a la vanguardia de las cargas de trabajo de IA en constante evolución, minimizar el tiempo de inactividad y maximizar la eficiencia.

Obtenga más información sobre Omniverso NVIDIA, mira el Nota clave del GTCregístrese para la sesión de Cadenceencs GTC para ver el Plan Omniverso en acción y leer más sobre AI fábricas.

Ver aviso respecto a la información del producto de software. NVIDIA Blog. H. M. Traducido al español

Artículos relacionados

Scroll al inicio