Los sistemas industriales y físicos basados en IA (desde humanoides hasta fábricas) se están acelerando a través del entrenamiento, la simulación y la inferencia.
ChatGPT marcó el gran momento de la IA generativa. Se pueden generar respuestas a casi cualquier consulta, lo que ayuda a transformar el trabajo digital, como la creación de contenido, la atención al cliente, el desarrollo de software y las operaciones comerciales para los trabajadores del conocimiento.
La IA física, la personificación de la inteligencia artificial en humanoides, fábricas y otros dispositivos dentro de sistemas industriales, aún no ha experimentado su momento decisivo.
Esto ha frenado a sectores como el transporte y la movilidad, la fabricación, la logística y la robótica, pero eso está a punto de cambiar gracias a tres ordenadores que combinan formación avanzada, simulación e inferencia.
El auge de la IA física y multimodal
Durante 60 años, el “Software 1.0” —código serial escrito por programadores humanos— se ejecutó en computadoras de propósito general impulsadas por CPU.
Luego, en 2012, Alex Krizhevsky, asesorado por Ilya Sutskever y Geoffrey Hinton, ganó la competencia de reconocimiento de imágenes por computadora ImageNet con AlexNet, un modelo revolucionario de aprendizaje profundo para la clasificación de imágenes.
Esto marcó el primer contacto de la industria con la IA. El avance del aprendizaje automático (redes neuronales que se ejecutan en GPU) marcó el inicio de la era del software 2.0.
Hoy en día, el software escribe software. Las cargas de trabajo informáticas del mundo están pasando de la computación de propósito general en CPU a la computación acelerada en GPU, dejando muy atrás la ley de Moore.
Con IA generativa se han entrenado modelos de difusión y transformadores multimodales para generar respuestas.
Los modelos de lenguaje de gran tamaño son unidimensionales y pueden predecir el siguiente símbolo, en modos como letras o palabras. Los modelos de generación de imágenes y videos son bidimensionales y pueden predecir el siguiente píxel.
Ninguno de estos modelos puede comprender ni interpretar el mundo tridimensional. Y ahí es donde entra en juego la IA física .
Los modelos de IA física pueden percibir, comprender, interactuar con el mundo físico y navegar por él gracias a la IA generativa. Gracias a la computación acelerada, los avances en IA física multimodal y las simulaciones físicas a gran escala están permitiendo que el mundo comprenda el valor de la IA física a través de los robots.
Un robot es un sistema que puede percibir, razonar, planificar, actuar y aprender. A menudo se piensa en robots como robots móviles autónomos (AMR), brazos manipuladores o humanoides. Pero existen muchos más tipos de encarnaciones robóticas.
En un futuro próximo, todo lo que se mueva o controle cosas que se muevan serán sistemas robóticos autónomos. Estos sistemas serán capaces de detectar su entorno y responder a él.
Todo, desde quirófanos hasta centros de datos, almacenes y fábricas, incluso sistemas de control de tráfico o ciudades inteligentes enteras, se transformarán de sistemas estáticos operados manualmente a sistemas autónomos e interactivos encarnados por IA física.
La próxima frontera: robots humanoides
Los robots humanoides son una manifestación robótica ideal para uso general porque pueden operar de manera eficiente en entornos diseñados para humanos y requieren ajustes mínimos para su implementación y operación.
Se espera que el mercado global de robots humanoides alcance los 38 mil millones de dólares en 2035, un aumento de más de seis veces respecto de los aproximadamente 6 mil millones de dólares para el período pronosticado hace casi dos años, según Goldman Sachs.
Investigadores y desarrolladores de todo el mundo están compitiendo para construir esta próxima ola de robots.
Tres computadoras para desarrollar IA física
Para desarrollar robots humanoides, se requieren tres sistemas informáticos acelerados para gestionar la IA física y el entrenamiento, la simulación y el tiempo de ejecución de los robots. Dos avances informáticos están acelerando el desarrollo de los robots humanoides: los modelos de base multimodales y las simulaciones escalables y basadas en la física de los robots y sus mundos.
Los avances en inteligencia artificial generativa están aportando percepción 3D, control, planificación de habilidades e inteligencia a los robots. La simulación de robots a escala permite a los desarrolladores refinar, probar y optimizar las habilidades de los robots en un mundo virtual que imita las leyes de la física, lo que ayuda a reducir los costos de adquisición de datos del mundo real y garantiza que puedan funcionar en entornos seguros y controlados.
NVIDIA ha construido tres computadoras y plataformas de desarrollo acelerado para permitir a los desarrolladores crear IA física.
En primer lugar, los modelos se entrenan en una supercomputadora . Los desarrolladores pueden usar NVIDIA NeMo en la plataforma NVIDIA DGX para entrenar y ajustar modelos de IA generativos y de base potentes. También pueden aprovechar el Proyecto GR00T de NVIDIA , una iniciativa para desarrollar modelos de base de uso general para robots humanoides que les permitan comprender el lenguaje natural y emular movimientos mediante la observación de acciones humanas.
En segundo lugar, NVIDIA Omniverse , que se ejecuta en servidores NVIDIA OVX , proporciona la plataforma de desarrollo y el entorno de simulación para probar y optimizar la IA física con interfaces y marcos de programación de aplicaciones como NVIDIA Isaac Sim .
Los desarrolladores pueden utilizar Isaac Sim para simular y validar modelos de robots, o generar cantidades masivas de datos sintéticos basados en la física para iniciar el entrenamiento de modelos de robots. Los investigadores y desarrolladores también pueden utilizar NVIDIA Isaac Lab , un marco de aprendizaje de robots de código abierto que potencia el aprendizaje por refuerzo y el aprendizaje por imitación de robots, para ayudar a acelerar el entrenamiento y el refinamiento de políticas de robots.
Por último, los modelos de IA entrenados se implementan en una computadora en tiempo de ejecución. Las computadoras robóticas NVIDIA Jetson Thor están diseñadas específicamente para necesidades informáticas compactas integradas. Un conjunto de modelos que consta de modelos de políticas de control, visión y lenguaje compone el cerebro del robot y se implementa en un sistema informático de borde integrado y de bajo consumo energético .
Dependiendo de sus flujos de trabajo y áreas de desafío, los fabricantes de robots y los desarrolladores de modelos base pueden utilizar tantas plataformas y sistemas informáticos acelerados como necesiten.
Construyendo la próxima ola de instalaciones autónomas
Las instalaciones robóticas son el resultado de la culminación de todas estas tecnologías.
Fabricantes como Foxconn o empresas de logística como Amazon Robotics pueden organizar equipos de robots autónomos para trabajar junto a trabajadores humanos y monitorear las operaciones de la fábrica a través de cientos o miles de sensores.
Estos almacenes, plantas y fábricas autónomas tendrán gemelos digitales . Los gemelos digitales se utilizan para la planificación y optimización del diseño, la simulación de operaciones y, lo más importante, las pruebas de software en el circuito de la flota de robots.
“Mega”, desarrollado sobre Omniverse, es un modelo para gemelos digitales de fábrica que permite a las empresas industriales probar y optimizar sus flotas de robots en simulación antes de implementarlos en fábricas físicas. Esto ayuda a garantizar una integración perfecta, un rendimiento óptimo y una interrupción mínima.
Mega permite a los desarrolladores poblar sus gemelos digitales de fábrica con robots virtuales y sus modelos de IA, o los cerebros de los robots. Los robots en el gemelo digital ejecutan tareas percibiendo su entorno, razonando, planificando su próximo movimiento y, finalmente, completando las acciones planificadas.
Estas acciones son simuladas en el entorno digital por el simulador mundial de Omniverse, y los resultados son percibidos por los cerebros del robot a través de la simulación de sensores de Omniverse.
Con simulaciones de sensores , los cerebros del robot deciden la siguiente acción y el bucle continúa, todo mientras Mega rastrea meticulosamente el estado y la posición de cada elemento dentro del gemelo digital de la fábrica.
Esta metodología avanzada de pruebas de software en el circuito permite a las empresas industriales simular y validar cambios dentro de los límites seguros del gemelo digital Omniverse, ayudándolas a anticipar y mitigar posibles problemas para reducir el riesgo y los costos durante la implementación en el mundo real.
Cómo potenciar el ecosistema de desarrolladores con la tecnología NVIDIA
NVIDIA acelera el trabajo del ecosistema global de desarrolladores de robótica y creadores de modelos básicos de robots con tres computadoras.
Universal Robots , una empresa de Teradyne Robotics, utilizó NVIDIA Isaac Manipulator , bibliotecas aceleradas Isaac y modelos de IA, y NVIDIA Jetson Orin para crear UR AI Accelerator , un kit de herramientas de hardware y software listo para usar que permite a los desarrolladores de cobots crear aplicaciones, acelerar el desarrollo y reducir el tiempo de comercialización de productos de IA.
RGo Robotics utilizó NVIDIA Isaac Perceptor para ayudar a sus AMR wheel.me a trabajar en todas partes, en todo momento, y a tomar decisiones inteligentes al brindarles una percepción similar a la humana e información visual-espacial.
Los fabricantes de robots humanoides, incluidos 1X Technologies, Agility Robotics, Apptronik, Boston Dynamics, Fourier, Galbot, Mentee, Sanctuary AI, Unitree Robotics y XPENG Robotics, están adoptando la plataforma de desarrollo robótico de NVIDIA .
Boston Dynamics está utilizando a Isaac Sim e Isaac Lab para construir robots cuadrúpedos y humanoides para aumentar la productividad humana, abordar la escasez de mano de obra y priorizar la seguridad en los almacenes.
Fourier está recurriendo a Isaac Sim para entrenar robots humanoides para que operen en campos que exigen altos niveles de interacción y adaptabilidad, como la investigación científica, la atención médica y la fabricación.
Utilizando Isaac Lab e Isaac Sim, Galbot avanzó en el desarrollo de un conjunto de datos de agarre diestro robótico a gran escala llamado DexGraspNet que se puede aplicar a diferentes manos robóticas diestras, así como un entorno de simulación para evaluar modelos de agarre diestro.
Field AI desarrolló modelos básicos multitarea y multipropósito con límites de riesgo para que los robots operen de manera segura en entornos de campo al aire libre, utilizando la plataforma Isaac y Isaac Lab.
La era de la IA física ha llegado y está transformando las industrias pesadas y la robótica del mundo.
Comience a utilizar NVIDIA Robotics . Nvidia. M. H. Traducido al español