Los robots humanoides presentan un desafío multifacético en la intersección de la mecatrónica, la teoría de control y la inteligencia artificial.
La dinámica y el control de los robots humanoides son complejos y requieren herramientas, técnicas y algoritmos avanzados para mantener el equilibrio durante las tareas de locomoción y manipulación. La recopilación de datos del robot y la integración de sensores también plantean desafíos importantes, ya que los robots humanoides requieren una fusión de sensores sofisticados y cámaras de alta resolución para percibir el entorno de manera efectiva y razonar cómo interactuar con el entorno en tiempo real. Las demandas computacionales para el procesamiento en tiempo real de datos sensoriales y la toma de decisiones también requieren computadoras potentes a bordo.
El desarrollo de tecnologías, herramientas y modelos básicos de robots que permitan un comportamiento adaptativo de los robots y faciliten la interacción natural entre humanos y robots sigue siendo un objetivo de investigación en curso. NVIDIA Project GR00T es una iniciativa de investigación activa que tiene como objetivo permitir que el ecosistema de robots humanoides de los constructores acelere estos esfuerzos de desarrollo de robots avanzados de próxima generación. En esta publicación, analizaremos los nuevos flujos de trabajo de GR00T para el desarrollo de humanoides, incluidos:
- GR00T-Gen para la generación de entornos diversos
- GR00T-Mimic para generación de movimiento y trayectoria de robots
- GR00T-Destreza para manipulación diestra y de grano fino
- GR00T-Movilidad para locomoción y navegación
- GR00T-Control para el control de todo el cuerpo (WBC)
- GR00T-Percepción para detección multimodal
GR00T-Gen para la generación de entornos diversos
GR00T-Gen es un flujo de trabajo para generar tareas de robot y entornos listos para simulación en OpenUSD para entrenar robots generalistas para realizar manipulación, locomoción y navegación.
Para que el aprendizaje de los robots sea sólido , es importante entrenarlos en entornos diversos con una variedad de objetos y escenas. Generar una gran variedad de entornos en el mundo real suele ser costoso, requiere mucho tiempo y no es accesible para la mayoría de los desarrolladores, lo que hace que la simulación sea una alternativa atractiva.
GR00T-Gen ofrece entornos realistas y diversos centrados en el ser humano, creados mediante modelos de lenguaje de gran tamaño (LLM) y modelos de IA generativos en 3D. Cuenta con más de 2500 recursos en 3D que abarcan más de 150 categorías de objetos. Para crear escenas visualmente diversas, se incluyen múltiples texturas para la aleatorización de dominios en la simulación. La aleatorización de dominios permite que los modelos y las políticas entrenados se generalicen de manera efectiva cuando se implementan en el mundo real.
GR00T-Gen proporciona soporte entre encarnaciones para manipuladores móviles y robots humanoides e incluye más de 100 tareas como abrir puertas, presionar botones y navegar.
GR00T-Mimic para generación de movimiento y trayectoria de robots
GR00T-Mimic es un flujo de trabajo sólido para generar datos de movimiento a partir de demostraciones teleoperadas para el aprendizaje por imitación. El aprendizaje por imitación es un enfoque para entrenar robots en el que estos adquieren habilidades a través de la observación y la réplica de acciones demostradas por un profesor. Un componente fundamental de este proceso de entrenamiento es el volumen y la calidad de los datos de demostración disponibles.
Para que los robots humanoides puedan desenvolverse de manera eficaz y segura en entornos centrados en humanos, es importante que sus “maestros” sean demostradores humanos, lo que les permite aprender imitando el comportamiento humano. Sin embargo, surge un desafío importante debido a la escasez de datos de entrenamiento de alta calidad existentes.
Para abordar este problema, es necesario desarrollar conjuntos de datos extensos que capturen las acciones humanas. Un método prometedor para generar estos datos es la teleoperación, en la que un operador humano controla de forma remota un robot para demostrar tareas específicas. Si bien la teleoperación puede producir datos de demostración de alta fidelidad, está limitada por la cantidad de personas que pueden acceder a estos sistemas en un momento dado.
GR00T-Mimic tiene como objetivo ampliar la cadena de recolección de datos. El enfoque implica reunir una cantidad limitada de demostraciones humanas en el mundo físico utilizando dispositivos de realidad extendida (XR) y computación espacial como Apple Vision Pro. Estas demostraciones iniciales se utilizan luego para generar datos de movimiento sintéticos, lo que amplía de manera efectiva el conjunto de datos de demostración. El objetivo es crear un repositorio integral de acciones humanas para que los robots aprendan de ellas, mejorando así su capacidad para realizar tareas en entornos del mundo real.
Para respaldar aún más a GR00T-Mimic, NVIDIA Research también lanzó SkillMimicGen , un primer paso fundamental para resolver tareas de manipulación del mundo real con demostraciones humanas mínimas.
GR00T-Destreza para manipulación diestra y de grano fino
GR00T-Dexterity es un conjunto de modelos y políticas para la manipulación diestra de grano fino y flujos de trabajo de referencia para desarrollarlos.
El agarre tradicional de los robots requiere la integración de múltiples componentes complejos, desde la identificación de los puntos de agarre hasta la planificación de los movimientos y el control de los dedos. En el caso de los robots con muchos actuadores, la gestión de estos sistemas (especialmente mediante el uso de máquinas de estado para gestionar fallos como agarres fallidos) hace que el agarre de extremo a extremo sea un desafío importante.
GR00T-Dexterity presenta un flujo de trabajo que aprovecha el artículo de investigación DextrAH-G . Es un enfoque basado en el aprendizaje de refuerzo (RL) para el desarrollo de políticas para la destreza de los robots. Este flujo de trabajo permite la creación de un sistema de agarre de extremo a extremo, de píxeles a acción, entrenado en simulación e implementable en un robot físico. El flujo de trabajo está diseñado para producir políticas capaces de un agarre rápido y reactivo con entrada de flujo de profundidad, y es generalizable a nuevos objetos.
El proceso implica la creación de una estructura geométrica para definir el espacio de movimiento del robot y simplificar las acciones de agarre, optimizada para el entrenamiento en paralelo. Mediante el uso de NVIDIA Isaac Lab , se entrena una política guiada por la estructura mediante la aplicación del aprendizaje de refuerzo en varias GPU para generalizar los comportamientos de agarre. Por último, la política aprendida se destila en una versión lista para el mundo real mediante la entrada de profundidad a través del aprendizaje por imitación, lo que produce una política sólida en unas pocas horas.
https://www.youtube.com/embed/u9raCniU0nI?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 1. Entrenamiento en simulación con NVIDIA Isaac Lab
https://www.youtube.com/embed/cnYCq5NmiII?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 2. Movimiento errático del robot durante el entrenamiento de una tarea de agarre sin telas geométricas
https://www.youtube.com/embed/Zp6zmfSlRI4?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 3. Cómo evitar daños en el hardware al transferir la política al mundo real con una demostración de empaquetado de contenedores en un brazo robótico físico utilizando el flujo de trabajo GR00T-Dexterity
Tenga en cuenta que la vista previa del flujo de trabajo GR00T-Dexterity se basa en el documento de investigación de NVIDIA, DextrAH-G: Pixels-to-Action Dexterous Arm-Hand Grasping with Geometric Fabrics y se ha migrado de NVIDIA Isaac Gym (obsoleto) a Isaac Lab. Si es un usuario actual de Isaac Gym, siga los tutoriales y la guía de migración para comenzar a usar Isaac Lab.
GR00T-Movilidad para locomoción y navegación
GR00T-Mobility es un conjunto de modelos y políticas para la locomoción y la navegación y flujos de trabajo de referencia para desarrollarlos.
Los métodos de navegación clásicos tienen dificultades en entornos saturados y exigen un ajuste exhaustivo, mientras que los enfoques basados en el aprendizaje enfrentan desafíos a la hora de generalizarse a nuevos entornos.
GR00T-Mobility presenta un nuevo flujo de trabajo basado en RL y aprendizaje por imitación (IL) respaldado por Isaac Lab, diseñado para crear un generalista de movilidad para la navegación en diferentes configuraciones y realizaciones.
Al aprovechar el modelado del mundo con NVIDIA Isaac Sim , este flujo de trabajo genera una representación latente enriquecida de la dinámica del entorno, lo que permite un entrenamiento más adaptable. El flujo de trabajo desvincula el modelado del mundo del aprendizaje de políticas de acción y el ajuste fino del RL, lo que mejora la flexibilidad y admite diversas fuentes de datos para una mayor generalización.
Un modelo entrenado (usando este flujo de trabajo) únicamente con conjuntos de datos sintéticos fotorrealistas de Isaac Sim permite una transferencia de simulación a realidad sin disparos y se puede aplicar a una variedad de realizaciones, incluidos los de conducción diferencial, Ackermann, cuadrúpedos y humanoides.
Este flujo de trabajo se basa en los esfuerzos de investigación aplicada de NVIDIA presentados en X-MOBILITY: Navegación generalizable de extremo a extremo mediante modelado mundial .
https://www.youtube.com/embed/SgM0IM-J3hA?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 4. Al probar GR00T-Mobility en un robot simulado, el robot se desplaza con éxito por entornos desordenados y evita obstáculos.
https://www.youtube.com/embed/oQqDr7WXVlg?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 5. Al probar GR00T-Mobility en un robot real, el robot se desplaza con éxito por un entorno de laboratorio mientras evita cajas y obstáculos.
https://www.youtube.com/embed/-a4arsvFUzQ?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 6. Robots humanoides, cuadrúpedos y montacargas navegando con éxito por un entorno de almacén simulado en Isaac Sim
GR00T-Control para el control de todo el cuerpo
GR00T-Control es un conjunto de bibliotecas, modelos, políticas y flujos de trabajo de referencia de planificación y control de movimiento avanzados para desarrollar WBC. Los flujos de trabajo de referencia utilizan varias plataformas, modelos preentrenados y bibliotecas aceleradas.
Para lograr un control preciso y receptivo de robots humanoides, especialmente en tareas que requieren destreza y locomoción, el WBC es esencial. GR00T-Control presenta una alternativa basada en el aprendizaje al control predictivo de modelos (MPC) tradicional con un flujo de trabajo integrado con Isaac Lab desarrollado por el equipo de investigación aplicada de NVIDIA. Este trabajo se basa en el trabajo de investigación original presentado en OmniH2O: Universal and Dexterous Human-to-Humanoid Whole-Body Teleoperation and Learning , así como en el recién lanzado HOVER: Versatile Neural Whole-Body Controller for Humanoid Robots .
Este flujo de trabajo de referencia permite el desarrollo de políticas de control de humanoides de cuerpo completo (política WBC) tanto para teleoperación como para control autónomo. Para la teleoperación de OmniH2O, los métodos de entrada como los cascos de realidad virtual, las cámaras RGB y los comandos verbales permiten un control humano de alta precisión. Mientras tanto, el marco de destilación de políticas multimodo de HOVER facilita transiciones fluidas entre los modos de tareas autónomas, lo que lo hace adaptable para tareas complejas.
El flujo de trabajo de políticas de WBC utiliza un proceso de aprendizaje de simulación a realidad. Comienza por entrenar una política de control privilegiada en simulación con aprendizaje de refuerzo utilizando Isaac Lab, que sirve como modelo «profesor» con acceso a datos de movimiento detallados. Luego, este modelo se destila en una versión del mundo real que se puede implementar y que es capaz de operar con información sensorial limitada, lo que permite abordar desafíos como demoras en la teleoperación, información restringida de realidad virtual o seguimiento visual (para OmniH2O) y adaptabilidad en múltiples modos de tareas autónomas (para HOVER).
Una política de control de cuerpo completo (desarrollada utilizando el flujo de trabajo OmniH2O) proporciona 19 grados de libertad para un control preciso del robot humanoide.
https://www.youtube.com/embed/zoOXXgraSAw?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 7. Política basada en el flujo de trabajo de GR00T-Control entrenada en NVIDIA Isaac Lab. Los cuadros rojos son las posiciones del cuerpo del robot de referencia del conjunto de datos. El robot está siguiendo el movimiento de referencia.
https://www.youtube.com/embed/KSKkTF9i0pA?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 8. Entrenando a miles de robots humanoides en el laboratorio Isaac
GR00T-Control ofrece a los especialistas en robótica herramientas para una mayor exploración del WBC basado en el aprendizaje para humanoides.
GR00T-Percepción para detección multimodal
GR00T-Perception es un conjunto de bibliotecas de percepción avanzadas (como nvblox y cuVSLAM ), modelos básicos (como FoundationPose y RT-DETR ) y flujos de trabajo de referencia creados en Isaac Sim y NVIDIA Isaac ROS . Los flujos de trabajo de referencia muestran cómo utilizar estas plataformas, modelos preentrenados y bibliotecas aceleradas en conjunto en soluciones robóticas.
Una nueva incorporación clave a GR00T-Perception es ReMEmbR , un flujo de trabajo de referencia de investigación aplicada que mejora la interacción entre humanos y robots al permitir que los robots «recuerden» largas historias de eventos, lo que mejora significativamente las respuestas personalizadas y conscientes del contexto. Este flujo de trabajo integra modelos de lenguaje de visión, LLM y memoria aumentada por recuperación para impulsar la percepción, la cognición y la adaptabilidad en robots humanoides.
ReMEmbR permite a los robots retener información contextual a lo largo del tiempo, lo que mejora la percepción espacial, la navegación y la eficiencia de la interacción al integrar datos sensoriales como imágenes y sonidos. Sigue un proceso estructurado de creación y consulta de memoria y se puede implementar en NVIDIA Jetson AGX Orin en robots reales.
Para obtener más información sobre ReMEmbR, consulte Uso de IA generativa para permitir que los robots razonen y actúen con ReMEmbR .
https://www.youtube.com/embed/JlYVBAQC0tQ?version=3&rel=1&showsearch=0&showinfo=1&iv_load_policy=1&fs=1&hl=en-US&autohide=2&wmode=transparentVídeo 9. Descubra cómo los robots utilizan la IA generativa para razonar y actuar con ReMEmbR
Conclusión
Con NVIDIA Project GR00T estamos creando tecnología avanzada, herramientas y flujos de trabajo GR00T que se pueden utilizar de forma independiente o en conjunto según las necesidades de los desarrolladores de robots humanoides. Estas mejoras contribuyen al desarrollo de robots humanoides más inteligentes, adaptables y capaces, ampliando los límites de lo que estos robots pueden lograr en aplicaciones del mundo real.
Empresas líderes en robótica : 1X, Agility Robotics , The AI Institute, Berkeley Humanoid , Boston Dynamics , Field AI , Fourier , Galbot , Mentee Robotics , Skild AI, Swiss-Mile, Unitree Robotics y XPENG Robotics.
Obtenga más información sobre NVIDIA en CoRL 2024, incluidos 21 artículos y nueve talleres relacionados con el aprendizaje de robots, capacitación publicada y guías de flujo de trabajo para desarrolladores.
Empieza ahora
Comience a usar Isaac Lab o migre de Isaac Gym a Isaac Lab con nuevas guías y tutoriales de incorporación para desarrolladores . Consulte la arquitectura de referencia de Isaac Lab para comprender el proceso de aprendizaje de robots de principio a fin con Isaac Lab e Isaac Sim.
Descubra lo último en aprendizaje y simulación de robots en la transmisión en vivo el 13 de noviembre y no se pierda el horario de atención del laboratorio NVIDIA Isaac para obtener asistencia y conocimientos prácticos.
Si eres una empresa de robots humanoides que desarrolla software o hardware para el ecosistema humanoide, solicita unirte al Programa para desarrolladores de robots humanoides de NVIDIA . NVIDIA Blog. A. B. Y. CH. Traducido al español