El profesor asociado Luca Carlone está trabajando para dar a los robots una conciencia más parecida a la humana de su entorno.
Los robots han avanzado mucho desde el Roomba. Hoy en día, los drones están empezando a hacer entregas puerta a puerta, los coches autónomos recorren algunas carreteras, los perros robot ayudan a los servicios de emergencia y cada vez hay más robots que hacen volteretas y ayudan en las fábricas. Aun así, Luca Carlone cree que lo mejor está por venir.
Carlone, que recientemente recibió la titularidad como profesor asociado en el Departamento de Aeronáutica y Astronáutica (AeroAstro) del MIT, dirige el Laboratorio SPARK, donde él y sus estudiantes están cerrando una brecha clave entre los humanos y los robots: la percepción. El grupo realiza investigaciones teóricas y experimentales, todas ellas con el objetivo de ampliar la conciencia de un robot sobre su entorno de maneras que se acerquen a la percepción humana. Y la percepción, como suele decir Carlone, es más que la detección.
Si bien los robots han crecido a pasos agigantados en términos de su capacidad para detectar e identificar objetos en su entorno, aún tienen mucho que aprender en lo que respecta a interpretar su entorno de manera más amplia. Como humanos, percibimos los objetos con un sentido intuitivo no solo de sus formas y etiquetas, sino también de su física (cómo se pueden manipular y mover) y cómo se relacionan entre sí, con su entorno más amplio y con nosotros mismos.
Ese tipo de percepción a nivel humano es lo que Carlone y su grupo esperan impartir a los robots, de manera que les permita interactuar de forma segura y fluida con las personas en sus hogares, lugares de trabajo y otros entornos no estructurados.
Desde que se incorporó a la facultad del MIT en 2017, Carlone ha liderado a su equipo en el desarrollo y la aplicación de algoritmos de percepción y comprensión de escenas para diversas aplicaciones, incluidos vehículos autónomos de búsqueda y rescate subterráneos, drones que pueden recoger y manipular objetos sobre la marcha y automóviles que se conducen solos. También podrían ser útiles para robots domésticos que siguen órdenes en lenguaje natural e incluso podrían anticipar las necesidades humanas basándose en pistas contextuales de nivel superior.
“La percepción es un gran obstáculo para que los robots nos ayuden en el mundo real”, afirma Carlone. “Si podemos añadir elementos de cognición y razonamiento a la percepción de los robots, creo que pueden resultar muy útiles”.
Ampliando horizontes
Carlone nació y creció cerca de Salerno, Italia, cerca de la pintoresca costa de Amalfi, donde era el menor de tres hermanos. Su madre es una maestra de escuela primaria jubilada que enseñaba matemáticas, y su padre es un profesor de historia y editor jubilado, que siempre ha adoptado un enfoque analítico en su investigación histórica. Es posible que los hermanos hayan adoptado inconscientemente la mentalidad de sus padres, ya que los tres se hicieron ingenieros: los dos mayores se dedicaron a la electrónica y la ingeniería mecánica, mientras que Carlone se decantó por la robótica, o mecatrónica, como se la conocía en ese momento.
Sin embargo, no se dedicó a este campo hasta finales de sus estudios universitarios. Carlone asistió a la Universidad Politécnica de Turín, donde se centró inicialmente en el trabajo teórico, específicamente en la teoría del control, un campo que aplica las matemáticas para desarrollar algoritmos que controlan automáticamente el comportamiento de los sistemas físicos, como las redes eléctricas, los aviones, los automóviles y los robots. Luego, en su último año, Carlone se inscribió en un curso sobre robótica que exploraba los avances en la manipulación y cómo se pueden programar los robots para moverse y funcionar.
“Fue amor a primera vista. Utilizar algoritmos y matemáticas para desarrollar el cerebro de un robot y lograr que se mueva e interactúe con el entorno es una de las experiencias más satisfactorias”, afirma Carlone. “Decidí inmediatamente que esto es lo que quiero hacer en la vida”.
Carlone realizó un programa de doble titulación en la Universidad Politécnica de Turín y la Universidad Politécnica de Milán, donde obtuvo un máster en mecatrónica e ingeniería de automatización, respectivamente. Como parte de este programa, llamado Alta Scuola Politecnica, Carlone también realizó cursos de gestión, en los que él y estudiantes de diversos orígenes académicos tuvieron que trabajar en equipo para conceptualizar, construir y elaborar un discurso de marketing para el diseño de un nuevo producto. El equipo de Carlone desarrolló una lámpara de mesa sin contacto diseñada para seguir los comandos accionados con la mano del usuario. El proyecto lo impulsó a pensar en la ingeniería desde diferentes perspectivas.
“Fue como tener que hablar distintos idiomas”, afirma. “Fue una exposición temprana a la necesidad de mirar más allá de la burbuja de la ingeniería y pensar en cómo crear trabajo técnico que pueda tener un impacto en el mundo real”.
La próxima generación
Carlone se quedó en Turín para realizar su doctorado en mecatrónica. Durante ese tiempo, tuvo libertad para elegir el tema de su tesis, algo que abordó, como él mismo recuerda, “de manera un tanto ingenua”.
“Estaba explorando un tema que la comunidad consideraba bien comprendido y sobre el cual muchos investigadores creían que no había nada más que decir”, afirma Carlone. “Subestimé lo establecido que estaba el tema y pensé que aún podía aportar algo nuevo, y tuve la suerte de poder hacerlo”.
El tema en cuestión era la “localización y mapeo simultáneos” o SLAM, el problema de generar y actualizar un mapa del entorno de un robot mientras se hace un seguimiento simultáneo de dónde se encuentra el robot dentro de ese entorno. Carlone ideó una forma de replantear el problema, de modo que los algoritmos pudieran generar mapas más precisos sin tener que empezar con una suposición inicial, como hacían la mayoría de los métodos SLAM en ese momento. Su trabajo ayudó a abrir un campo en el que la mayoría de los expertos en robótica pensaban que no se podía hacer nada mejor que los algoritmos existentes.
“SLAM trata de descifrar la geometría de las cosas y cómo se mueve un robot entre ellas”, dice Carlone. “Ahora soy parte de una comunidad que se pregunta cuál es la próxima generación de SLAM”.
En busca de una respuesta, aceptó un puesto de posdoctorado en Georgia Tech, donde se sumergió en la codificación y la visión artificial, un campo que, en retrospectiva, puede haberse inspirado en un roce con la ceguera: mientras terminaba su doctorado en Italia, sufrió una complicación médica que afectó gravemente su visión.
“En un año, fácilmente podría haber perdido un ojo”, dice Carlone. “Eso fue algo que me hizo pensar en la importancia de la visión y de la visión artificial”.
Pudo recibir una buena atención médica y la afección se curó por completo, de modo que pudo continuar con su trabajo. En Georgia Tech, su asesor, Frank Dellaert , le mostró formas de codificar en visión artificial y formular representaciones matemáticas elegantes de problemas tridimensionales complejos. Su asesor también fue uno de los primeros en desarrollar una biblioteca SLAM de código abierto, llamada GTSAM , que Carlone reconoció rápidamente como un recurso invaluable. En términos más generales, vio que hacer que el software estuviera disponible para todos desbloqueaba un enorme potencial de progreso en la robótica en su conjunto.
“Históricamente, el progreso en SLAM ha sido muy lento, porque la gente mantenía sus códigos privados y cada grupo tenía que empezar básicamente desde cero”, dice Carlone. “Luego comenzaron a aparecer los pipelines de código abierto, y eso fue un punto de inflexión, que ha impulsado en gran medida el progreso que hemos visto en los últimos 10 años”.
IA espacial
Después de su paso por Georgia Tech, Carlone llegó al MIT en 2015 como posdoctorado en el Laboratorio de Sistemas de Información y Decisión (LIDS). Durante ese tiempo, colaboró con Sertac Karaman, profesor de aeronáutica y astronáutica, en el desarrollo de software para ayudar a los drones del tamaño de la palma de la mano a navegar por sus alrededores utilizando muy poca energía a bordo. Un año después, fue ascendido a científico investigador y, en 2017, Carlone aceptó un puesto de profesor en AeroAstro.
“Una de las cosas que me encantó del MIT fue que todas las decisiones están motivadas por preguntas como: ¿Cuáles son nuestros valores? ¿Cuál es nuestra misión? Nunca se trata de ganancias de bajo nivel. La motivación es realmente cómo mejorar la sociedad”, dice Carlone. “Como mentalidad, eso ha sido muy refrescante”.
En la actualidad, el grupo de Carlone está desarrollando formas de representar el entorno de un robot, más allá de caracterizar su forma geométrica y su semántica. Está utilizando el aprendizaje profundo y grandes modelos de lenguaje para desarrollar algoritmos que permitan a los robots percibir su entorno a través de una lente de nivel superior, por así decirlo. En los últimos seis años, su laboratorio ha publicado más de 60 repositorios de código abierto , que son utilizados por miles de investigadores y profesionales en todo el mundo. La mayor parte de su trabajo se enmarca en un campo emergente más amplio conocido como «IA espacial».
“La IA espacial es como SLAM con esteroides”, dice Carlone. “En pocas palabras, tiene que ver con permitir que los robots piensen y comprendan el mundo como lo hacen los humanos, de maneras que puedan resultar útiles”.
Se trata de una tarea enorme que podría tener consecuencias de amplio alcance, en términos de permitir que robots más intuitivos e interactivos ayuden en casa, en el lugar de trabajo, en las carreteras y en zonas remotas y potencialmente peligrosas. Carlone afirma que habrá mucho trabajo por delante para acercarse a la forma en que los humanos percibimos el mundo.
“Tengo dos hijas gemelas de dos años y las veo manipular objetos, llevar diez juguetes diferentes a la vez, moverse con facilidad por habitaciones desordenadas y adaptarse rápidamente a nuevos entornos. La percepción de los robots aún no puede igualar lo que puede hacer un niño pequeño”, afirma Carlone. “Pero tenemos nuevas herramientas en nuestro arsenal y el futuro es prometedor”. MIT News. J. Ch. Traducido al español