El Portal de las Tecnologías para la Innovación

Categoría: La IA aplicada a la Educación

Usando IA, estos robots aprenden habilidades complicadas con una precisión sorprendente

Investigadores de UC Berkeley idearon una forma rápida y precisa de enseñar a los robots tareas como ensamblar una placa base o un cajón de IKEA. En la Universidad de California en Berkeley, los investigadores del Laboratorio de Inteligencia Artificial y Aprendizaje Robótico de Sergey Levine observaron una mesa en la que se encontraba una torre de 39 bloques de Jenga perfectamente apilados. Entonces, un robot blanco y negro, con una sola extremidad doblada como una jirafa encorvada, se dirigió a toda velocidad hacia la torre blandiendo un látigo de cuero negro. A través de lo que podría haber parecido a un milagro de la física para un observador casual, el látigo golpeó exactamente en el lugar correcto para hacer que un solo bloque saliera volando de la pila mientras que el resto de la torre permaneció estructuralmente sólida. Esta tarea, conocida como «Jenga whipping», es un pasatiempo que practican las personas con la destreza y los reflejos necesarios para realizarla. Ahora, los robots la han dominado gracias a un novedoso método de entrenamiento impulsado por IA. Al aprender de las demostraciones y los comentarios humanos, así como de sus propios intentos en el mundo real, este protocolo de entrenamiento enseña a los robots a realizar tareas complicadas como Jenga whipping con una tasa de éxito del 100%. Además, los robots aprenden a una velocidad impresionante, lo que les permite aprender en una o dos horas cómo ensamblar perfectamente una placa base de computadora, construir un estante y más. Impulsado por la IA, el campo del aprendizaje robótico ha buscado resolver el desafío de cómo enseñar a las máquinas actividades que son impredecibles o complicadas, en lugar de una única acción, como recoger repetidamente un objeto de un lugar determinado en una cinta transportadora. Para resolver este dilema, el laboratorio de Levine se ha centrado en lo que se llama «aprendizaje de refuerzo». El investigador postdoctoral Jianlan Luo explicó que en el aprendizaje de refuerzo, un robot intenta realizar una tarea en el mundo real y, utilizando la retroalimentación de las cámaras, aprende de sus errores para finalmente dominar esa habilidad. Cuando el equipo anunció por primera vez un nuevo paquete de software que utiliza este enfoque a principios de 2024, Luo dijo que se sintieron alentados por el hecho de que otros podrían replicar rápidamente su éxito utilizando el software de código abierto por su cuenta. Este otoño, el equipo de investigación de Levine, Luo, Charles Xu, Zheyuan Hu y Jeffrey Wu publicó un informe técnico sobre su sistema más reciente, el que superó con creces el Jenga. Esta versión nueva y mejorada agregó la intervención humana. Con un ratón especial que controla el robot, un humano puede corregir el curso del robot, y esas correcciones pueden incorporarse al proverbial banco de memoria del robot. Mediante un método de inteligencia artificial llamado aprendizaje de refuerzo, el robot analiza la suma de todos sus intentos (asistidos y no asistidos, exitosos y fallidos) para realizar mejor su tarea. Luo dijo que un humano necesitaba intervenir cada vez menos a medida que el robot aprendía de la experiencia. «Tuve que cuidar al robot durante quizás el primer 30% o algo así, y luego, gradualmente, pude prestarle menos atención», dijo. El laboratorio sometió a su sistema robótico a una serie de tareas complicadas que iban más allá de las de Jenga. El robot dio vuelta un huevo en una sartén, pasó un objeto de un brazo a otro y montó una placa base, un salpicadero de coche y una correa de distribución. Los investigadores seleccionaron estos desafíos porque eran variados y, en palabras de Luo, representaban “todo tipo de incertidumbre a la hora de realizar tareas robóticas en el complejo mundo real”.  La tarea de la correa de distribución se destacó en términos de dificultad. Cada vez que el robot interactuaba con la correa de distribución (imagínese tratar de manipular una cadena de collar flexible sobre dos clavijas), necesitaba anticipar y reaccionar a ese cambio. El juego de Jenga constituye un desafío diferente. Implica leyes físicas que son difíciles de modelar, por lo que es menos eficiente entrenar a un robot utilizando únicamente simulaciones; la experiencia en el mundo real fue fundamental.  Los investigadores también probaron la adaptabilidad de los robots simulando accidentes. Obligaban a abrir una pinza para que dejara caer un objeto o moviera una placa base mientras el robot intentaba instalar un microchip, entrenándolo para que reaccionara a una situación cambiante que pudiera encontrar fuera de un entorno de laboratorio. Al final del entrenamiento, el robot podía ejecutar estas tareas correctamente el 100% del tiempo. Los investigadores compararon sus resultados con un método común de “copiar mi comportamiento” conocido como clonación conductual que se entrenó con la misma cantidad de datos de demostración; su nuevo sistema hizo que los robots fueran más rápidos y precisos. Estas métricas son cruciales, dijo Luo, porque el listón para la competencia de los robots es muy alto. Los consumidores habituales y los industriales por igual no quieren comprar un robot inconsistente. Luo enfatizó que, en particular, los procesos de fabricación “hechos a pedido” como los que se usan a menudo para la electrónica, los automóviles y las piezas aeroespaciales podrían beneficiarse de robots que pueden aprender de manera confiable y adaptable una variedad de tareas. La primera vez que el robot superó el desafío del látigo de Jenga, «eso realmente me sorprendió», dijo Luo. «La tarea de Jenga es muy difícil para la mayoría de los humanos. Lo intenté con un látigo en la mano; tuve un 0% de éxito». E incluso cuando se compara con un humano experto en el látigo de Jenga, agregó, el robot probablemente superará al humano porque no tiene músculos que se cansen con el tiempo. El nuevo sistema de aprendizaje del laboratorio de Levine forma parte de una tendencia más amplia en materia de innovación en robótica. En los últimos dos años, este campo en general ha avanzado a pasos agigantados, impulsado por la inversión de la industria y la inteligencia artificial, que proporciona a los

Leer más »

La inteligencia artificial y la tecnología cuántica impulsan el descubrimiento de péptidos para la limpieza de microplásticos

Un equipo de investigación dirigido por Cornell ha demostrado cómo la computación cuántica y la inteligencia artificial pueden utilizarse para diseñar nuevos péptidos capaces de capturar microplásticos que suponen graves riesgos para los ecosistemas y la salud humana. Los péptidos (cadenas de aminoácidos que pueden secuenciarse para funciones específicas) pueden destruir los microplásticos al unirse a sus superficies y facilitar las reacciones químicas que los descomponen. Sin embargo, no se conocen aglutinantes peptídicos para muchos plásticos y su creación es un desafío debido a la falta de datos sobre la adsorción de plásticos. Un  estudio publicado el 18 de diciembre en Science Advances detalla un método para integrar modelos de IA generativos entrenados para predecir propiedades de péptidos con técnicas de computación cuántica que optimizan estos diseños para plásticos específicos. Este enfoque permite una exploración rápida de una amplia gama de posibles secuencias de aminoácidos, lo que permite el descubrimiento de nuevos tipos de péptidos más rápidamente que el proceso iterativo de probar cada combinación individualmente. “Los científicos no tienen realmente los conjuntos de datos necesarios para trabajar con péptidos que atacan a los microplásticos de la misma manera que lo hacen para algunas aplicaciones médicas, y ahí es donde entra en juego la tecnología cuántica”, dijo el autor principal  Fengqi You , profesor de Ingeniería de Sistemas Energéticos de la cátedra Roxanne E. y Michael J. Zak. “Básicamente, vemos esto como un problema de IA, pero utilizamos la tecnología cuántica como un refuerzo. Puede evaluar muchas posibilidades de secuencias de aminoácidos simultáneamente y eso es diferente de lo que podemos hacer con la computación clásica”. El marco híbrido cuántico-clásico desarrollado en el estudio dio como resultado el descubrimiento de péptidos con altas afinidades de unión al tereftalato de polietileno, también conocido como plástico PET, que mantenían una solubilidad en agua respetuosa con el medio ambiente. Los resultados se validaron luego mediante simulaciones de dinámica molecular, lo que confirmó el potencial para aplicaciones prácticas en sistemas de tratamiento de agua, biosensores de microplásticos y microbios diseñados para degradar plásticos. “Este trabajo llega en un momento en el que el potencial transformador de la IA ha sido reconocido a nivel mundial para aplicaciones como la predicción de la estructura de las proteínas y otras aplicaciones biológicas y médicas”, afirmó You, quien también es codirector del  Instituto de IA para la Ciencia de la Universidad de Cornell . “Este nuevo marco híbrido de computación cuántica-clásica extiende el impacto de la IA a la ciencia ambiental”. Agregó que el marco está diseñado para funcionar dentro de las limitaciones actuales de la computación cuántica, aprovechando simulaciones en hardware clásico y al mismo tiempo permaneciendo adaptable a los avances en la tecnología cuántica a medida que madura. El estudio fue una colaboración con Carol K. Hall ’67, profesora de ingeniería química y biomolecular en la Universidad Estatal de Carolina del Norte. Entre los primeros coautores se encuentran Raul Conchello Vendrell, un estudiante de posgrado visitante en el laboratorio de You de la ETH Zurich; el investigador postdoctoral Akshay Ajagekar, Ph.D. ’24; y Michael T. Bergman, un estudiante de doctorado de la Universidad Estatal de Carolina del Norte. El equipo de investigación llevó a cabo una investigación complementaria, aplicando computación cuántica, inteligencia artificial y modelado biofísico para diseñar péptidos para otros plásticos comunes, como el polietileno y el polipropileno. Ese trabajo,  publicado el 21 de enero en PNAS Nexus, tiene a Jeet Dhoriyani, MS ’24, como primer autor. El estudio optimizó las secuencias de aminoácidos para una unión fuerte y exploró la diversidad fisicoquímica, lo que permite que los péptidos funcionen en diferentes condiciones ambientales. Dijo que los próximos esfuerzos se centrarán en sintetizar y probar los péptidos recién descubiertos en entornos de laboratorio y de campo. Además, los investigadores planean perfeccionar los marcos computacionales para abordar otros desafíos de sostenibilidad. La investigación fue apoyada por la National Science Foundation y la Beca Postdoctoral Eric y Wendy Schmidt AI in Science, un programa de Schmidt Sciences. Cornell University. S. K. Traducido al español

Leer más »

Un nuevo enfoque de entrenamiento podría ayudar a los agentes de IA a desempeñarse mejor en condiciones inciertas

A veces, puede ser mejor entrenar a un robot en un entorno diferente de aquel en el que será desplegado. Un robot doméstico entrenado para realizar tareas domésticas en una fábrica puede no ser capaz de fregar eficazmente el fregadero o sacar la basura cuando se lo utiliza en la cocina de un usuario, ya que este nuevo entorno difiere de su espacio de entrenamiento. Para evitar esto, los ingenieros a menudo intentan hacer coincidir el entorno de entrenamiento simulado lo más fielmente posible con el mundo real donde se implementará el agente. Sin embargo, investigadores del MIT y de otros lugares han descubierto que, a pesar de esta creencia convencional, a veces el entrenamiento en un entorno completamente diferente produce un agente de inteligencia artificial con mejor rendimiento. Sus resultados indican que, en algunas situaciones, entrenar a un agente de IA simulado en un mundo con menos incertidumbre o “ruido” le permitió desempeñarse mejor que un agente de IA competidor entrenado en el mismo mundo ruidoso que usaron para probar ambos agentes. Los investigadores llaman a este fenómeno inesperado “efecto de entrenamiento en interiores”. “Si aprendemos a jugar al tenis en un ambiente interior donde no hay ruido, podremos dominar con mayor facilidad diferentes golpes. Luego, si nos trasladamos a un entorno más ruidoso, como una cancha de tenis con viento, tendremos más probabilidades de jugar bien al tenis que si comenzamos a aprender en un entorno con viento”, explica Serena Bono, asistente de investigación en el Media Lab del MIT y autora principal de un artículo sobre el efecto del entrenamiento en interiores. Los investigadores estudiaron este fenómeno entrenando a agentes de IA para que jugaran juegos de Atari, a los que modificaron añadiendo cierta imprevisibilidad. Se sorprendieron al descubrir que el efecto del entrenamiento en interiores se producía de forma constante en todos los juegos de Atari y en todas sus variantes. Esperan que estos resultados impulsen investigaciones adicionales para desarrollar mejores métodos de entrenamiento para agentes de IA. “Se trata de un eje totalmente nuevo en el que pensar. En lugar de intentar que los entornos de entrenamiento y prueba coincidan, es posible que podamos construir entornos simulados en los que un agente de IA aprenda aún mejor”, añade el coautor Spandan Madan, estudiante de posgrado de la Universidad de Harvard. A Bono y Madan se suman en el trabajo Ishaan Grover, estudiante de posgrado del MIT; Mao Yasueda, estudiante de posgrado de la Universidad de Yale; Cynthia Breazeal, profesora de artes y ciencias de los medios y líder del Grupo de Robótica Personal del Media Lab del MIT; Hanspeter Pfister, profesor de Ciencias de la Computación de la cátedra An Wang en Harvard; y Gabriel Kreiman, profesor de la Facultad de Medicina de Harvard. La investigación se presentará en la Conferencia de la Asociación para el Avance de la Inteligencia Artificial. Problemas de entrenamiento Los investigadores se propusieron explorar por qué los agentes de aprendizaje de refuerzo tienden a tener un desempeño tan pésimo cuando se los prueba en entornos diferentes de su espacio de entrenamiento. El aprendizaje de refuerzo es un método de prueba y error en el que el agente explora un espacio de entrenamiento y aprende a realizar acciones que maximizan su recompensa. El equipo desarrolló una técnica para agregar explícitamente una cierta cantidad de ruido a un elemento del problema de aprendizaje de refuerzo, llamada función de transición. La función de transición define la probabilidad de que un agente pase de un estado a otro, en función de la acción que elija. Si el agente está jugando a Pac-Man, una función de transición podría definir la probabilidad de que los fantasmas en el tablero de juego se muevan hacia arriba, hacia abajo, hacia la izquierda o hacia la derecha. En el aprendizaje por refuerzo estándar, la IA se entrenaría y se probaría utilizando la misma función de transición. Los investigadores agregaron ruido a la función de transición con este enfoque convencional y, como se esperaba, afectó el rendimiento del agente en Pac-Man. Pero cuando los investigadores entrenaron al agente con un juego de Pac-Man sin ruido y luego lo probaron en un entorno donde inyectaron ruido en la función de transición, funcionó mejor que un agente entrenado en el juego ruidoso. “La regla general es que se debe intentar capturar la función de transición de la condición de despliegue lo mejor posible durante el entrenamiento para obtener el máximo provecho de la inversión. Pusimos a prueba esta idea hasta el cansancio porque ni nosotros mismos podíamos creerla”, afirma Madan. La inyección de distintas cantidades de ruido en la función de transición permitió a los investigadores probar muchos entornos, pero no crearon juegos realistas. Cuanto más ruido inyectaban en Pac-Man, más probable era que los fantasmas se teletransportaran aleatoriamente a diferentes casillas. Para ver si el efecto del entrenamiento en interiores se producía en los juegos normales de Pac-Man, ajustaron las probabilidades subyacentes para que los fantasmas se movieran normalmente, pero tuvieran más probabilidades de moverse hacia arriba y hacia abajo, en lugar de hacia la izquierda y la derecha. Los agentes de IA entrenados en entornos sin ruidos se desempeñaron mejor en estos juegos realistas. “No se debió únicamente a la forma en que añadimos ruido para crear entornos ad hoc. Esto parece ser una propiedad del problema del aprendizaje por refuerzo. Y fue aún más sorprendente verlo”, afirma Bono. Explicaciones de exploración Cuando los investigadores profundizaron en la búsqueda de una explicación, vieron algunas correlaciones en cómo los agentes de IA exploran el espacio de entrenamiento. Cuando ambos agentes de IA exploran básicamente las mismas áreas, el agente entrenado en el entorno sin ruido tiene un mejor desempeño, tal vez porque le resulta más fácil aprender las reglas del juego sin la interferencia del ruido. Si sus patrones de exploración son diferentes, el agente entrenado en el entorno ruidoso tiende a tener un mejor desempeño. Esto puede ocurrir porque el agente necesita comprender patrones que no puede aprender en

Leer más »

Ampliando la percepción de los robots

El profesor asociado Luca Carlone está trabajando para dar a los robots una conciencia más parecida a la humana de su entorno. Los robots han avanzado mucho desde el Roomba. Hoy en día, los drones están empezando a hacer entregas puerta a puerta, los coches autónomos recorren algunas carreteras, los perros robot ayudan a los servicios de emergencia y cada vez hay más robots que hacen volteretas y ayudan en las fábricas. Aun así, Luca Carlone cree que lo mejor está por venir. Carlone, que recientemente recibió la titularidad como profesor asociado en el Departamento de Aeronáutica y Astronáutica (AeroAstro) del MIT, dirige el Laboratorio SPARK, donde él y sus estudiantes están cerrando una brecha clave entre los humanos y los robots: la percepción. El grupo realiza investigaciones teóricas y experimentales, todas ellas con el objetivo de ampliar la conciencia de un robot sobre su entorno de maneras que se acerquen a la percepción humana. Y la percepción, como suele decir Carlone, es más que la detección. Si bien los robots han crecido a pasos agigantados en términos de su capacidad para detectar e identificar objetos en su entorno, aún tienen mucho que aprender en lo que respecta a interpretar su entorno de manera más amplia. Como humanos, percibimos los objetos con un sentido intuitivo no solo de sus formas y etiquetas, sino también de su física (cómo se pueden manipular y mover) y cómo se relacionan entre sí, con su entorno más amplio y con nosotros mismos. Ese tipo de percepción a nivel humano es lo que Carlone y su grupo esperan impartir a los robots, de manera que les permita interactuar de forma segura y fluida con las personas en sus hogares, lugares de trabajo y otros entornos no estructurados. Desde que se incorporó a la facultad del MIT en 2017, Carlone ha liderado a su equipo en el desarrollo y la aplicación de algoritmos de percepción y comprensión de escenas para diversas aplicaciones, incluidos vehículos autónomos de búsqueda y rescate subterráneos, drones que pueden recoger y manipular objetos sobre la marcha y automóviles que se conducen solos. También podrían ser útiles para robots domésticos que siguen órdenes en lenguaje natural e incluso podrían anticipar las necesidades humanas basándose en pistas contextuales de nivel superior. “La percepción es un gran obstáculo para que los robots nos ayuden en el mundo real”, afirma Carlone. “Si podemos añadir elementos de cognición y razonamiento a la percepción de los robots, creo que pueden resultar muy útiles”. Ampliando horizontes Carlone nació y creció cerca de Salerno, Italia, cerca de la pintoresca costa de Amalfi, donde era el menor de tres hermanos. Su madre es una maestra de escuela primaria jubilada que enseñaba matemáticas, y su padre es un profesor de historia y editor jubilado, que siempre ha adoptado un enfoque analítico en su investigación histórica. Es posible que los hermanos hayan adoptado inconscientemente la mentalidad de sus padres, ya que los tres se hicieron ingenieros: los dos mayores se dedicaron a la electrónica y la ingeniería mecánica, mientras que Carlone se decantó por la robótica, o mecatrónica, como se la conocía en ese momento. Sin embargo, no se dedicó a este campo hasta finales de sus estudios universitarios. Carlone asistió a la Universidad Politécnica de Turín, donde se centró inicialmente en el trabajo teórico, específicamente en la teoría del control, un campo que aplica las matemáticas para desarrollar algoritmos que controlan automáticamente el comportamiento de los sistemas físicos, como las redes eléctricas, los aviones, los automóviles y los robots. Luego, en su último año, Carlone se inscribió en un curso sobre robótica que exploraba los avances en la manipulación y cómo se pueden programar los robots para moverse y funcionar. “Fue amor a primera vista. Utilizar algoritmos y matemáticas para desarrollar el cerebro de un robot y lograr que se mueva e interactúe con el entorno es una de las experiencias más satisfactorias”, afirma Carlone. “Decidí inmediatamente que esto es lo que quiero hacer en la vida”. Carlone realizó un programa de doble titulación en la Universidad Politécnica de Turín y la Universidad Politécnica de Milán, donde obtuvo un máster en mecatrónica e ingeniería de automatización, respectivamente. Como parte de este programa, llamado Alta Scuola Politecnica, Carlone también realizó cursos de gestión, en los que él y estudiantes de diversos orígenes académicos tuvieron que trabajar en equipo para conceptualizar, construir y elaborar un discurso de marketing para el diseño de un nuevo producto. El equipo de Carlone desarrolló una lámpara de mesa sin contacto diseñada para seguir los comandos accionados con la mano del usuario. El proyecto lo impulsó a pensar en la ingeniería desde diferentes perspectivas. “Fue como tener que hablar distintos idiomas”, afirma. “Fue una exposición temprana a la necesidad de mirar más allá de la burbuja de la ingeniería y pensar en cómo crear trabajo técnico que pueda tener un impacto en el mundo real”. La próxima generación Carlone se quedó en Turín para realizar su doctorado en mecatrónica. Durante ese tiempo, tuvo libertad para elegir el tema de su tesis, algo que abordó, como él mismo recuerda, “de manera un tanto ingenua”. “Estaba explorando un tema que la comunidad consideraba bien comprendido y sobre el cual muchos investigadores creían que no había nada más que decir”, afirma Carlone. “Subestimé lo establecido que estaba el tema y pensé que aún podía aportar algo nuevo, y tuve la suerte de poder hacerlo”. El tema en cuestión era la “localización y mapeo simultáneos” o SLAM, el problema de generar y actualizar un mapa del entorno de un robot mientras se hace un seguimiento simultáneo de dónde se encuentra el robot dentro de ese entorno. Carlone ideó una forma de replantear el problema, de modo que los algoritmos pudieran generar mapas más precisos sin tener que empezar con una suposición inicial, como hacían la mayoría de los métodos SLAM en ese momento. Su trabajo ayudó a abrir un campo en el que la mayoría de los expertos en robótica pensaban que

Leer más »

Un nuevo estudio mejora la fiabilidad de las previsiones sobre energía eólica

Mediante la aplicación de técnicas de inteligencia artificial explicable, los ingenieros pueden mejorar la confianza de los usuarios en las previsiones generadas por los modelos de inteligencia artificial. Este enfoque fue probado recientemente en la generación de energía eólica por un equipo que incluye expertos de la EPFL. La inteligencia artificial explicable (XAI, por sus siglas en inglés) es una rama de la IA que ayuda a los usuarios a echar un vistazo dentro de la caja negra de los modelos de IA para comprender cómo se genera su resultado y si se puede confiar en sus pronósticos. Recientemente, la XAI ha ganado prominencia en tareas de visión artificial, como el reconocimiento de imágenes, donde la comprensión de las decisiones del modelo es fundamental. Basándose en su éxito en este campo, ahora se está extendiendo gradualmente a varios campos donde la confianza y la transparencia son particularmente importantes, incluidos la atención médica, el transporte y las finanzas. Los investigadores del Laboratorio de Ingeniería Eólica y Energías Renovables (WiRE) de la EPFL han adaptado la XAI a los modelos de IA de caja negra que se utilizan en su campo. En un estudio publicado en Applied Energy , descubrieron que la XAI puede mejorar la interpretabilidad de las previsiones de energía eólica al proporcionar información sobre la cadena de decisiones que toma un modelo de caja negra y puede ayudar a identificar qué variables se deben utilizar en la entrada de un modelo. “Para que los operadores de la red puedan integrar eficazmente la energía eólica en sus redes inteligentes, necesitan previsiones diarias fiables de la generación de energía eólica con un margen de error bajo”, afirma el profesor Fernando Porté-Agel, director de WiRE. “Las previsiones inexactas obligan a los operadores de la red a compensar en el último momento, a menudo utilizando energía basada en combustibles fósiles más cara”. Predicciones más creíbles y fiables Los modelos que se utilizan actualmente para pronosticar la producción de energía eólica se basan en dinámica de fluidos, modelado meteorológico y métodos estadísticos, pero aún tienen un margen de error nada despreciable. La IA ha permitido a los ingenieros mejorar las predicciones de energía eólica mediante el uso de datos extensos para identificar patrones entre las variables del modelo meteorológico y la producción de energía de las turbinas eólicas. Sin embargo, la mayoría de los modelos de IA funcionan como «cajas negras», lo que dificulta comprender cómo llegan a predicciones específicas. La XAI aborda este problema al brindar transparencia sobre los procesos de modelado que conducen a las predicciones, lo que da como resultado predicciones más creíbles y confiables. Variables más importantes Para llevar a cabo su estudio, el equipo de investigación entrenó una red neuronal seleccionando variables de entrada de un modelo meteorológico con una influencia significativa en la generación de energía eólica (como la dirección y la velocidad del viento, la presión atmosférica y la temperatura) junto con datos recopilados de parques eólicos en Suiza y en todo el mundo. «Adaptamos cuatro técnicas XAI y desarrollamos métricas para determinar si la interpretación de los datos por parte de una técnica es confiable», dice Wenlong Liao, autor principal del estudio y posdoctorado en WiRE. En el aprendizaje automático, las métricas son lo que los ingenieros utilizan para evaluar el rendimiento del modelo. Por ejemplo, las métricas pueden mostrar si la relación entre dos variables es causal o correlacional. Se desarrollan para aplicaciones específicas: diagnosticar una afección médica, medir la cantidad de horas perdidas por congestión de tráfico o calcular la valoración de una empresa en el mercado de valores. “En nuestro estudio, definimos varias métricas para evaluar la fiabilidad de las técnicas XAI. Además, las técnicas XAI fiables pueden señalar qué variables debemos tener en cuenta en nuestros modelos para generar pronósticos fiables”, afirma Liao. “Incluso vimos que podíamos dejar ciertas variables fuera de nuestros modelos sin que fueran menos precisos”. Más competitivo Según Jiannong Fang, científico de la EPFL y coautor del estudio, estos hallazgos podrían ayudar a que la energía eólica sea más competitiva. “Los operadores de sistemas eléctricos no se sentirán muy cómodos confiando en la energía eólica si no comprenden los mecanismos internos en los que se basan sus modelos de pronóstico”, afirma. “Pero con un enfoque basado en XAI, los modelos pueden diagnosticarse y actualizarse, generando así pronósticos más confiables de las fluctuaciones diarias de la energía eólica”. Fondos Oficina Federal Suiza de Energía “Un gemelo digital urbano para la acción climática: evaluación de políticas y soluciones para la energía, el agua y la infraestructura (UrbanTwin)”, iniciativa conjunta del Dominio ETH en el área estratégica de Energía, Clima y Medio Ambiente Sostenible. Referencias Wenlong Liao, Jiannong Fang, Lin Ye, Birgitte Bak-Jensen, Zhe Yang y Fernando Porté-Agel, “¿Podemos confiar en la inteligencia artificial explicable en la previsión de energía eólica?”, Applied Energy, 15 de diciembre de 2024. https://doi.org/10.1016/j.apenergy.2024.124273 EPFL News. S. P. Traducido al español

Leer más »

Lenovo India y Motorola Mobility se asocian con Muskaan Dreams para dotar a los estudiantes de escuelas públicas de habilidades del siglo XXI

La iniciativa está dirigida a 20 escuelas en Lucknow como primeras en adoptarla, impactando a más de 5000 estudiantes en los grados 6 a 8. Nueva Delhi, 27 de enero de 2025 : En el Día Internacional de la Educación, Lenovo, la potencia tecnológica mundial, en colaboración con Motorola Mobility, anunció su asociación con Muskaan Dreams para su programa transformador “Innovadores del mañana”. La iniciativa busca reducir la brecha digital y dotar a los estudiantes de las escuelas públicas de Lucknow, Uttar Pradesh, de habilidades fundamentales del siglo XXI, como la resolución de problemas y la alfabetización en tecnología de la información (TIC), incluidas la informática, la codificación y la IA-ML. Como parte del programa, se instalarán laboratorios de Internet de las cosas (IoT) en las escuelas participantes y el plan de estudios se adaptará para integrar las TIC de manera eficaz. Los estudiantes de 6.º a 8.º grado adquirirán conocimientos básicos de informática y experiencia práctica en codificación, mientras que los profesores recibirán capacitación práctica específica a través de un chatbot habilitado con inteligencia artificial, lo que los equipará para brindar experiencias de aprendizaje impactantes. El plan de estudios por fases comienza con educación informática básica y programación básica en el primer año, y avanza hacia la codificación avanzada y las habilidades para el futuro en el segundo año. Este enfoque holístico tiene como objetivo fomentar las habilidades de resolución de problemas, el pensamiento crítico y la adaptabilidad, rasgos clave para tener éxito en una economía digital en evolución. La iniciativa “Innovadores del mañana” responde a la creciente demanda de profesionales cualificados en la creciente economía digital de la India. Según MeitY, se prevé que el sector digital de la India se duplique para 2025, creando entre 60 y 65 millones de puestos de trabajo, y que los puestos especializados en inteligencia artificial y ciencia de datos experimenten un aumento significativo. Sin embargo, muchos jóvenes, en particular las mujeres jóvenes, siguen sin estar preparados para estas oportunidades debido a la limitación de recursos y exposición. Abhishek Dubey, fundador de Muskaan Dreams , destaca la importancia de Innovators of Tomorrow, un programa cuyo objetivo es dotar a los estudiantes de las escuelas públicas de habilidades del siglo XXI, como codificación, informática, resolución de problemas, pensamiento crítico y creatividad, a la vez que les proporciona una valiosa exposición al mundo de la tecnología. En una era digital en rápida evolución, la iniciativa se esfuerza por reducir la brecha digital, dotando a los estudiantes desfavorecidos de las herramientas necesarias para innovar, adaptarse y prosperar. Al fomentar estas habilidades esenciales, el programa prepara a las mentes jóvenes para superar los desafíos y aprovechar las oportunidades en un futuro cada vez más competitivo e impulsado por la tecnología. Pratima Harite, directora de RSE y filantropía de Lenovo Asia Pacífico, reforzó el compromiso de la empresa con la educación inclusiva: “En Lenovo, creemos que nuestra tecnología más inteligente puede empoderar a las personas y las comunidades. Con la economía digital de la India preparada para crear millones de nuevos puestos de trabajo para 2025, iniciativas como “Innovadores del mañana” son cruciales para dotar a la próxima generación de habilidades preparadas para el futuro. Al introducir la codificación, la inteligencia artificial y la alfabetización digital durante los años críticos de aprendizaje, nuestro objetivo es inspirar a las mentes jóvenes hacia las carreras STEM y garantizar un acceso equitativo a una educación de calidad”. Esta asociación se centra en reducir la brecha digital y promover la inclusión. La exposición temprana a las disciplinas STEM ayuda a desarrollar el pensamiento lógico, las habilidades analíticas y la curiosidad, sentando las bases para tomar decisiones educativas y profesionales informadas. Además, el programa equipa a los docentes con pedagogía digital avanzada, fomentando un entorno de aprendizaje sólido y sostenido. La fase piloto afectará directamente a más de 5000 estudiantes en 20 escuelas públicas de Lucknow, y hay planes de expandirse a otras regiones en los próximos años. En consonancia con la Política Nacional de Educación de 2021, la iniciativa apoya la integración de la tecnología y el aprendizaje experiencial en los sistemas educativos, con el objetivo de difundir el conocimiento de la informática y las habilidades futuras entre los estudiantes y educadores de toda la India. Lenovo News. Traducido al español

Leer más »

Hacia modelos videogenerativos del mundo molecular

A partir de un solo fotograma en una simulación, un nuevo sistema utiliza IA generativa para emular la dinámica de las moléculas, conectando estructuras moleculares estáticas y convirtiendo imágenes borrosas en vídeos. A medida que han crecido las capacidades de los modelos de IA generativa, probablemente hayas visto cómo pueden transformar indicaciones de texto simples en imágenes hiperrealistas e incluso en videoclips extendidos. Más recientemente, la IA generativa ha demostrado tener potencial para ayudar a los químicos y biólogos a explorar moléculas estáticas, como las proteínas y el ADN. Modelos como AlphaFold pueden predecir estructuras moleculares para acelerar el descubrimiento de fármacos, y el “ RFdiffusion ” asistido por el MIT, por ejemplo, puede ayudar a diseñar nuevas proteínas. Sin embargo, un desafío es que las moléculas están en constante movimiento y se sacuden, lo que es importante modelar al construir nuevas proteínas y fármacos. Simular estos movimientos en una computadora usando física (una técnica conocida como dinámica molecular) puede ser muy costoso, y requiere miles de millones de pasos de tiempo en supercomputadoras. Como un paso hacia la simulación más eficiente de estos comportamientos, los investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) y del Departamento de Matemáticas del MIT han desarrollado un modelo generativo que aprende de datos anteriores. El sistema del equipo, llamado MDGen, puede tomar un fotograma de una molécula 3D y simular lo que sucederá a continuación como un video, conectar imágenes fijas separadas e incluso completar fotogramas faltantes. Al pulsar el botón de “reproducción” en las moléculas, la herramienta podría ayudar a los químicos a diseñar nuevas moléculas y estudiar de cerca cómo interactuarían sus prototipos de fármacos para el cáncer y otras enfermedades con la estructura molecular en la que pretende influir. El coautor principal Bowen Jing SM ’22 dice que MDGen es una prueba de concepto temprana, pero sugiere el comienzo de una nueva y emocionante dirección de investigación. “Al principio, los modelos de IA generativa producían videos algo simples, como una persona parpadeando o un perro moviendo la cola”, dice Jing, estudiante de doctorado en CSAIL. “Avanzamos unos años y ahora tenemos modelos asombrosos como Sora o Veo que pueden ser útiles en todo tipo de formas interesantes. Esperamos inculcar una visión similar para el mundo molecular, donde las trayectorias dinámicas son los videos. Por ejemplo, puedes darle al modelo el primer y el décimo fotograma, y ​​animará lo que está entre ellos, o puede eliminar el ruido de un video molecular y adivinar lo que estaba oculto”. Los investigadores afirman que MDGen representa un cambio de paradigma con respecto a trabajos comparables previos con IA generativa, ya que permite casos de uso mucho más amplios. Los enfoques anteriores eran «autorregresivos», lo que significa que se basaban en el fotograma anterior para construir el siguiente, comenzando desde el primer fotograma para crear una secuencia de vídeo. Por el contrario, MDGen genera los fotogramas en paralelo con la difusión. Esto significa que MDGen se puede utilizar para, por ejemplo, conectar fotogramas en los puntos finales o «sobremuestrear» una trayectoria de baja velocidad de fotogramas además de pulsar el botón de reproducción en el fotograma inicial. Este trabajo se presentó en un artículo que se mostró en la Conferencia sobre Sistemas de Procesamiento de Información Neural (NeurIPS) el pasado mes de diciembre. El verano pasado, recibió un premio por su potencial impacto comercial en el Taller ML4LMS de la Conferencia Internacional sobre Aprendizaje Automático. Algunos pequeños pasos adelante para la dinámica molecular En los experimentos, Jing y sus colegas descubrieron que las simulaciones de MDGen eran similares a ejecutar las simulaciones físicas directamente, mientras que producían trayectorias de 10 a 100 veces más rápido. El equipo primero probó la capacidad de su modelo para tomar un marco 3D de una molécula y generar los siguientes 100 nanosegundos. Su sistema unió bloques sucesivos de 10 nanosegundos para que estas generaciones alcanzaran esa duración. El equipo descubrió que MDGen podía competir con la precisión de un modelo de referencia, al tiempo que completaba el proceso de generación de video en aproximadamente un minuto, una mera fracción de las tres horas que le tomó al modelo de referencia simular la misma dinámica. Cuando se le dio el primer y el último fotograma de una secuencia de un nanosegundo, MDGen también modeló los pasos intermedios. El sistema de los investigadores demostró un grado de realismo en más de 100.000 predicciones diferentes: simuló trayectorias moleculares más probables que sus líneas de base en clips más cortos que 100 nanosegundos. En estas pruebas, MDGen también indicó una capacidad de generalizar sobre péptidos que no había visto antes. Las capacidades de MDGen también incluyen la simulación de fotogramas dentro de fotogramas, «sobremuestreando» los pasos entre cada nanosegundo para capturar fenómenos moleculares más rápidos de manera más adecuada. Incluso puede «repintar» estructuras de moléculas, restaurando información sobre ellas que se eliminó. Estas características podrían eventualmente ser utilizadas por los investigadores para diseñar proteínas basadas en una especificación de cómo deberían moverse las diferentes partes de la molécula. Jugando con la dinámica de las proteínas Jing y el coautor principal Hannes Stärk afirman que MDGen es una señal temprana de progreso hacia la generación de dinámicas moleculares de manera más eficiente. Sin embargo, carecen de los datos necesarios para que estos modelos tengan un impacto inmediato en el diseño de fármacos o moléculas que induzcan los movimientos que los químicos querrán ver en una estructura específica. Los investigadores pretenden ampliar MDGen para que pueda pasar de modelar moléculas a predecir cómo cambiarán las proteínas con el tiempo. “Actualmente, estamos utilizando sistemas de juguete”, dice Stärk, también estudiante de doctorado en CSAIL. “Para mejorar las capacidades predictivas de MDGen para modelar proteínas, necesitaremos basarnos en la arquitectura y los datos actuales disponibles. Todavía no tenemos un repositorio a escala de YouTube para ese tipo de simulaciones, por lo que esperamos desarrollar un método de aprendizaje automático independiente que pueda acelerar el proceso de recopilación de datos para nuestro modelo”. Por

Leer más »

Simulaciones inteligentes para movilidad urbana

Planificación del tráfico en las ciudades con modelos precisos Investigadores de la Universidad Técnica de Múnich (TUM) han desarrollado una herramienta de simulación para crear modelos detallados de todo, desde cruces de tráfico hasta ciudades enteras, con el fin de responder a diversas preguntas sobre movilidad. Vamos de compras, al trabajo o de vacaciones. Los trenes transportan mercancías a largas distancias, los camiones abastecen las obras con nuevos materiales o los comercios con mercancías. La movilidad es una necesidad humana básica y también un factor global importante. Sin embargo, las intersecciones y el trazado de las carreteras son diferentes en cada lugar. Cuando los planificadores de tráfico y carreteras conciben nuevos proyectos, como la electrificación del transporte local, la implementación debe adaptarse a ellos. En este sentido, los modelos digitales resultan muy útiles. Los investigadores de la TUM han desarrollado el software City Mobility Simulator (CityMoS), que permite crear y calcular simulaciones detalladas de ciudades enteras en ordenadores estándar. CityMoS se desarrolló en Singapur en “TUMCREATE”, una plataforma de investigación multidisciplinaria. Se trata de las instalaciones de investigación de la TUM en el “Campus de Excelencia en Investigación y Empresa Tecnológica” (CREATE), y la mayor parte de sus investigaciones están financiadas por la Fundación Nacional de Investigación de Singapur. TUMCREATE colabora con universidades asociadas como la Universidad Tecnológica de Nanyang (NTU), instituciones de investigación públicas y privadas, así como con socios de la industria. Con su campus de estudios TUM Asia, la TUM está presente en Singapur desde 2002. El Dr. David Eckhoff lleva casi diez años en Singapur como científico principal responsable del simulador en varios proyectos. “El tráfico es un resultado de la movilidad y, por muy diferentes que sean los pueblos o las ciudades, también lo son los requisitos de la planificación del tráfico”, explica. “Nuestro simulador puede responder a esto muy bien”. Computación paralela para precisión a escala Las simulaciones de áreas más grandes, como ciudades enteras, generalmente se basan en fórmulas matemáticas o modelos de movimiento simplificados. También existen modelos microscópicos, es decir, representaciones muy precisas en las que se muestra el comportamiento de cada vehículo, como su aceleración, frenado y cambio de carril detallados. Como este nivel de detalle requiere una gran capacidad de procesamiento, estas simulaciones de alta resolución solo se podían utilizar anteriormente para áreas más pequeñas, como intersecciones o distritos urbanos. Aquí es donde entra en juego CityMoS: David Eckhoff y su equipo han desarrollado su herramienta de simulación inteligente de forma que todos los procesadores de los ordenadores se utilicen de forma simultánea y eficiente para llevar a cabo una simulación. Como resultado, se pueden crear simulaciones detalladas de ciudades enteras y su tráfico en ordenadores normales. El software también puede simular varios aspectos de la movilidad simultáneamente: analiza el comportamiento de los viajeros, tiene en cuenta el transporte público e incluso incluye el comportamiento de carga de los vehículos eléctricos; en otras palabras, abarca todos los factores de movilidad, no solo el tráfico. La amplia gama de aplicaciones de CityMoS dio a David Eckhoff y a dos de sus colegas la idea de comercializar su producto. En 2020, fundaron “intobyte” en Singapur. Ahora tienen clientes tanto en Asia como en Europa que utilizan sus servicios y software. La calidad de los datos es crucial para la simulación Desde 2012, la ciudad-estado de Singapur ha sido el primer campo de pruebas del simulador. En aquel momento, los científicos de TUMCREATE que trabajaban en el proyecto estaban bajo la dirección del profesor Alois Knoll, de la Cátedra de Robótica, Inteligencia Artificial y Sistemas Integrados de la TUM. Ahora existe un gemelo digital completo de la ciudad, que se está utilizando para investigar diversas cuestiones: ¿Dónde deben ubicarse las estaciones de carga para la electrificación del tráfico de mercancías y comercial? ¿Qué hay que tener en cuenta a la hora de electrificar las flotas de autobuses? ¿Cuándo y cuánta electricidad hay que planificar para la carga de vehículos? Independientemente de las preguntas que la herramienta ayude a responder, los datos subyacentes siempre son decisivos. “Si solo se dispone de datos incompletos o inexactos, existe el riesgo de que una simulación no tenga sentido. Los datos son la base de las soluciones inteligentes; afortunadamente, se han producido muchos avances en este ámbito en los últimos 10 años”, afirma Eckhoff. Los datos pueden proceder de diversas fuentes: de socios comerciales como fabricantes de automóviles, de semáforos inteligentes, de agencias gubernamentales o de encuestas ciudadanas. Singapur es un lugar ideal para los investigadores: la Autoridad Nacional de Transporte Terrestre pone a disposición del público gran parte de los datos en su “DataMall”, que ayuda a los investigadores a modelar la ciudad. Plataforma de investigación para el intercambio internacional Los investigadores de TUMCREATE también se benefician de las sucursales de las instituciones de investigación más importantes del mundo, como el Instituto Tecnológico de Massachusetts (MIT), la Universidad de Cambridge y la ETH de Zúrich, ubicadas en el mismo campus. «En el campus de CREATE las distancias son cortas, lo que facilita la colaboración con los mejores científicos», afirma el Dr. Eckhoff. «Para los jóvenes investigadores que trabajan aquí, esta es una gran oportunidad para desarrollar su red científica y trabajar en cuestiones de investigación de vanguardia». TUM News. Traducido al español

Leer más »

Financiación del proyecto: no hay posibilidad de deepfakes

Los investigadores están desarrollando un prototipo para identificar imágenes falsas generadas por IA Los deepfakes se están extendiendo rápidamente y cada vez es más difícil reconocerlos como tales. Un grupo de informática forense de la Universidad Friedrich-Alexander de Erlangen-Núremberg (FAU) está trabajando con secunet Security Networks AG en una herramienta que reconoce de forma automática y fiable imágenes generadas por IA. El proyecto está financiado con 350.000 euros por la Agencia Federal de Innovaciones Avanzadas SPRIN-D. Angela Merkel conversa con Vladimir Putin en la taberna al aire libre. El Papa Francisco está en la mesa de mezclas como DJ. Tom Cruise aparece en un estrecho abrazo con Paris Hilton. Estas fotografías circulan por Internet y se hace clic en ellas millones de veces, pero son falsificaciones de aspecto realista, las llamadas deepfakes. «Los generadores de deepfake son cada vez más potentes y además son de libre acceso», afirma el PD Dr. Christian Riess, jefe del grupo de investigación Seguridad Multimedia de la Cátedra de Infraestructuras de Seguridad TI. «Como resultado, las fotos y vídeos con contenido manipulado se difunden rápidamente y parecen cada vez más reales, en el mejor de los casos, simplemente entretenidos». Sin embargo, también pueden contener explosivos políticos y sociales si las falsificaciones no se reconocen como tales. Un enfoque fundamentalmente diferente Un proyecto de la FAU se ocupa precisamente de este problema. Los especialistas en TI de Erlangen están desarrollando junto con secunet Security Networks AG un prototipo universal que permitirá detectar de forma fiable los deepfakes procedentes de distintos generadores de IA. «Nuestro enfoque se diferencia fundamentalmente de otros métodos», explica Sandra Bergmann, estudiante de doctorado en el grupo de trabajo de Riess. “Los programas de reconocimiento de imágenes normalmente se entrenan presentándoles una gran cantidad de ejemplos diferentes. Luego, el software aprende a clasificar las imágenes y a distinguir las reales de las generadas por IA”. El prototipo desarrollado por FAU y secunet también utiliza clasificación de imágenes. Además, se basa en grandes redes neuronales previamente entrenadas a partir de generadores de IA para extraer características de la imagen. «La ventaja es que con nuestra herramienta también podemos comprobar imágenes creadas por generadores de deepfake desconocidos hasta ahora», afirma Bergmann. «Esto permite que la herramienta reaccione ad hoc sin haber entrenado previamente al detector con miles de datos». El objetivo de los investigadores de la FAU es reunir tantos detectores y rastros de datos como sea posible y así hacer que el prototipo sea robusto contra errores. Al mismo tiempo, secunet garantiza que la herramienta se pueda integrar fácilmente en las infraestructuras digitales existentes y, por ejemplo, sea capaz de identificar de forma fiable deepfakes en las plataformas de redes sociales. “La alta confiabilidad en la detección de deepfakes es solo uno de los requisitos de la solución. «También hay que tomar una decisión rápidamente, incluso en el caso de varias solicitudes paralelas que una solicitud realiza a un sistema de reconocimiento», explica el Dr. Benjamin Tams, director del proyecto en secunet. ¿Qué es SPRIN-D? SPRIN-D es una iniciativa del Ministerio Federal de Educación e Investigación y se considera una incubadora de innovaciones revolucionarias en Alemania y Europa. Identifica, valida, financia y apoya proyectos o emprendimientos que tienen potencial para generar innovación revolucionaria. A diferencia de la financiación pura para investigación, SPRIN-D tiene como objetivo apoyar nuevos productos, tecnologías, modelos comerciales y servicios comercializables que mejoren de manera sostenible las vidas de la mayor cantidad de personas posible. Para desarrollar el prototipo, los investigadores de la FAU utilizan sus muchos años de experiencia en la detección de deepfake y su especial conocimiento en el campo de la compresión de imágenes respaldada por IA. FAU News. Traducido al español

Leer más »
Scroll al inicio