El Portal de las Tecnologías para la Innovación

Chubut Digital

Cómo las moléculas más grandes pueden ayudar a que el flujo de carga cuántica dure más

Un equipo de la EPFL y la Universidad de Arizona ha descubierto que hacer moléculas más grandes y más flexibles puede en realidad prolongar la vida del flujo de carga cuántica, un hallazgo que podría ayudar a dar forma al futuro de las tecnologías cuánticas y el control químico. En el emergente campo de la attoquímica, los científicos utilizan pulsos láser para activar y dirigir el movimiento de electrones dentro de las moléculas. Este grado de precisión podría permitirnos algún día diseñar sustancias químicas a medida. La attoquímica también podría permitir el control en tiempo real sobre cómo se rompen o forman los enlaces químicos, lo que conduciría a la creación de fármacos altamente específicos, el desarrollo de nuevos materiales con propiedades personalizadas y la mejora de tecnologías como la captación de energía solar y la computación cuántica. Pero el mayor obstáculo es la decoherencia : los electrones pierden su «sincronización» cuántica en cuestión de femtosegundos (una millonésima de una milmillonésima de segundo), especialmente cuando la molécula es grande y flexible. Los investigadores han probado diferentes métodos para mantener la coherencia, como átomos pesados, temperaturas de congelación, etc. Dado que la coherencia cuántica desaparece a escalas macroscópicas, la mayoría de los enfoques para mantener la coherencia parten del mismo supuesto: se suponía que las moléculas más grandes y flexibles perdían la coherencia más rápidamente. ¿Y si ese supuesto fuera erróneo? Para investigar esta cuestión, tres investigadores, Alan Scheidegger y Jiří Vaníček de la EPFL, y Nikolay Golubev de la Universidad de Arizona, estudiaron una serie de moléculas orgánicas simples, cada una con grupos alquino y aldehído terminales separados por una cadena de átomos de carbono. Mediante simulaciones, demostraron que alargar la cadena de carbono ayudaba a los electrones a mantenerse sincronizados durante más tiempo. Este descubrimiento podría ayudar a diseñar moléculas que conserven sus propiedades cuánticas durante más tiempo. Modelar cada minúsculo movimiento de átomos y electrones habría sido demasiado complejo y computacionalmente imposible. Por ello, los investigadores emplearon un atajo inteligente: trataron los núcleos atómicos (los núcleos pesados ​​de los átomos) como si se movieran según las reglas de la mecánica clásica, como pequeñas bolas de billar, pero considerando su naturaleza cuántica de forma aproximada. A la vez, rastrearon cuidadosamente los electrones más ligeros utilizando las leyes exactas de la mecánica cuántica, capturando plenamente su naturaleza ondulatoria y probabilística. Este enfoque, denominado dinámica semiclásica, les proporcionó una visión detallada de qué vibraciones atómicas específicas perturbaban el frágil estado cuántico y cuáles le permitían perdurar durante más tiempo. El estudio descubrió que la adición de átomos de carbono ralentiza la decoherencia. En moléculas más grandes, como el pentinal, ciertas vibraciones que normalmente interrumpirían el flujo de electrones se volvieron mucho menos activas o incluso desaparecieron. De hecho, el estudio demostró que solo las vibraciones específicas que preservan la simetría de la molécula tuvieron un impacto significativo en la coherencia. Por el contrario, las vibraciones fuera del plano, que cabría esperar que causaran disrupción, resultaron tener un efecto prácticamente nulo. Los investigadores también descubrieron que la migración de carga no solo duró más, sino que también se volvió más fácil de observar. Cuando una molécula pierde un electrón, deja un «hueco», una zona de carga positiva que actúa como un electrón faltante. En la molécula más grande estudiada, este agujero migratorio se movió de forma más fluida y predecible a lo largo de la cadena de carbono, con menos interrupciones por vibraciones internas. Este movimiento más claro y estable facilita a los científicos la precisión en el tiempo de las intervenciones, como el uso de un segundo pulso láser para influir en las reacciones químicas. En resumen, aumentar el tamaño de la molécula ayudó a estabilizar la migración de carga en lugar de interrumpirla. La coherencia cuántica no es solo un fenómeno de laboratorio; es esencial para tecnologías como las computadoras cuánticas, los sensores ultrasensibles y el control químico por láser. El estudio demuestra que, al aumentar el tamaño y la flexibilidad de las moléculas —sin perder su reactividad química—, los científicos pueden extender la coherencia cuántica y estabilizar la migración de carga. “La migración de carga es actualmente un área de investigación muy activa y es fundamental para el campo emergente de la attoquímica, que se basa en la coherencia electrónica sostenida”, afirma Alan Scheidegger, estudiante de doctorado en la EPFL y autor principal del estudio. “En términos más generales, prolongar los tiempos de coherencia es de gran interés para los investigadores que desarrollan tecnologías cuánticas”. Fondos Fundación Nacional Suiza para la Ciencia (SNSF) a través del NCCR Ciencia y Tecnología Molecular Ultrarrápida (MUST) Programa de investigación e innovación Horizonte 2020 de la Unión Europea a través de la subvención ERC Consolidator Grant MOLEQULE Departamento de Energía de los Estados Unidos (DOE) Referencias Alan Scheidegger, Nikolay V. Golubev, Jiří JL Vaníček. ¿Puede el aumento del tamaño y la flexibilidad de una molécula reducir la decoherencia y prolongar la migración de carga? PNAS, 30 de mayo de 2025. DOI: 10.1073/pnas.2501319122 EPFL News. N. P. Traducido al español

Cómo las moléculas más grandes pueden ayudar a que el flujo de carga cuántica dure más Leer más »

Enseñar a los modelos de IA los trazos generales para que dibujen más como lo hacen los humanos

SketchAgent, un sistema de dibujo desarrollado por investigadores de MIT CSAIL, esboza conceptos trazo a trazo, enseñando modelos lingüísticos para expresar conceptos visualmente por sí mismos y colaborar con los humanos. Al intentar comunicar o comprender ideas, las palabras no siempre son suficientes. A veces, el enfoque más eficiente es hacer un simple boceto de ese concepto; por ejemplo, diagramar un circuito podría ayudar a comprender el funcionamiento del sistema. Pero ¿y si la inteligencia artificial pudiera ayudarnos a explorar estas visualizaciones? Si bien estos sistemas suelen ser competentes en la creación de pinturas realistas y dibujos caricaturescos, muchos modelos no logran captar la esencia del boceto: su proceso iterativo, trazo a trazo, que ayuda a los humanos a generar ideas y editar cómo quieren representarlas. Un nuevo sistema de dibujo del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT y la Universidad de Stanford permite dibujar de forma más parecida a como lo hacemos nosotros. Su método, llamado «SketchAgent», utiliza un modelo de lenguaje multimodal (sistemas de IA que se entrenan con texto e imágenes, como el Claude 3.5 Sonnet de Anthropic) para convertir indicaciones de lenguaje natural en bocetos en segundos. Por ejemplo, puede dibujar una casa de forma independiente o en colaboración, dibujando con una persona o incorporando información textual para dibujar cada parte por separado. Los investigadores demostraron que SketchAgent puede crear dibujos abstractos de diversos conceptos, como un robot, una mariposa, una hélice de ADN, un diagrama de flujo e incluso la Ópera de Sídney. Algún día, la herramienta podría convertirse en un juego de arte interactivo que ayude a profesores e investigadores a diagramar conceptos complejos o a ofrecer a los usuarios una breve lección de dibujo. SketchAgent: un sistema colaborativo que enseña a los modelos de IA a dibujar de forma más parecida a como lo hacen los humanos.Vídeo: MIT CSAIL Yael Vinker, investigadora posdoctoral de CSAIL y autora principal de un  artículo que presenta SketchAgent, señala que el sistema introduce una forma más natural para que los humanos se comuniquen con la IA. No todos son conscientes de cuánto dibujan en su vida diaria. Podemos dibujar nuestros pensamientos o ideas de taller con bocetos —dice—. Nuestra herramienta busca emular ese proceso, haciendo que los modelos de lenguaje multimodal sean más útiles para ayudarnos a expresar ideas visualmente. SketchAgent enseña a estos modelos a dibujar trazo a trazo sin entrenamiento con datos. En su lugar, los investigadores desarrollaron un «lenguaje de dibujo» en el que un boceto se traduce en una secuencia numerada de trazos en una cuadrícula. El sistema recibió un ejemplo de cómo se dibujarían cosas como una casa, con cada trazo etiquetado según lo que representaba (por ejemplo, el séptimo trazo es un rectángulo etiquetado como «puerta principal») para ayudar al modelo a generalizar nuevos conceptos. Vinker escribió el artículo junto con tres afiliados de CSAIL: la investigadora posdoctoral Tamar Rott Shaham, el investigador de pregrado Alex Zhao y el profesor del MIT Antonio Torralba, así como la investigadora de la Universidad de Stanford Kristine Zheng y la profesora adjunta Judith Ellen Fan. Presentarán su trabajo en la Conferencia sobre Visión Artificial y Reconocimiento de Patrones (CVPR) de 2025 este mes. Evaluación de las capacidades de dibujo de la IA Si bien los modelos de texto a imagen como DALL-E 3 pueden crear dibujos intrigantes, carecen de un componente crucial del dibujo: el proceso espontáneo y creativo donde cada trazo puede impactar el diseño general. Por otro lado, los dibujos de SketchAgent se modelan como una secuencia de trazos, pareciendo más naturales y fluidos, como bocetos humanos. Trabajos anteriores también han imitado este proceso, pero entrenaron sus modelos en conjuntos de datos dibujados por humanos, que a menudo son limitados en escala y diversidad. SketchAgent utiliza modelos de lenguaje preentrenados en su lugar, que tienen conocimiento de muchos conceptos, pero no saben cómo dibujar. Cuando los investigadores enseñaron a los modelos de lenguaje este proceso, SketchAgent comenzó a dibujar diversos conceptos en los que no se había entrenado explícitamente. Aun así, Vinker y sus colegas querían ver si SketchAgent estaba trabajando activamente con humanos en el proceso de dibujo, o si estaba trabajando independientemente de su socio de dibujo. El equipo probó su sistema en modo de colaboración, donde un humano y un modelo de lenguaje trabajan para dibujar un concepto particular en tándem. Al eliminar las contribuciones de SketchAgent, se reveló que los trazos de su herramienta eran esenciales para el dibujo final. En el dibujo de un velero, por ejemplo, al eliminar los trazos artificiales que representaban un mástil, el boceto general resultó irreconocible. En otro experimento, investigadores de CSAIL y Stanford incorporaron diferentes modelos de lenguaje multimodal a SketchAgent para determinar cuál podía crear los bocetos más reconocibles. Su modelo principal predeterminado, Claude 3.5 Sonnet, generó los gráficos vectoriales más realistas (esencialmente archivos de texto que se pueden convertir en imágenes de alta resolución). Superó a modelos como GPT-4o y Claude 3 Opus. «El hecho de que Claude 3.5 Sonnet superara a otros modelos como GPT-4o y Claude 3 Opus sugiere que este modelo procesa y genera la información visual de forma diferente», afirma la coautora Tamar Rott Shaham. Añade que SketchAgent podría convertirse en una interfaz útil para colaborar con modelos de IA más allá de la comunicación estándar basada en texto. «A medida que los modelos avanzan en la comprensión y la generación de otras modalidades, como los bocetos, abren nuevas vías para que los usuarios expresen ideas y reciban respuestas más intuitivas y humanas», afirma Rott Shaham. «Esto podría enriquecer significativamente las interacciones, haciendo que la IA sea más accesible y versátil». Si bien la capacidad de dibujo de SketchAgent es prometedora, aún no permite realizar bocetos profesionales. Representa conceptos de forma sencilla mediante monigotes y garabatos, pero tiene dificultades para dibujar logotipos, frases, criaturas complejas como unicornios y vacas, y figuras humanas específicas. En ocasiones, su modelo malinterpretaba las intenciones de los usuarios en dibujos colaborativos, como cuando SketchAgent dibujó

Enseñar a los modelos de IA los trazos generales para que dibujen más como lo hacen los humanos Leer más »

La IA revoluciona la receta del hormigón en un estudio del MIT

Ante la creciente demanda de alternativas al cemento, un equipo del MIT utiliza el aprendizaje automático para buscar nuevos ingredientes en la literatura científica. Durante semanas, la pizarra del laboratorio estuvo repleta de garabatos, diagramas y fórmulas químicas. Un equipo de investigación del Grupo Olivetti y el Centro de Sostenibilidad del Hormigón del MIT (CSHub) trabajaba intensamente en un problema clave: ¿Cómo podemos reducir la cantidad de cemento en el hormigón para ahorrar costes y emisiones?  La pregunta no era nueva; materiales como las cenizas volantes, un subproducto de la producción de carbón, y la escoria, un subproducto de la fabricación de acero, se han utilizado desde hace mucho tiempo para sustituir parte del cemento en las mezclas de hormigón. Sin embargo, la demanda de estos productos supera la oferta, ya que la industria busca reducir su impacto climático ampliando su uso, lo que hace urgente la búsqueda de alternativas. El reto que descubrió el equipo no fue la falta de candidatos; el problema fue que había demasiados para analizar. El 17 de mayo, el equipo, dirigido por el posdoctorado Soroush Mahjoubi, publicó un artículo de acceso abierto en la revista Nature Communications Materials donde describe su solución. «Nos dimos cuenta de que la IA era la clave para avanzar», señala Mahjoubi. «Existe una gran cantidad de datos sobre materiales potenciales: cientos de miles de páginas de literatura científica. Analizarlos habría llevado muchas vidas de trabajo, ¡y para entonces se habrían descubierto más materiales!». Con modelos de lenguaje grandes, como los chatbots que muchos de nosotros usamos a diario, el equipo construyó un marco de aprendizaje automático que evalúa y clasifica los materiales candidatos en función de sus propiedades físicas y químicas.  En primer lugar, está la reactividad hidráulica. La razón por la que el hormigón es resistente es que el cemento, el pegamento que lo mantiene unido, se endurece al exponerse al agua. Por lo tanto, si reemplazamos este pegamento, debemos asegurarnos de que el sustituto reaccione de forma similar —explica Mahjoubi—. En segundo lugar, está la puzolanicidad. Esta se produce cuando un material reacciona con el hidróxido de calcio, un subproducto que se forma al entrar en contacto con el cemento y el agua, para endurecer y fortalecer el hormigón con el tiempo. Necesitamos equilibrar los materiales hidráulicos y puzolánicos en la mezcla para que el hormigón rinda al máximo. Tras analizar la literatura científica y más de un millón de muestras de roca, el equipo utilizó el marco para clasificar los materiales candidatos en 19 tipos, desde biomasa hasta subproductos mineros y materiales de construcción demolidos. Mahjoubi y su equipo descubrieron que los materiales adecuados estaban disponibles globalmente y, lo que es más impresionante, muchos podían incorporarse a las mezclas de hormigón simplemente moliéndolos. Esto significa que es posible obtener ahorros en emisiones y costos sin mucho procesamiento adicional.  “Algunos de los materiales más interesantes que podrían reemplazar una parte del cemento son la cerámica”, señala Mahjoubi. “Tejas antiguas, ladrillos, cerámica: todos estos materiales pueden tener una alta reactividad. Esto es algo que hemos observado en el hormigón de la antigua Roma, donde se añadía cerámica para impermeabilizar las estructuras. He tenido muchas conversaciones interesantes sobre esto con el profesor Admir Masic, quien dirige muchos de los estudios sobre hormigón antiguo aquí en el MIT”. El potencial de materiales cotidianos como la cerámica y materiales industriales como los relaves mineros es un ejemplo de cómo materiales como el hormigón pueden contribuir a una economía circular. Al identificar y reutilizar materiales que, de otro modo, acabarían en vertederos, los investigadores y la industria pueden contribuir a darles una segunda vida como parte de nuestros edificios e infraestructuras. De cara al futuro, el equipo de investigación planea mejorar el marco para que sea capaz de evaluar aún más materiales, a la vez que valida experimentalmente algunos de los mejores candidatos. «Las herramientas de IA han llevado esta investigación lejos en poco tiempo, y estamos entusiasmados por ver cómo los últimos avances en modelos de lenguaje a gran escala facilitan los próximos pasos», afirma la profesora Elsa Olivetti, autora principal del trabajo y miembro del Departamento de Ciencia e Ingeniería de Materiales del MIT. Olivetti es directora de misión del Proyecto Climático del MIT, investigadora principal del CSHub y líder del Grupo Olivetti. “El hormigón es la base del entorno construido”, afirma Randolph Kirchain, coautor y director de CSHub. “Al aplicar la ciencia de datos y las herramientas de IA al diseño de materiales, esperamos apoyar los esfuerzos de la industria para construir de forma más sostenible, sin comprometer la resistencia, la seguridad ni la durabilidad. Además de Mahjoubi, Olivetti y Kirchain, entre los coautores del trabajo se incluyen el investigador postdoctoral del MIT Vineeth Venugopal, Ipek Bensu Manav SM ’21, PhD ’24; y el subdirector del CSHub, Hessam AzariJafari. Esta investigación se llevó a cabo a través del Centro de Sostenibilidad del Hormigón del MIT, con el apoyo de la Fundación para el Avance del Hormigón. Este trabajo también recibió financiación del Laboratorio de IA Watson del MIT-IBM. MIT News. A. P. L. Traducido al español

La IA revoluciona la receta del hormigón en un estudio del MIT Leer más »

Enseñar a los modelos de IA lo que no saben

Un equipo de investigadores del MIT fundó Themis AI para cuantificar la incertidumbre del modelo de IA y abordar las brechas de conocimiento. Los sistemas de inteligencia artificial como ChatGPT ofrecen respuestas plausibles a cualquier pregunta. Sin embargo, no siempre revelan las lagunas en su conocimiento ni las áreas donde presentan incertidumbre. Este problema puede tener graves consecuencias, ya que los sistemas de IA se utilizan cada vez más para tareas como desarrollar fármacos, sintetizar información y conducir vehículos autónomos. Ahora, Themis AI, una empresa derivada del MIT, ayuda a cuantificar la incertidumbre de los modelos y a corregir los resultados antes de que causen problemas mayores. Su plataforma Capsa puede funcionar con cualquier modelo de aprendizaje automático para detectar y corregir resultados poco fiables en segundos. Funciona modificando los modelos de IA para que detecten patrones en el procesamiento de datos que indiquen ambigüedad, incompletitud o sesgo. “La idea es tomar un modelo, integrarlo en Capsa, identificar sus incertidumbres y modos de fallo, y luego mejorarlo”, afirma Daniela Rus, cofundadora de Themis AI y profesora del MIT, quien también dirige el Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL). “Nos entusiasma ofrecer una solución que pueda mejorar los modelos y garantizar su correcto funcionamiento”. Rus fundó Themis AI en 2021 junto con Alexander Amini (promoción de 2017, SM (promoción de 2018, PhD (promoción de 2022)) y Elaheh Ahmadi (promoción de 2020, MEng (promoción de 2021), dos antiguos investigadores asociados de su laboratorio. Desde entonces, han ayudado a empresas de telecomunicaciones con la planificación y automatización de redes, a empresas de petróleo y gas a utilizar la IA para comprender imágenes sísmicas y han publicado artículos sobre el desarrollo de chatbots más fiables. “Queremos integrar la IA en las aplicaciones más importantes de cada sector”, afirma Amini. “Todos hemos visto ejemplos de IA con alucinaciones o errores. A medida que la IA se implementa de forma más generalizada, esos errores podrían tener consecuencias devastadoras. Themis permite que cualquier IA pueda predecir sus propios fallos antes de que ocurran”. Ayudando a los modelos a saber lo que no saben El laboratorio de Rus lleva años investigando la incertidumbre de los modelos. En 2018, recibió financiación de Toyota para estudiar la fiabilidad de una solución de conducción autónoma basada en aprendizaje automático. “Ese es un contexto crítico para la seguridad donde comprender la confiabilidad del modelo es muy importante”, afirma Rus. En un trabajo independiente , Rus, Amini y sus colaboradores desarrollaron un algoritmo capaz de detectar sesgos raciales y de género en sistemas de reconocimiento facial y reponderar automáticamente los datos de entrenamiento del modelo, demostrando que eliminaba el sesgo. El algoritmo funcionaba identificando las partes no representativas de los datos de entrenamiento subyacentes y generando nuevas muestras de datos similares para reequilibrarlos. En 2021, los futuros cofundadores demostraron que un enfoque similar podría utilizarse para ayudar a las compañías farmacéuticas a usar modelos de IA para predecir las propiedades de los fármacos candidatos. Ese mismo año, fundaron Themis AI. “Guiar el descubrimiento de fármacos podría ahorrar mucho dinero”, afirma Rus. “Ese fue el caso práctico que nos hizo comprender el potencial de esta herramienta”. Actualmente, Themis AI colabora con empresas de diversos sectores, y muchas de ellas desarrollan grandes modelos lingüísticos. Gracias a Capsa, estos modelos pueden cuantificar su propia incertidumbre para cada resultado. “Muchas empresas están interesadas en usar programas de maestría en derecho basados ​​en sus datos, pero les preocupa la fiabilidad”, observa Stewart Jamieson (SM ’20, PhD ’24), director de tecnología de Themis AI. “Ayudamos a los estudiantes de maestría en derecho a autodeclarar su confianza e incertidumbre, lo que permite responder preguntas con mayor fiabilidad y detectar resultados poco fiables”. Themis AI también está en conversaciones con empresas de semiconductores que construyen soluciones de IA en sus chips que pueden funcionar fuera de los entornos de nube. “Normalmente, estos modelos más pequeños que funcionan en teléfonos o sistemas integrados no son muy precisos en comparación con lo que se podría ejecutar en un servidor, pero podemos obtener lo mejor de ambos mundos: baja latencia y computación en el borde eficiente sin sacrificar la calidad”, explica Jamieson. “Vemos un futuro donde los dispositivos en el borde realizan la mayor parte del trabajo, pero cuando no están seguros de su resultado, pueden reenviar esas tareas a un servidor central”. Las compañías farmacéuticas también pueden utilizar Capsa para mejorar los modelos de IA que se utilizan para identificar fármacos candidatos y predecir su rendimiento en ensayos clínicos. “Las predicciones y los resultados de estos modelos son muy complejos y difíciles de interpretar; los expertos dedican mucho tiempo y esfuerzo a comprenderlos”, comenta Amini. “Capsa puede brindar información desde el principio para comprender si las predicciones están respaldadas por la evidencia del conjunto de entrenamiento o son solo especulaciones sin fundamento. Esto puede acelerar la identificación de las predicciones más sólidas, y creemos que tiene un enorme potencial para el bien común”. Investigación para el impacto El equipo de Themis AI cree que la empresa está bien posicionada para mejorar la vanguardia de la tecnología de IA en constante evolución. Por ejemplo, la empresa está explorando la capacidad de Capsa para mejorar la precisión en una técnica de IA conocida como razonamiento en cadena de pensamiento, en la que los LLM explican los pasos que siguen para llegar a una respuesta. “Hemos visto indicios de que Capsa podría ayudar a guiar esos procesos de razonamiento para identificar las cadenas de razonamiento de mayor confianza”, afirma Jamieson. “Creemos que esto tiene importantes implicaciones para mejorar la experiencia LLM, reducir las latencias y los requisitos computacionales. Es una oportunidad de gran impacto para nosotros”. Para Rus, quien ha cofundado varias empresas desde que llegó al MIT, Themis AI es una oportunidad para garantizar que su investigación en el MIT tenga impacto. “Mis estudiantes y yo nos apasionamos cada vez más por ir más allá y hacer que nuestro trabajo sea relevante para el mundo”, dice Rus. “La IA tiene un enorme

Enseñar a los modelos de IA lo que no saben Leer más »

Desafío de visión artificial de bajo consumo: potenciando el desarrollo de IA en dispositivos periféricos

Fundado en 2015 y dirigido por el profesor Yung-Hsiang Lu en la Universidad de Purdue, el LPCVC ha atraído a equipos de todo el mundo que presentan soluciones innovadoras a diversos problemas de visión. El Desafío de Visión Computacional de Bajo Consumo (LPCVC) es una competencia anual organizada por el Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) para mejorar la eficiencia energética de las tecnologías de visión computacional en sistemas con recursos limitados. Fundado en 2015 y dirigido por el profesor Yung-Hsiang Lu en la Universidad de Purdue, el LPCVC ha atraído a equipos de todo el mundo que presentan soluciones innovadoras a diversos problemas de visión. Este desafío ha tenido un impacto significativo tanto en la investigación académica como en las prácticas de la industria, como lo demuestra la participación de numerosos grupos de investigación de renombre y empresas tecnológicas líderes como participantes o patrocinadores. Estas participaciones subrayan el amplio reconocimiento del papel de LPCVC en el avance de las soluciones de visión artificial energéticamente eficientes. Introducción de LPCVC 2025 Qualcomm Technologies, conocida por sus avances en tecnologías de IA de vanguardia y de bajo consumo, impulsó el LPCVC 2025 para destacar la importancia de equilibrar la precisión y la eficiencia en las soluciones de Visión Artificial (CV) para dispositivos de borde con limitaciones de energía. Qualcomm AI Hub es una plataforma en línea con una amplia gama de dispositivos de borde avanzados de Qualcomm para probar sus modelos. La plataforma ofrece opciones de rendimiento detalladas para la compilación, el perfilado, la cuantificación y la inferencia de modelos, lo que la convierte en la plataforma principal para la iteración y evaluación de modelos. La colaboración entre el equipo de Visión Artificial de Qualcomm y estudiantes de las Universidades de Purdue y Lehigh combina la experiencia en el sector con la innovación académica. El equipo de Visión Artificial de Qualcomm definió las tareas para cada área, aprovechando su amplia experiencia en tecnología de vanguardia. Los estudiantes contribuyeron recopilando datos de pruebas y gestionando el proceso de evaluación, aportando nuevas perspectivas y rigurosas metodologías académicas al desafío. Para cubrir diferentes aspectos del campo de investigación, el LPCVC 2025 ofreció 3 itinerarios: Pista 1: Clasificación de imágenes para diferentes condiciones y estilos de iluminación • Pista 2: Segmentación de vocabulario abierto con indicaciones de texto • Pista 3: Estimación de profundidad relativa monocular Para cada pista, LPCVC proporciona modelos de referencia para que los participantes experimenten. Cada equipo desarrollará sus soluciones utilizando hardware específico para la pista (Snapdragon 8 Elite para las pistas 1 y 3, y Snapdragon X Elite para la pista 2) a través de la plataforma Qualcomm AI Hub. Una vez finalizado el desarrollo, la solución se envió como un trabajo compilado a Qualcomm AI Hub y se compartió con la cuenta de LPCVC como administrador de envíos. Este administrador extraerá el ID del modelo del trabajo compilado para evaluarlo en el conjunto de datos de pruebas interno. Finalmente, los puntajes de la evaluación se actualizarán en la tabla de clasificación en el sitio web de LPCVC. Un flujo de trabajo completo es el siguiente: Además del premio en efectivo y la computadora portátil con procesador Snapdragon X Elite proporcionada en nombre de Qualcomm Technologies, los ganadores de cada pista están invitados a nuestro taller, el 8.º Aprendizaje profundo eficiente para visión por computadora , en la Conferencia sobre visión por computadora y reconocimiento de patrones de 2025 (CVPR 2025) en junio. Descripción general de la participación Al igual que en ediciones anteriores del LPCVC, la competición de 2025 despertó un gran interés global, tanto del sector académico como del industrial. Se inscribieron un total de 77 equipos en las tres modalidades, representando a 25 países y regiones diferentes. Cabe destacar que India, China, Corea del Sur y Estados Unidos tuvieron el mayor número de equipos participantes. Resultados de la presentación Las soluciones ganadoras de cada pista del Low-Power Computer Vision Challenge (LPCVC) superaron significativamente a las soluciones de referencia, demostrando avances notables en precisión y eficiencia. Pista 1 Exactitud Tiempo Ganador 0,97 1.961 μs Base 0.69 419 μs La pista 1 se centró en la clasificación de imágenes, y la solución ganadora alcanzó una impresionante precisión de 0,97, en comparación con la precisión de 0,69 de la solución base. Esto representa una mejora sustancial de aproximadamente el 40,6 % en la capacidad del modelo para clasificar imágenes correctamente. Dada la alta saturación de la tarea de clasificación de imágenes en visión artificial, esta mejora es especialmente notable. Además, la solución ganadora completó sus tareas en 1961 microsegundos, un tiempo inferior a los 419 microsegundos de la solución base. A pesar del aumento de tiempo, la notable mejora en la precisión subraya la eficacia del modelo ganador. Pista 2 mIOU Tiempo Ganador 0.61 515,18 ms Base 0.46 863,42 ms La pista 2 consistió en una segmentación de vocabulario abierto con indicaciones de texto. La solución ganadora obtuvo una puntuación media de Intersección sobre Unión (mIOU) de 0,61, superando la puntuación de 0,46 de la solución de referencia. Esto indica una mejora significativa en la capacidad de segmentación del modelo. La solución ganadora completó sus tareas en 515,18 milisegundos, un tiempo superior a los 863,42 milisegundos de la solución de referencia, lo que demuestra una mayor precisión y eficiencia. Pista 3 Puntuación F Tiempo Ganador 83.80 29,79 ms Base 62.37 24,09 ms La pista 3 se centró en la estimación de la profundidad relativa monocular, y la solución ganadora obtuvo una puntuación F de 83,80, en comparación con la puntuación de 62,37 de la solución de referencia. Esto demuestra una mejora notable en la capacidad del modelo para estimar la profundidad con precisión. La solución ganadora también completó sus tareas en 29,79 milisegundos, ligeramente más lento que los 24,09 milisegundos de la solución de referencia. A pesar del aumento marginal en el tiempo, el aumento significativo en la puntuación F subraya el rendimiento superior del modelo ganador. Qualcomm AI Hub en acción Tras el anuncio del concurso LPCVC de 2025, el interés

Desafío de visión artificial de bajo consumo: potenciando el desarrollo de IA en dispositivos periféricos Leer más »

How 1X Technologies’ Robots Are Learning to Lend a Helping Hand

Humans learn the norms, values and behaviors of society from each other — and Bernt Børnich, founder and CEO of 1X Technologies, thinks robots should learn like this, too. Share Humans learn the norms, values and behaviors of society from each other — and Bernt Børnich, founder and CEO of 1X Technologies, thinks robots should learn like this, too. “For robots to be truly intelligent and show nuances like being careful around your pet, holding the door open for an elderly person and generally behaving like we want robots to behave, they have to live and learn among us,” Børnich told 1X Technologies is committed to building fully autonomous humanoid robots, with a focus on safety, affordability and adaptability. Børnich explained how 1X Technologies uses a combination of reinforcement learning, expert demonstrations and real-world data to enable its robots to continuously learn and adapt to new situations. NEO, the company’s upcoming robot, can perform household tasks like vacuuming, folding laundry, tidying and retrieving items. It’s built with operational safety at its core, using tendon-driven mechanisms inspired by the human musculoskeletal system to achieve low energy consumption. Børnich highlights the potential for robots to enhance human productivity by helping handle mundane tasks, freeing people up to focus more on interpersonal connections and creative activities. Learn more about the latest in physical AI and robotics at NVIDIA GTC Paris, which takes place from June 10-12. Register to attend humanoid-related sessions, including: Time Stamps 05:18 – 1X Technologies’ approach to robot safety. 11:36 – How world models enable robots to search backwards from the goal. 16:51 – How robots can free humans up for more meaningful activities. 22:29 – NEO answers the door so Børnich can interview a candidate. You Might Also Like…  How World Foundation Models Will Advance Physical AI With NVIDIA’s Ming-Yu Liu AI models that can accurately simulate and predict outcomes in physical, real-world environments will enable the next generation of physical AI systems. Ming-Yu Liu, vice president of research at NVIDIA and an IEEE Fellow, explains the significance of world foundation models — powerful neural networks that can simulate physical environments. Roboflow Helps Unlock Computer Vision for Every Kind of AI Builder Roboflow’s mission is to make the world programmable through computer vision. By simplifying computer vision development, the company helps bridge the gap between AI and people looking to harness it. Cofounder and CEO Joseph Nelson discusses how Roboflow empowers users in manufacturing, healthcare and automotive to solve complex problems with visual AI. Imbue CEO Kanjun Qiu on Transforming AI Agents Into Personal Collaborators Kanjun Qiu, CEO of Imbue, explores the emerging era where individuals can create and use their own AI agents. Drawing a parallel to the PC revolution of the late 1970s and ‘80s, Qiu discusses how modern AI systems are evolving to work collaboratively with users, enhancing their capabilities rather than just automating tasks. NVIDIA Blog. N. K. Traducido al español

How 1X Technologies’ Robots Are Learning to Lend a Helping Hand Leer más »

Lidera la transformación con IA: crea el futuro del sector financiero, hoy

La transformación en el sector financiero no se detiene. Con la digitalización acelerada, la creciente importancia de la seguridad financiera y las demandas cada vez mayores de los clientes, adaptarse rápidamente se ha convertido en el principal diferenciador para las empresas que buscan liderar el mercado.  En este contexto, tecnologías como la nube y la inteligencia artificial juegan un papel crucial, impulsando la innovación y ayudando a las instituciones financieras a ser más inteligentes para avanzar con agilidad hacia el futuro. Es por eso que Oracle regresa este año a la Convención Bancaria en Cartagena, Colombia, un evento clave donde compartiremos valiosos insights, experiencias y las últimas innovaciones en IA e IA generativa, incluyendo nuestros agentes de inteligencia artificial.  Este encuentro será la oportunidad perfecta para dar el paso hacia la modernización de los servicios financieros con IA, logrando una banca abierta, inteligente y segura. Participa de nuestras experiencias y crea el futuro de la banca, hoy:  Con más de 50 agentes de IA listos para usar y el AI Agent Studio, una plataforma donde puedes personalizar tus propios agentes, descubre cómo esta nueva fuerza de trabajo puede ayudarte a automatizar procesos financieros, agilizar las operaciones y mejorar la experiencia del cliente, para impulsar el crecimiento sostenible de tu negocio y así construir una organización financiera moderna, que avance con el poder de los datos y la IA.  Consulta la agenda del evento, inscríbete y ¡sé parte de la transformación del sector! Nos vemos en Cartagena, para iniciar una jornada de transformación con el poder de los datos y la IA. Oracle Blog

Lidera la transformación con IA: crea el futuro del sector financiero, hoy Leer más »

Cómo los robots de 1X Technologies están aprendiendo a dar una mano

Los humanos aprenden las normas, valores y comportamientos de la sociedad unos de otros, y Bernt Børnich, fundador y CEO de 1X Technologies , cree que los robots también deberían aprender así.  Compartir Los humanos aprenden las normas, valores y comportamientos de la sociedad unos de otros, y Bernt Børnich, fundador y CEO de 1X Technologies , cree que los robots también deberían aprender así. «Para que los robots sean verdaderamente inteligentes y muestren matices como ser cuidadosos con su mascota, sostener la puerta abierta para una persona mayor y, en general, comportarse como queremos que se comporten los robots, tienen que vivir y aprender entre nosotros», dijo Børnich 1X Technologies se compromete a construir robots humanoides totalmente autónomos , con especial atención a la seguridad, la asequibilidad y la adaptabilidad. Børnich explicó cómo 1X Technologies utiliza una combinación de aprendizaje de refuerzo , demostraciones de expertos y datos del mundo real para permitir que sus robots aprendan continuamente y se adapten a nuevas situaciones. NEO, el próximo robot de la compañía, puede realizar tareas domésticas como aspirar, doblar la ropa, ordenar y recoger objetos. Su diseño prioriza la seguridad operativa, utilizando mecanismos tendinosos inspirados en el sistema musculoesquelético humano para lograr un bajo consumo de energía. Børnich destaca el potencial de los robots para mejorar la productividad humana al ayudar a manejar tareas mundanas, liberando a las personas para que se concentren más en las conexiones interpersonales y las actividades creativas. Descubre lo último en IA física y robótica en NVIDIA GTC París , del 10 al 12 de junio. Inscríbete para asistir a sesiones sobre humanoides, como: Marcas de tiempo 05:18 – El enfoque de 1X Technologies hacia la seguridad de los robots. 11:36 – Cómo los modelos mundiales permiten a los robots buscar hacia atrás desde el objetivo. 16:51 – Cómo los robots pueden liberar a los humanos para realizar actividades más significativas. 22:29 – NEO abre la puerta para que Børnich pueda entrevistar a un candidato. También te podría gustar…  Cómo los modelos de la Fundación Mundial impulsarán la IA física con Ming-Yu Liu de NVIDIA Los modelos de IA capaces de simular y predecir con precisión resultados en entornos físicos reales impulsarán la próxima generación de sistemas de IA físicos. Ming-Yu Liu, vicepresidente de investigación de NVIDIA y miembro del IEEE, explica la importancia de los modelos de base mundial : potentes redes neuronales capaces de simular entornos físicos. Roboflow ayuda a desbloquear la visión artificial para todo tipo de desarrolladores de IA La misión de Roboflow es hacer que el mundo sea programable mediante la visión artificial. Al simplificar el desarrollo de la visión artificial, la empresa ayuda a conectar a la IA con quienes buscan aprovecharla. El cofundador y director ejecutivo, Joseph Nelson, analiza cómo Roboflow permite a los usuarios de los sectores de la fabricación, la sanidad y la automoción resolver problemas complejos con IA visual. El director ejecutivo de Imbue, Kanjun Qiu, habla sobre la transformación de los agentes de IA en colaboradores personales. Kanjun Qiu, director ejecutivo de Imbue, explora la era emergente en la que las personas pueden crear y usar sus propios agentes de IA. Estableciendo un paralelismo con la revolución informática de finales de los años 70 y 80, Qiu analiza cómo los sistemas de IA modernos están evolucionando para trabajar en colaboración con los usuarios, mejorando sus capacidades en lugar de simplemente automatizar tareas. NVIDIA Blog. N. K. Traducido al español

Cómo los robots de 1X Technologies están aprendiendo a dar una mano Leer más »

Implementando su estrategia de transformación de telecomunicaciones con confianza

Lleve con confianza su transformación de telecomunicaciones al siguiente nivel con los servicios de implementación de Dell Technologies. La transformación de arquitecturas verticales aisladas a un modelo de plataforma nativa de la nube, horizontal y unificada es fundamental para el éxito de las telecomunicaciones, pero puede resultar abrumadora. Por eso, Dell Technologies creó el Programa Abierto de Transformación de Telecomunicaciones (Open Telecom Transformation Program ), un conjunto de servicios, productos y soluciones para ayudar a los proveedores de servicios de comunicaciones (CSP) a transformarse con confianza. Con cuatro fases: asesoramiento, implementación, soporte y adopción, y servicios gestionados, ahora nos centramos en el segundo paso crucial: los servicios de implementación. De la visión a la implementación con servicios de implementación Durante la fase de servicios de implementación, tomamos la estrategia y el diseño de alto nivel (HLD) desarrollados en la etapa de asesoría y los convertimos en soluciones prácticas para ayudarle a alcanzar sus objetivos de transformación. Aquí es donde nos ponemos manos a la obra y trabajamos codo con codo con todas las partes interesadas. Juntos, identificamos las tecnologías de Dell y nuestros socios en el ecosistema abierto de telecomunicaciones que mejor se adaptan a su futuro entorno. La fase de implementación consta de tres pasos esenciales, y en cada uno de ellos aportamos nuestra experiencia demostrada, garantizando el pleno cumplimiento de los estándares 3GPP. Este enfoque meticuloso y basado en estándares es crucial, ya que garantiza que las transformaciones de red no solo cumplan con los estándares de la industria, sino que también ofrezcan un rendimiento y una fiabilidad fiables y preparados para el futuro que respalden los objetivos de crecimiento e innovación. El paso de diseño detallado da vida a las estrategias de transformación mediante la creación de un plan a medida basado en sus cargas de trabajo actuales y futuras. Mediante consultas exhaustivas y la colaboración con el ecosistema, comprendemos las necesidades operativas de los CSP y diseñamos una arquitectura de plataforma en la nube adaptable para dar cabida a toda la red de telecomunicaciones, desde la RAN en la nube hasta el borde remoto y el centro de datos. Esto incluye la entrega de diseños de bajo nivel (HLD) y de bajo nivel (LLD) para las cargas de trabajo deseadas, desde unidades distribuidas virtualizadas (vDU) y centralizadas (vCU) hasta el núcleo 5G y OSS/BSS, junto con planes de automatización. Mediante herramientas y metodologías avanzadas, garantizamos que el diseño de la plataforma en la nube satisfaga las demandas de las cargas de trabajo del ecosistema. Este paso proporciona una estrategia clara y práctica, alineada con los objetivos operativos, eliminando las conjeturas durante la fase de diseño. La validación es clave para reducir riesgos y garantizar la fiabilidad antes de la implementación en vivo. Probamos rigurosamente el diseño mediante simulaciones de escenarios reales para identificar y resolver problemas de integración o rendimiento que favorezcan sus cargas de trabajo. Esto garantiza que las cargas de trabajo críticas de la red, como el núcleo 5G, funcionen correctamente en la red de producción. Nuestros ingenieros de laboratorio realizan pruebas exhaustivas que abarcan la funcionalidad, el rendimiento y la experiencia del usuario de la plataforma en la nube para validar la solución mediante herramientas de automatización avanzadas. Esta validación puede realizarse en nuestro Laboratorio de Ecosistemas Abiertos de Telecomunicaciones (OTEL) o en su laboratorio, según sus preferencias. Este proceso le ayuda a abordar los problemas con antelación, antes de que se implementen en un entorno de producción, lo que le permite ahorrar tiempo, optimizar recursos y minimizar el tiempo de inactividad. Una vez completada la validación, tendrá la seguridad de que la solución implementada cumplirá con los requisitos de calidad y rendimiento. La fase de implementación transforma las soluciones validadas en sistemas operativos sin interrupciones. Dell aporta una escala y una experiencia inigualables a esta etapa crítica, gestionando cada detalle, desde la preparación del sitio hasta la implementación, la integración y las pruebas finales, con precisión y una sólida gobernanza. Nuestras capacidades incluyen la preconfiguración de racks completos fuera de las instalaciones mediante nuestros servicios de integración de fábrica personalizados, lo que reduce el tiempo de implementación y mantiene la precisión y la consistencia. Con Dell Telecom Infrastructure Automation Suite, la configuración del hardware, el firmware y la BIOS para adaptarla a su diseño se vuelve sencilla, escalable y eficiente. Más allá de la ejecución técnica, nos centramos en integrar la solución en su modelo operativo como un sistema cohesivo, no solo como componentes separados. Este enfoque agiliza la adopción en toda su organización, lo que permite una alineación más rápida con sus operaciones. Ofreciendo resultados tangibles La culminación de los Servicios de Implementación es una infraestructura de telecomunicaciones completamente operativa, diseñada para cumplir con los objetivos futuros identificados en la etapa de servicios de asesoría. Durante la fase de implementación, obtendrá varias ventajas cruciales, entre ellas: Además, los conocimientos y procesos establecidos durante la fase de implementación proporcionan una base sólida para un mayor perfeccionamiento y crecimiento, sentando así las bases para el éxito operativo a largo plazo. ¿Qué viene después? Si bien los servicios de implementación proporcionan la base técnica para la transformación, son solo una pieza del rompecabezas. La siguiente fase, los servicios de adopción y soporte, se centra en impulsar la adopción por parte de los usuarios, optimizar las operaciones y garantizar que sus inversiones en tecnología generen valor continuo. Impulsando su futuro en las telecomunicaciones Los CSP deben transformarse para mantenerse competitivos y prosperar en un mundo donde la conectividad es fundamental y los servicios diferenciados son esenciales para el crecimiento. El Programa de Transformación de Open Telecom está diseñado específicamente para que los CSP puedan transformarse con confianza. Comuníquese con Dell Technologies hoy para obtener más información sobre el Programa de Transformación de Telecomunicaciones Abiertas y cómo puede ayudar a su organización a descubrir oportunidades sin explotar e impulsar el progreso. Dell Technologies Blog. L. T. Traducido al español

Implementando su estrategia de transformación de telecomunicaciones con confianza Leer más »

Scroll al inicio