Chubut Digital

Hidroelectricidad: un futuro aún lleno de recursos

Cambio Climático y Sostenibilidad, Energías Renovables y Naturales, Inteligencia Artificial Generativa, Inteligencia Artificial News, Papers de Investigación Científica / junio 19, 2025

Ante los desafíos del cambio climático y la transición energética, la hidroelectricidad se reinventa. En el INP de Grenoble – UGA, varios laboratorios exploran formas innovadoras de adaptar esta histórica forma de energía a las demandas del siglo XXI. Considerada desde hace tiempo como una tecnología madura, la hidroelectricidad está experimentando un resurgimiento. En Francia, ya se han equipado grandes emplazamientos y las presas se utilizan ampliamente. El potencial de desarrollo reside ahora en una escala menor, con microcentrales. Instaladas en ríos de bajo caudal, permiten la producción local de electricidad, sin necesidad de grandes infraestructuras de producción y transmisión. Sin embargo, presentan nuevos desafíos técnicos: caudales bajos, saltos limitados y condiciones de operación muy variables. Los equipos de LEGI* y CREMHygG** están diseñando turbinas a medida para este fin, optimizadas mediante simulación numérica y pruebas físicas de laboratorio. El objetivo es mantener una alta eficiencia energética a pesar de las fluctuaciones de los parámetros, a la vez que se reducen las pérdidas de línea y se aumenta la resiliencia de la red. Infraestructuras más flexibles y seguras Además de las microcentrales, la investigación también se centra en la adaptación de las instalaciones a gran escala a las demandas de la matriz energética. Con el auge de la energía solar y eólica, se recurre cada vez más a las centrales hidroeléctricas para compensar la intermitencia. «Antes, una turbina arrancaba una vez al día. Hoy, puede activarse una docena de veces», explica Frédéric Dufour, investigador del laboratorio 3SR*. Estos frecuentes arranques, fuera del rango óptimo de velocidad, exigen el diseño de turbinas más flexibles. Los investigadores trabajan en la forma de las palas, el número de álabes y la arquitectura de los motores para garantizar una buena eficiencia en un amplio rango operativo. Al mismo tiempo, la seguridad de la planta se está convirtiendo en un tema cada vez más delicado para una flota envejecida, especialmente ante riesgos sísmicos o riesgos asociados a nuevos regímenes de inundaciones. El laboratorio 3SR desarrolla sofisticados modelos numéricos para simular el comportamiento de las presas en situaciones extremas. Se llevan a cabo campañas de medición, en particular en el marco de la cátedra industrial Pereniti, que condujo a la instrumentación de la presa de Saint-Guérin. Entre las innovaciones que se están estudiando se encuentra la instalación de compuertas de seguridad diseñadas para aumentar la capacidad de retención de agua, garantizando al mismo tiempo la seguridad de la estructura. Hacia una energía hidroeléctrica inteligente La hibridación de fuentes de energía también genera nuevas oportunidades. G2Elab* explora la combinación de energía hidroeléctrica y fotovoltaica. En masas de agua artificiales, paneles solares flotantes producen electricidad durante el día, mientras que el agua se almacena para ser turbinada por la noche. Este enfoque complementario está alcanzando la fase de industrialización, especialmente en la planta de Le Cheylas, en los Alpes, donde se está diseñando una central eléctrica de bombeo (STEP) de EDF para equiparla con un sistema fotovoltaico flotante. Finalmente, las tecnologías digitales están transformando la forma en que mantenemos nuestras instalaciones. En colaboración con GIPSA-lab*, los investigadores están desarrollando herramientas de análisis predictivo utilizando datos recopilados por sensores (presión, temperatura, fugas, vibraciones, etc.). La inteligencia artificial se utiliza para identificar señales débiles de degradación antes de que se produzcan daños. Simultáneamente, se están desarrollando enfoques de fiabilidad en el marco de la Cátedra Medelia (Spretec, filial de Artelia), que se centra en la resistencia mecánica de grandes estructuras metálicas, en particular las compuertas de las esclusas de la Compagnie Nationale du Rhône. En la intersección de la ingeniería civil, la mecánica de fluidos, la electrónica de potencia y la ciencia de datos, la energía hidroeléctrica continúa innovando. Firmemente arraigada en la historia, ahora mira hacia un futuro decididamente sostenible y conectado. Grenoble INP – UGA News. Traducido al español

Hidroelectricidad: un futuro aún lleno de recursos Leer más »

Módulos robóticos blandos para nuevas interacciones hápticas

Inteligencia Artificial en la Salud Humana, Inteligencia Artificial Generativa, Inteligencia Artificial News, IoT, La IA aplicada a la Educación, Papers de Investigación Científica, Robótica y Automatización / junio 19, 2025

Investigadores de la EPFL han desarrollado un sistema robótico blando personalizable que utiliza aire comprimido para producir cambios de forma, vibraciones y otras respuestas hápticas (o táctiles) en diversas configuraciones. El dispositivo es muy prometedor para aplicaciones en realidad virtual, fisioterapia y rehabilitación. A diferencia de sus 16 configuraciones posibles, versátiles y bastante complejas, el diseño de la estructura Digits, desarrollada en el Laboratorio de Robótica Reconfigurable de la Escuela Politécnica Federal de Lausana (EPFL), es relativamente simple. Cada configuración se compone de múltiples módulos, o Digits, compuestos por enlaces rígidos unidos por juntas flexibles. Estas juntas se controlan mediante bolsas de aire presurizado para modificar la forma y la rigidez de los módulos. En un estudio publicado recientemente en Advanced Intelligent Systems , el director del Laboratorio de Robótica Reconfigurable, Jamie Paik, y su equipo presentan dos configuraciones de Digits (el TangiGlove portátil y el TangiBall portátil) que demuestran la versatilidad de su marco. Las interfaces hápticas o táctiles pueden mejorar las experiencias de realidad virtual al emular el tacto real y facilitar la rehabilitación mediante sistemas interactivos. Sin embargo, existe una necesidad real de diseños y métodos de control reconfigurables más generalizados, explica el estudiante de doctorado y primer autor, Serhat Demirtas. Gracias a su diseño modular, el framework Digits tiene potencial para una amplia gama de aplicaciones, incluido el entrenamiento muscular progresivo y la recuperación motora, así como diferentes configuraciones para interfaces hápticas en entornos virtuales. Igualando la riqueza sensorial del tacto humano A diferencia de otros sentidos humanos, como la vista y el oído, que son en gran medida pasivos, el tacto requiere acciones complejas, como frotar o agarrar, para percibir la textura, la temperatura, el peso, la forma o la rigidez. Por lo tanto, las tecnologías hápticas suelen desarrollarse para un único uso o aspecto del tacto, ya que resulta extremadamente difícil crear sistemas que combinen adaptabilidad y escalabilidad con una experiencia háptica realista. Nuestro objetivo con los módulos Digits es redefinir la interacción hombre-máquina a través de robots reconfigurables que adaptan su forma, rigidez y retroalimentación háptica.Jamie Paik La estructura Digits supera este desafío gracias a la tecnología robótica reconfigurable característica del laboratorio de Paik. Sorprendentemente, abarca dos categorías principales de configuración robótica: cadena cerrada y cadena abierta. Mientras que las estructuras de cadena abierta consisten en una serie de eslabones conectados y fijados en un extremo, como un brazo robótico, las configuraciones de cadena cerrada suelen tener un diseño de bucle con dos extremos fijos. Por lo tanto, el TangiGlove de cadena abierta se asemeja a un exoesqueleto, que puede utilizarse para proporcionar retroalimentación de rigidez al usuario. Por su parte, el TangiBall de cadena cerrada cuenta con cuatro Digits conectados que pueden adoptar hasta ocho formas diferentes, desde un cubo hasta una esfera, además de proporcionar retroalimentación de rigidez. Ambos dispositivos también pueden producir vibraciones. Además de su diseño modular, el marco Digits destaca por su enfoque en la actuación neumática (aire comprimido), un área poco explorada de la robótica para experiencias hápticas personalizadas. Para cerrar esta brecha, los científicos ampliaron el software robótico de código abierto Feelix, permitiendo a los usuarios crear perfiles personalizados de interacción háptica neumática. El sistema, basado en aprendizaje automático, puede detectar cambios táctiles en los módulos Digits y crear nuevas interacciones inteligentes e intuitivas, sin necesidad de programación. El equipo ya tiene planes para desarrollar el potencial de rehabilitación de la tecnología mediante la evaluación de escenarios terapéuticos y su usabilidad a largo plazo. También están investigando una gama más amplia de aplicaciones mediante nuevas configuraciones, especialmente aquellas que aprovechan las rápidas transiciones del dispositivo entre diferentes dimensiones, formas y rigideces, un requisito esencial para la interacción en tiempo real en entornos virtuales y aumentados. Nuestro objetivo con los módulos Digits es redefinir la interacción hombre-máquina mediante robots reconfigurables que adaptan su forma, rigidez y retroalimentación háptica. Esta adaptabilidad facilita una realidad virtual más tangible, una rehabilitación eficaz y experiencias más enriquecedoras para todos, independientemente de su tamaño, capacidad y necesidad, enfatiza Paik. Referencias Demirtas, S., van Oosterhout, A., Kadungamparambil John, R. y Paik, J. (2025), Retroalimentación háptica reconfigurable: Marco integral de diseño y control. Adv. Intell. Syst. 2500142. https://doi.org/10.1002/aisy.202500142 EPFL News. C. L. Traducido al español

Módulos robóticos blandos para nuevas interacciones hápticas Leer más »

Los modelos Grok de xAI ahora están en Oracle Cloud Infrastructure

Innovaciones Tecnológicas, Inteligencia Artificial Generativa, Inteligencia Artificial News, IoT, Nube e Infraestructura como Servicio / junio 18, 2025

Los clientes ahora pueden aprovechar los modelos de Grok a través del servicio de IA generativa OCI para abordar problemas complejos Impulsados por la infraestructura de IA de OCI, los modelos Grok aprovecharán las instancias de OCI Compute con importantes ventajas de precio-rendimiento y escalabilidad. xAI ha seleccionado a Oracle para ofrecer los modelos Grok de xAI a través del servicio de IA generativa Oracle Cloud Infrastructure (OCI) para una amplia gama de casos de uso, incluida la creación de contenido, la investigación y la automatización de procesos comerciales. xAI también aprovechará la escalabilidad, el rendimiento y la rentabilidad de la infraestructura de IA líder de OCI para entrenar y ejecutar inferencias para sus modelos Grok de próxima generación. “Grok 3 representa un gran avance en las capacidades de IA y la plataforma de datos avanzada de Oracle acelerará su impacto en las empresas”, afirmó Jimmy Ba, cofundador de xAI. “Esta colaboración entre xAI y Oracle redefinirá la IA empresarial”. Fundada en marzo de 2023, xAI está a la vanguardia de la innovación en IA, desarrollando tecnologías que amplían los límites de la comprensión humana. Grok 3, el modelo más reciente de xAI, cuenta con capacidades de razonamiento perfeccionadas mediante aprendizaje de refuerzo a gran escala con un alto rendimiento en matemáticas, programación y comprensión universal. Para brindar a las organizaciones un camino hacia una sólida gobernanza, gestión y seguridad de datos, los modelos de xAI se complementan con las capacidades empresariales de OCI. Además, todos los datos enviados por Oracle a los modelos de Grok se procesan en endpoints con retención de datos cero, lo que ofrece una capa adicional de protección. “Al ofrecer los modelos Grok de vanguardia de xAI a nuestros clientes, ampliamos las posibilidades de la IA en la empresa”, afirmó Greg Pavlik, vicepresidente ejecutivo de Servicios de IA y Gestión de Datos de Oracle Cloud Infrastructure. “Esta alianza refuerza nuestro compromiso de ofrecer las soluciones de IA más avanzadas, brindando a las organizaciones mayor variedad y flexibilidad para implementar las tecnologías de IA más recientes”. Oracle acerca la tecnología de IA de vanguardia a los datos empresariales y prioriza la seguridad, la adaptabilidad y la escalabilidad. Esto ayuda a clientes de todos los sectores a aplicar las tecnologías de IA adecuadas, incluyendo la IA generativa y la IA agente, a los escenarios de negocio adecuados para obtener resultados inmediatos. Además, miles de innovadores en IA aprovechan las capacidades de IA rentables y específicas de OCI para ejecutar las cargas de trabajo de IA más exigentes con mayor rapidez. Las instancias de GPU bare metal de OCI pueden impulsar aplicaciones para IA generativa, procesamiento del lenguaje natural, visión artificial y sistemas de recomendación. Windstream, un proveedor líder de servicios de telecomunicaciones con soluciones tecnológicas y de comunicaciones de red avanzadas, está explorando opciones para utilizar los modelos multimodales de xAI a través de OCI para crear flujos de trabajo más fluidos y empoderar a sus empleados. “En el dinámico y siempre cambiante panorama de las telecomunicaciones, la IA puede beneficiar a nuestro negocio de múltiples maneras”, afirmó Kaushik Bhanderi, vicepresidente sénior de Windstream. “Creemos que aprovechar los modelos Grok a través del servicio de IA Generativa OCI podría ofrecer ventajas reales, integrando la comprensión del lenguaje y el razonamiento para proponer acciones significativas”. Oracle News. Traducido al español

Los modelos Grok de xAI ahora están en Oracle Cloud Infrastructure Leer más »

Splunk + Cisco ThousandEyes: Nueva integración para la resiliencia digital de extremo a extremo

Ciberseguridad y Protección de Datos, Inteligencia Artificial Generativa, Inteligencia Artificial News, IoT, Nube e Infraestructura como Servicio, Robótica y Automatización / junio 18, 2025

Cisco unifica la observabilidad y la seguridad para brindar claridad y resiliencia en toda la huella digital, lo que ayuda a resolver problemas más rápidamente. Para aprovechar al máximo el potencial de la IA y la automatización, los equipos no pueden permitirse perder tiempo integrando información aislada. Por eso, estamos uniendo Splunk Observability y Cisco ThousandEyes Assurance con nuevas integraciones bidireccionales que conectan los puntos de su infraestructura digital, desde la aplicación hasta la infraestructura y la red. Si bien muchos clientes ya utilizan ambas soluciones mediante estándares abiertos como OpenTelemetry , estas nuevas integraciones van más allá: están diseñadas para garantizar un contexto compartido que permita un análisis de causa raíz más rápido, tiempos de recuperación más rápidos y, en definitiva, un mejor rendimiento y fiabilidad para los usuarios finales. La resiliencia digital implica anticiparse a los problemas antes de que se agraven y responder con rapidez cuando lo hacen, lo que ayuda a su empresa u organización a mantenerse operativa, independientemente de la disrupción. Con Splunk y ThousandEyes juntos, obtendrá información más rápida e inteligente que le ayudará a resolver incidentes antes de que los usuarios sientan el impacto. Es un gran avance hacia la observabilidad y la seguridad unificadas, que le ayudará a anticipar problemas, acelerar la respuesta y ofrecer experiencias digitales resilientes y siempre activas. Resolución proactiva de problemas en toda la huella digital Mientras que Splunk le permite desarrollar una práctica de observabilidad líder, con visibilidad en todas las aplicaciones e infraestructura para ver el impacto comercial de los problemas de rendimiento, ThousandEyes Assurance extiende esta visibilidad con inteligencia profunda en redes propias que usted controla y redes no propias que no controla (como ISP y proveedores de nube) para que pueda ver, comprender y mejorar cada experiencia conectada. Al combinar la observabilidad en tiempo real con inteligencia de red profunda en toda su red digital, Cisco permite a los equipos de ITOps, redes e ingeniería correlacionar datos de telemetría de aplicaciones, infraestructura y redes externas, como los proveedores de servicios de internet (ISP), en una vista única y unificada. Con análisis avanzados, gestión de incidentes basada en IA y flujos de trabajo automatizados, las integraciones ayudan a los equipos a prevenir problemas, resolverlos con mayor rapidez y ofrecer experiencias digitales fiables a los usuarios. Juntos, Splunk y ThousandEyes ayudan a las organizaciones a lograr una mayor resiliencia digital al proporcionar una visión unificada de los dominios de aplicaciones, infraestructura y redes. Estas integraciones incluyen: Una fuente de verdad para todos los equipos Ya sea que se trate de solucionar problemas de aplicaciones lentas, un problema de red o aplicaciones habilitadas para IA, Splunk y ThousandEyes están permitiendo a las organizaciones llegar a la causa raíz de los problemas en cascada más rápidamente dentro de su pila tecnológica, con menos conjeturas. Para maximizar el potencial futuro de la IA y la automatización, las organizaciones necesitan consolidar los datos y la visibilidad. Gracias a la combinación de capacidades de Splunk y ThousandEyes, las organizaciones pueden eliminar los silos y lograr una mayor resiliencia digital para anticipar las necesidades de los entornos actuales y futuros. CISCO Blog. J. V. y P. L. Traducido al español

Splunk + Cisco ThousandEyes: Nueva integración para la resiliencia digital de extremo a extremo Leer más »

La inteligencia artificial reinventa la predicción de enfermedades infecciosas

Inteligencia Artificial en la Salud Humana, Inteligencia Artificial Generativa, Inteligencia Artificial News, Papers de Investigación Científica / junio 18, 2025

La nueva herramienta es la primera en utilizar modelos de lenguaje amplios para predecir el riesgo de enfermedades infecciosas. Una nueva herramienta de IA para predecir la propagación de enfermedades infecciosas supera los métodos de pronóstico de última generación existentes. La herramienta, creada con apoyo federal por investigadores de las universidades Johns Hopkins y Duke, podría revolucionar la forma en que los funcionarios de salud pública predicen, rastrean y gestionan los brotes de enfermedades infecciosas, incluida la gripe y el COVID-19. «La COVID-19 ilustró el desafío de predecir la propagación de la enfermedad debido a la interacción de factores complejos en constante cambio», afirmó Lauren Gardner , autora de Johns Hopkins y experta en modelado que creó el panel de control de la COVID-19 , utilizado por personas de todo el mundo durante la pandemia. «Cuando las condiciones eran estables, los modelos funcionaban correctamente. Sin embargo, cuando surgían nuevas variantes o cambiaban las políticas, no podíamos predecir los resultados porque no contábamos con la capacidad de modelado necesaria para incluir información crítica. La nueva herramienta cubre esta deficiencia». El trabajo se publica hoy en Nature Computational Science .Cuando surgieron nuevas variantes [de COVID-19] o cambiaron las políticas, no pudimos predecir los resultados porque no teníamos la capacidad de modelarlas. La nueva herramienta llena ese vacío.Lauren GardnerEscuela de Ingeniería Whiting Durante la pandemia de coronavirus, la tecnología que sustenta la nueva herramienta no existía. El equipo utiliza por primera vez el modelado de lenguajes extensos, el tipo de IA generativa más conocido en ChatGPT, para predecir la propagación de la enfermedad. En lugar de tratar la predicción simplemente como un problema matemático, el modelo, llamado PandemicLLM, razona con ella, considerando datos como picos de infección recientes, nuevas variantes y mandatos de uso de mascarillas. El equipo alimentó los modelos con flujos de información, incluidos datos nunca antes utilizados en herramientas de predicción de pandemias, y descubrió que PandemicLLM podía predecir con precisión los patrones de enfermedad y las tendencias de hospitalización con una a tres semanas de anticipación, superando sistemáticamente a otros métodos, incluidos los de mayor rendimiento en CovidHub de los CDC . «Un desafío apremiante en la predicción de enfermedades es tratar de determinar qué impulsa los aumentos repentinos de infecciones y hospitalizaciones», dijo Gardner, «e incorporar estos nuevos flujos de información al modelado». El modelo se basa en cuatro tipos de datos: Después de consumir esta información, el modelo puede predecir cómo los diversos elementos se combinarán para afectar el comportamiento de la enfermedad. Para probarlo, el equipo lo aplicó retroactivamente a la pandemia de COVID-19, analizando cada estado de EE. UU. a lo largo de 19 meses. En comparación con otros modelos, la nueva herramienta resultó especialmente eficaz durante la fase de cambio del brote. «Tradicionalmente, utilizamos el pasado para predecir el futuro», afirmó el autor Hao «Frank» Yang , profesor adjunto de Ingeniería Civil y de Sistemas de Johns Hopkins, especializado en el desarrollo de IA fiable. «Pero esto no proporciona al modelo suficiente información para comprender y predecir lo que está sucediendo. En cambio, este marco utiliza nuevos tipos de información en tiempo real». Con los datos necesarios, el modelo puede adaptarse a cualquier enfermedad infecciosa, como la gripe aviar, la viruela del simio y el VSR. El equipo está explorando la capacidad de los LLM para replicar cómo las personas toman decisiones sobre su salud, con la esperanza de que este modelo ayude a las autoridades a diseñar políticas más seguras y eficaces. «Sabemos por la COVID-19 que necesitamos mejores herramientas para poder fundamentar políticas más eficaces», afirmó Gardner. «Habrá otra pandemia, y este tipo de marcos serán cruciales para apoyar la respuesta de salud pública». Los autores incluyeron: el estudiante de doctorado de Johns Hopkins Hongru Du; el estudiante de posgrado de Johns Hopkins Yang Zhao; Jianan Zhao de la Universidad de Montreal; el estudiante de doctorado de Johns Hopkins Shaochong Xu; Xihong Lin de la Universidad de Harvard; y el profesor Yiran Chen de la Universidad de Duke. Este trabajo fue financiado por la National Science Foundation 2229996; los Centros para el Control y la Prevención de Enfermedades RFA-FT-23-0069; el Centro de Pronóstico y Análisis de Brotes de los CDC 6 NU38FT000012-01; el Premio Future Insight de Merck KGaA; la NSF 2112562; la Oficina de Investigación del Ejército W911NF-23-2-0224. Universidad Johns Hopkins News. J. R. Traducido al español

La inteligencia artificial reinventa la predicción de enfermedades infecciosas Leer más »

Descifrando el sesgo de los grandes modelos lingüísticos

Inteligencia Artificial Generativa, Inteligencia Artificial News, IoT, La Ética y la Inteligencia Artificial, Papers de Investigación Científica / junio 18, 2025

En un nuevo estudio, los investigadores descubren la causa raíz de un tipo de sesgo en los LLM, allanando el camino para sistemas de IA más precisos y confiables. Las investigaciones han demostrado que los modelos de lenguaje grandes (LLM) tienden a enfatizar demasiado la información al principio y al final de un documento o conversación, mientras que descuidan la parte media. Este “sesgo de posición” significa que, si un abogado usa un asistente virtual con tecnología LLM para recuperar una determinada frase en una declaración jurada de 30 páginas, es más probable que el LLM encuentre el texto correcto si está en las páginas iniciales o finales. Investigadores del MIT han descubierto el mecanismo detrás de este fenómeno. Crearon un marco teórico para estudiar cómo fluye la información a través de la arquitectura de aprendizaje automático que constituye la base de los LLM. Descubrieron que ciertas decisiones de diseño que controlan cómo el modelo procesa los datos de entrada pueden causar sesgo de posición. Sus experimentos revelaron que las arquitecturas de modelos, particularmente aquellas que afectan cómo se distribuye la información entre las palabras de entrada dentro del modelo, pueden generar o intensificar el sesgo de posición, y que los datos de entrenamiento también contribuyen al problema. Además de señalar los orígenes del sesgo de posición, su marco se puede utilizar para diagnosticarlo y corregirlo en futuros diseños de modelos. Esto podría conducir a chatbots más confiables que se mantengan en el tema durante largas conversaciones, sistemas de inteligencia artificial médica que razonen de manera más justa al manejar una gran cantidad de datos de pacientes y asistentes de código que presten más atención a todas las partes de un programa. “Estos modelos son cajas negras, así que, como usuario de un Máster en Derecho (LLM), probablemente desconozca que el sesgo de posición puede provocar inconsistencias en su modelo. Simplemente le introduce sus documentos en el orden que desee y espera que funcione. Pero al comprender mejor el mecanismo subyacente de estos modelos de caja negra, podemos mejorarlos abordando estas limitaciones”, afirma Xinyi Wu, estudiante de posgrado del Instituto de Datos, Sistemas y Sociedad (IDSS) del MIT y del Laboratorio de Sistemas de Información y Decisión (LIDS), y primera autora de un artículo sobre esta investigación. Entre sus coautores se encuentran Yifei Wang, investigadora posdoctoral del MIT; y las autoras principales Stefanie Jegelka, profesora asociada de Ingeniería Eléctrica e Informática (EECS) y miembro del IDSS y del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL); y Ali Jadbabaie, profesor y director del Departamento de Ingeniería Civil y Ambiental, miembro del cuerpo docente del IDSS e investigador principal del LIDS. La investigación se presentará en la Conferencia Internacional sobre Aprendizaje Automático. Analizando la atención Los LLM como Claude, Llama y GPT-4 se basan en una arquitectura de red neuronal conocida como transformador. Los transformadores están diseñados para procesar datos secuenciales, codificando una oración en fragmentos llamados tokens y luego aprendiendo las relaciones entre estos tokens para predecir qué palabras vienen a continuación. Estos modelos se han vuelto muy buenos en esto debido al mecanismo de atención, que utiliza capas interconectadas de nodos de procesamiento de datos para dar sentido al contexto al permitir que los tokens se concentren selectivamente o presten atención a tokens relacionados. Pero si cada token puede atender a todos los demás tokens en un documento de 30 páginas, esto se vuelve rápidamente inviable desde el punto de vista computacional. Por lo tanto, cuando los ingenieros construyen modelos de transformadores, suelen emplear técnicas de enmascaramiento de atención que limitan las palabras a las que un token puede atender. Por ejemplo, una máscara causal sólo permite que las palabras presten atención a aquellas que las precedieron. Los ingenieros también utilizan codificaciones posicionales para ayudar al modelo a comprender la ubicación de cada palabra en una oración, mejorando el rendimiento. Los investigadores del MIT construyeron un marco teórico basado en gráficos para explorar cómo estas elecciones de modelos, máscaras de atención y codificaciones posicionales, podrían afectar el sesgo de posición. Todo está acoplado y entrelazado dentro del mecanismo de atención, por lo que es muy difícil de estudiar. Los grafos son un lenguaje flexible para describir la relación de dependencia entre las palabras dentro del mecanismo de atención y rastrearlas a través de múltiples capas, afirma Wu. Su análisis teórico sugirió que el enmascaramiento causal le da al modelo un sesgo inherente hacia el comienzo de una entrada, incluso cuando ese sesgo no existe en los datos. Si las palabras anteriores son relativamente poco importantes para el significado de una oración, el enmascaramiento causal puede hacer que el transformador preste más atención a su comienzo de todos modos. “Si bien suele ser cierto que las palabras anteriores y posteriores en una oración son más importantes, si se utiliza un LLM en una tarea que no es la generación de lenguaje natural, como la clasificación o la recuperación de información, estos sesgos pueden ser extremadamente perjudiciales”, afirma Wu. A medida que un modelo crece, con capas adicionales de mecanismo de atención, este sesgo se amplifica porque las partes anteriores de la entrada se utilizan con mayor frecuencia en el proceso de razonamiento del modelo. También descubrieron que el uso de codificaciones posicionales para vincular las palabras con mayor fuerza a palabras cercanas puede mitigar el sesgo de posición. La técnica reenfoca la atención del modelo en el punto correcto, pero su efecto puede diluirse en modelos con más capas de atención. Y estas opciones de diseño son solo una de las causas del sesgo de posición: algunas pueden provenir de los datos de entrenamiento que el modelo utiliza para aprender a priorizar las palabras en una secuencia. «Si sabes que tus datos están sesgados de cierta manera, entonces también deberías ajustar tu modelo además de ajustar tus opciones de modelado», dice Wu. Perdido en el medio Después de establecer un marco teórico, los investigadores realizaron experimentos en los que variaron sistemáticamente la posición de la respuesta correcta en secuencias

Descifrando el sesgo de los grandes modelos lingüísticos Leer más »

Mejores imágenes para humanos y computadoras

Cambio Climático y Sostenibilidad, Innovaciones Tecnológicas, Inteligencia Artificial en la Salud Humana, Inteligencia Artificial Generativa, Inteligencia Artificial News, IoT, Papers de Investigación Científica / junio 18, 2025

Investigadores de la ETH de Zúrich y Empa han desarrollado un nuevo sensor de imagen hecho de perovskita.Este material semiconductor permite una mejor reproducción del color y reduce los artefactos de imagen con menos luz. Los sensores de perovskita también son especialmente adecuados para la visión artificial. En resumen Los sensores de imagen están integrados en todos los teléfonos inteligentes y cámaras digitales. Distinguen los colores de forma similar al ojo humano. En nuestras retinas, los conos individuales reconocen el rojo, el verde y el azul (RGB). En los sensores de imagen, cada píxel absorbe las longitudes de onda correspondientes y las convierte en señales eléctricas. La gran mayoría de los sensores de imagen están hechos de silicio. Este material semiconductor normalmente absorbe luz en todo el espectro visible. Para fabricarlo en sensores de imagen RGB, es necesario filtrar la luz entrante. Los píxeles para el rojo contienen filtros que bloquean (y desperdician) el verde y el azul, etc. Por lo tanto, cada píxel de un sensor de imagen de silicio solo recibe alrededor de un tercio de la luz disponible. Maksym Kovalenko y su equipo, asociados con la ETH de Zúrich y Empa, han propuesto una novedosa solución que les permite utilizar cada fotón de luz para el reconocimiento de colores. Llevan casi una década investigando sensores de imagen basados en perovskita. En un nuevo estudio publicado en la prestigiosa revista Nature, demuestran que la nueva tecnología funciona. píxeles apilados La base de su innovador sensor de imagen es la perovskita de haluro de plomo. Este material cristalino también es un semiconductor. Sin embargo, a diferencia del silicio, es especialmente fácil de procesar y sus propiedades físicas varían según su composición química exacta. Esto es precisamente lo que los investigadores aprovechan en la fabricación de sensores de imagen de perovskita. Si la perovskita contiene un poco más de iones de yodo, absorbe la luz roja. Para el verde, los investigadores añaden más bromo, y para el azul, más cloro, sin necesidad de filtros. Las capas de píxeles de perovskita permanecen transparentes para las demás longitudes de onda, lo que permite su paso. Esto significa que los píxeles para el rojo, el verde y el azul pueden apilarse uno encima del otro en el sensor de imagen, a diferencia de los sensores de imagen de silicio, donde los píxeles están dispuestos uno junto al otro. Gracias a esta disposición, los sensores de imagen basados en perovskita pueden, en teoría, capturar tres veces más luz que los sensores de imagen convencionales de la misma superficie, a la vez que ofrecen una resolución espacial tres veces mayor. Investigadores del equipo de Kovalenko lograron demostrarlo hace unos años, inicialmente con píxeles individuales de gran tamaño compuestos por monocristales de un milímetro de grosor. Ahora, por primera vez, han construido dos sensores de imagen de perovskita de película delgada completamente funcionales. «Estamos desarrollando la tecnología desde una prueba de concepto preliminar hasta una dimensión donde realmente pueda utilizarse», afirma Kovalenko. Un proceso de desarrollo normal para componentes electrónicos: «El primer transistor consistía en una gran pieza de germanio con un par de conexiones. Hoy, 60 años después, los transistores miden tan solo unos pocos nanómetros». Los sensores de imagen de perovskita aún se encuentran en las primeras etapas de desarrollo. Sin embargo, con los dos prototipos, los investigadores demostraron que la tecnología se puede miniaturizar. Fabricados mediante procesos de película delgada comunes en la industria, los sensores han alcanzado su tamaño objetivo, al menos en la dimensión vertical. «Por supuesto, siempre hay potencial de optimización», señala el coautor Sergii Yakunin, del equipo de Kovalenko. En numerosos experimentos, los investigadores pusieron a prueba los dos prototipos, que difieren en su tecnología de lectura. Los resultados demuestran las ventajas de la perovskita: los sensores son más sensibles a la luz, más precisos en la reproducción del color y pueden ofrecer una resolución significativamente mayor que la tecnología de silicio convencional. El hecho de que cada píxel capture toda la luz también elimina algunos de los artefactos de la fotografía digital, como el demosaico y el efecto muaré. Visión artificial para la medicina y el medio ambiente Sin embargo, las cámaras digitales de consumo no son el único ámbito de aplicación de los sensores de imagen de perovskita. Gracias a las propiedades del material, también son especialmente adecuados para su uso en visión artificial. El enfoque en rojo, verde y azul lo determina el ojo humano: estos sensores de imagen funcionan en formato RGB porque nuestros ojos ven en modo RGB. Sin embargo, al resolver tareas específicas, es recomendable especificar otros rangos de longitud de onda óptimos que el sensor de imagen de la computadora debe leer. A menudo hay más de tres, lo que se conoce como imágenes hiperespectrales. Los sensores de perovskita ofrecen una ventaja decisiva en la obtención de imágenes hiperespectrales. Los investigadores pueden controlar con precisión el rango de longitud de onda que absorbe cada capa. «Con la perovskita, podemos definir un mayor número de canales de color claramente separados entre sí», afirma Yakunin. El silicio, con su amplio espectro de absorción, requiere numerosos filtros y complejos algoritmos informáticos. «Esto resulta muy poco práctico incluso con un número relativamente pequeño de colores», resume Kovalenko. Los sensores de imagen hiperespectral basados en perovskita podrían utilizarse, por ejemplo, en análisis médicos o en la monitorización automatizada de la agricultura y el medio ambiente. En el siguiente paso, los investigadores quieren reducir aún más el tamaño y aumentar la cantidad de píxeles en sus sensores de imagen de perovskita. Sus dos prototipos tienen tamaños de píxel de entre 0,5 y 1 milímetro. Los píxeles en los sensores de imagen comerciales están en el rango micrométrico (1 micrómetro equivale a 0,001 milímetro). «Debería ser posible fabricar píxeles incluso más pequeños a partir de perovskita que de silicio», afirma Yakunin. Las conexiones electrónicas y las técnicas de procesamiento deben adaptarse a la nueva tecnología. «La electrónica de lectura actual está optimizada para el silicio. Pero la perovskita

Mejores imágenes para humanos y computadoras Leer más »

Imperial apoya a Bristol en un Plan de Acción de Crecimiento Cibernético para el Gobierno

La IA aplicada a la Educación, Nube e Infraestructura como Servicio, Papers de Investigación Científica / junio 18, 2025

El Centro de Rendimiento Económico Sectorial del Imperial College de Londres apoyará a la Universidad de Bristol en el desarrollo de un Plan de Acción de Crecimiento Cibernético. Este plan establecerá recomendaciones para que el Gobierno apoye el crecimiento del sector de seguridad cibernética del Reino Unido, garantizando nuestra seguridad y resiliencia económica. El Plan de Acción para el Crecimiento Cibernético es una iniciativa independiente, liderada por expertos, para evaluar las capacidades cibernéticas del Reino Unido e identificar oportunidades estratégicas de expansión. Esta iniciativa forma parte de la actualización más amplia de la Estrategia Nacional Cibernética del gobierno, cuya presentación está prevista para finales de este año. El profesor Chris Hankin , figura destacada en ciberseguridad del Departamento de Informática del Imperial College, trabajará con colegas de Bristol, entre ellos el profesor Simon Shiu. El equipo directivo también incluye expertos del Centro de Rendimiento Económico Sectorial del Imperial College y del Instituto de Futuros Digitales de Bristol. El plan se centrará en cuatro líneas de trabajo clave: El profesor Nigel Brandon , decano de la Facultad de Ingeniería del Imperial College, afirmó: «Este es un momento importante para evaluar las capacidades cibernéticas del Reino Unido y considerar cómo podemos aprovecharlas. El Centro para el Rendimiento Económico Sectorial se encuentra en una posición privilegiada para colaborar con el DSIT y sus colegas del mundo académico y la industria, aunando una amplia gama de perspectivas para comprender los desafíos y las oportunidades futuras del sector cibernético». El Plan de Crecimiento culminará en un conjunto de recomendaciones que se entregarán a finales de este verano y que ofrecerán una hoja de ruta para la acción gubernamental destinada a garantizar que el Reino Unido siga siendo un líder mundial en ciberseguridad. Imperial College London News. J. W. Traducido al español

Imperial apoya a Bristol en un Plan de Acción de Crecimiento Cibernético para el Gobierno Leer más »

Hacia una producción de hidrógeno más eficiente

Cambio Climático y Sostenibilidad, Energías Renovables y Naturales, Papers de Investigación Científica / junio 18, 2025

Científicos de la EPFL han desentrañado los detalles del primer paso crucial en la reacción de evolución del oxígeno, un cuello de botella para la producción de hidrógeno limpio, utilizando simulaciones avanzadas y técnicas de aprendizaje automático. En nuestra búsqueda de fuentes de energía más limpias, el hidrógeno destaca por su capacidad para almacenar y distribuir energía sin producir emisiones de carbono, ya que su combustión solo genera agua. Esto lo convierte en uno de los combustibles más limpios disponibles. Una de las formas de producir hidrógeno es mediante un proceso llamado «disociación del agua» , que descompone el agua en hidrógeno y oxígeno utilizando la luz solar. La disociación del agua permite que el hidrógeno esté ampliamente disponible, pero a pesar de décadas de investigación, sigue siendo demasiado ineficiente. El cuello de botella en la producción de hidrógeno El cuello de botella siempre ha sido el primer paso: mover un protón y un electrón de forma coordinada, un proceso denominado transferencia de electrones acoplada a protones (PCET) . En este proceso, un protón y un electrón se mueven en sintonía para contribuir a la descomposición de las moléculas de agua, lo que lo convierte en un paso clave para la producción de hidrógeno y oxígeno. La REA se produce en la interfaz entre un material que absorbe la luz, como el vanadato de bismuto (BiVO₄), y el agua, y es notoriamente lenta. Durante la reacción, el BiVO₄ ayuda a extraer electrones y protones de las moléculas de agua, lo que produce oxígeno gaseoso. En otras palabras, el BiVO₄ es la superficie de trabajo donde ocurre este paso crucial y lento. El paso clave: transferencia de electrones acoplada a protones El cuello de botella siempre ha sido el primer paso: el movimiento conjunto de un protón y un electrón, un proceso denominado transferencia de electrones acoplada a protones (PCET) . En este proceso, un protón y un electrón se mueven juntos para contribuir a la descomposición de las moléculas de agua, lo que lo convierte en un paso clave para la producción de hidrógeno y oxígeno. A pesar de los avances en la comprensión de la termodinámica del PCET, determinar su mecanismo exacto ha sido difícil. Estudios previos a menudo han pasado por alto el movimiento caótico de las moléculas de agua en la superficie del BiVO₄ o se han basado en métodos que no alcanzaban el tiempo ni la precisión necesarios. Esto ha dejado una brecha en nuestra comprensión de por qué el BiVO₄ funciona como lo hace y cómo mejorarlo. Simulaciones avanzadas revelan la danza Ahora, dos investigadores de la EPFL, Yong-Bin Zhuang y Alfredo Pasquarello, han encontrado una solución al problema. Al combinar simulaciones de dinámica molecular a largo plazo con potenciales de aprendizaje automático (algoritmos entrenados para imitar cálculos cuánticos de alto nivel), los científicos capturaron la dinámica completa de átomos y electrones en la interfaz BiVO₄-agua. Centrándose en el primer paso del REA, el evento PCET inicial, descubrieron que el protón se mueve primero, seguido del electrón, y esta secuencia marca el ritmo de la reacción. Los científicos construyeron un modelo atómico detallado de la interfaz BiVO₄-agua y utilizaron aprendizaje automático para predecir las fuerzas entre los átomos con gran precisión. Esto les permitió ejecutar simulaciones mucho más largas de lo que sería posible con los cálculos cuánticos estándar: lo suficiente (hasta 30 nanosegundos) para obtener resultados estables y convergentes, y muestrear cientos de miles de configuraciones atómicas. Mediante un seguimiento cuidadoso de variables clave como la posición del protón y la ubicación cambiante del «hueco» (la ausencia de un electrón), pudieron observar el desarrollo completo del proceso PCET. También utilizaron múltiples modelos de aprendizaje automático entrenados independientemente para garantizar la solidez de sus resultados. ¿Qué hace que la producción de hidrógeno sea lenta? Las simulaciones revelaron algo importante: el paso más lento, determinante de la velocidad, es la transferencia directa de un protón desde una molécula de agua adsorbida en la superficie de BiVO₄ a un átomo de oxígeno vecino en la superficie. El electrón (o «hueco») solo salta a su nuevo sitio después de que el protón se haya movido. El estudio también demostró que esta transferencia directa de protones, a diferencia de una ruta indirecta que involucra moléculas de agua adicionales, domina el proceso. Esta idea concuerda con experimentos recientes que señalaron la transferencia de protones como el cuello de botella de la reacción. Sabiendo que la transferencia de protones limita la reacción, los científicos ahora pueden centrarse en encontrar maneras de acelerar este paso específico, quizás modificando la superficie de BiVO₄ o usando aditivos para estabilizar estructuras clave. El estudio también establece un nuevo estándar para la simulación de reacciones complejas en interfaces, demostrando que el aprendizaje automático puede reducir la diferencia entre precisión y coste computacional. Fondos Centro Nacional Suizo de Supercomputación (CSCS) Referencias Yong-Bin Zhuang, Alfredo Pasquarello. Mecanismo de la primera transferencia de electrones acoplada a protones en la oxidación del agua en la interfase ecuación-agua. Angewandte Chemie – Edición Internacional, 24 de mayo de 2025. DOI: 10.1002/anie.202507071 EPFL News. N. P. Traducido al español

Hacia una producción de hidrógeno más eficiente Leer más »

El Portal de las Tecnologías para la Innovación