Al realizar un aprendizaje profundo a la velocidad de la luz, este chip podría brindar a los dispositivos periféricos nuevas capacidades para el análisis de datos en tiempo real.
A medida que más dispositivos conectados demandan una cantidad cada vez mayor de ancho de banda para tareas como el teletrabajo y la computación en la nube, resultará extremadamente difícil gestionar la cantidad finita de espectro inalámbrico disponible para que todos los usuarios lo compartan.
Los ingenieros están empleando inteligencia artificial para gestionar dinámicamente el espectro inalámbrico disponible, con el objetivo de reducir la latencia y mejorar el rendimiento. Sin embargo, la mayoría de los métodos de IA para clasificar y procesar señales inalámbricas consumen mucha energía y no pueden operar en tiempo real.
Ahora, investigadores del MIT han desarrollado un novedoso acelerador de hardware de IA, diseñado específicamente para el procesamiento de señales inalámbricas. Su procesador óptico realiza cálculos de aprendizaje automático a la velocidad de la luz, clasificando las señales inalámbricas en cuestión de nanosegundos.
El chip fotónico es aproximadamente 100 veces más rápido que la mejor alternativa digital, con una convergencia de aproximadamente el 95 % de precisión en la clasificación de señales. El nuevo acelerador de hardware también es escalable y flexible, por lo que podría utilizarse para diversas aplicaciones informáticas de alto rendimiento. Al mismo tiempo, es más pequeño, ligero, económico y energéticamente más eficiente que los aceleradores de hardware de IA digitales.
El dispositivo podría ser especialmente útil en futuras aplicaciones inalámbricas 6G, como radios cognitivas que optimizan las velocidades de datos adaptando los formatos de modulación inalámbrica al cambiante entorno inalámbrico.
Al permitir que un dispositivo edge realice cálculos de aprendizaje profundo en tiempo real, este nuevo acelerador de hardware podría proporcionar una aceleración drástica en muchas aplicaciones más allá del procesamiento de señales. Por ejemplo, podría ayudar a los vehículos autónomos a reaccionar en fracciones de segundo a los cambios ambientales o a que los marcapasos inteligentes monitoricen continuamente la salud cardíaca de un paciente.
“Existen muchas aplicaciones que podrían ser posibles gracias a dispositivos periféricos capaces de analizar señales inalámbricas. Lo que presentamos en nuestro artículo podría abrir muchas posibilidades para la inferencia de IA fiable y en tiempo real. Este trabajo es el comienzo de algo que podría tener un gran impacto”, afirma Dirk Englund, profesor del Departamento de Ingeniería Eléctrica y Ciencias de la Computación del MIT, investigador principal del Grupo de Fotónica Cuántica e Inteligencia Artificial y del Laboratorio de Investigación en Electrónica (RLE), y autor principal del artículo .
En el artículo, colaboran con él el autor principal, Ronald Davis III, doctorado (promoción de 2024); Zaijun Chen, exinvestigador posdoctoral del MIT y actual profesor adjunto en la Universidad del Sur de California; y Ryan Hamerly, científico visitante en RLE y científico sénior en NTT Research. La investigación se publica hoy en Science Advances .
Procesamiento a la velocidad de la luz
Los aceleradores digitales de IA de vanguardia para el procesamiento de señales inalámbricas convierten la señal en una imagen y la procesan mediante un modelo de aprendizaje profundo para clasificarla. Si bien este enfoque es muy preciso, el alto consumo computacional de las redes neuronales profundas lo hace inviable para muchas aplicaciones con plazos de entrega ajustados.
Los sistemas ópticos pueden acelerar las redes neuronales profundas mediante la codificación y el procesamiento de datos mediante luz, que además consume menos energía que la computación digital. Sin embargo, los investigadores han tenido dificultades para maximizar el rendimiento de las redes neuronales ópticas de propósito general cuando se utilizan para el procesamiento de señales, garantizando al mismo tiempo la escalabilidad del dispositivo óptico.
Al desarrollar una arquitectura de red neuronal óptica específicamente para el procesamiento de señales, a la que denominaron red neuronal óptica por transformada de frecuencia analógica multiplicativa (MAFT-ONN), los investigadores abordaron ese problema de frente.
MAFT-ONN aborda el problema de la escalabilidad codificando todos los datos de la señal y realizando todas las operaciones de aprendizaje automático dentro de lo que se conoce como el dominio de la frecuencia, antes de que se digitalicen las señales inalámbricas.
Los investigadores diseñaron su red neuronal óptica para realizar todas las operaciones lineales y no lineales en línea. Ambos tipos de operaciones son necesarios para el aprendizaje profundo.
Gracias a este diseño innovador, solo necesitan un dispositivo MAFT-ONN por capa para toda la red neuronal óptica, a diferencia de otros métodos que requieren un dispositivo para cada unidad computacional individual, o “neurona”.
“Podemos colocar 10.000 neuronas en un solo dispositivo y calcular las multiplicaciones necesarias de una sola vez”, afirma Davis.
Los investigadores logran esto mediante una técnica llamada multiplicación fotoeléctrica, que aumenta drásticamente la eficiencia. También les permite crear una red neuronal óptica que puede ampliarse fácilmente con capas adicionales sin requerir sobrecarga adicional.
Resultados en nanosegundos
MAFT-ONN toma una señal inalámbrica como entrada, procesa los datos de la señal y transmite la información para operaciones posteriores que realiza el dispositivo periférico. Por ejemplo, al clasificar la modulación de una señal, MAFT-ONN permitiría a un dispositivo inferir automáticamente el tipo de señal para extraer los datos que transporta.
Uno de los mayores desafíos que enfrentaron los investigadores al diseñar MAFT-ONN fue determinar cómo mapear los cálculos de aprendizaje automático al hardware óptico.
“No podíamos simplemente usar un marco de aprendizaje automático estándar. Tuvimos que adaptarlo al hardware y descubrir cómo aprovechar la física para que realizara los cálculos que queríamos”, dice Davis.
Al probar su arquitectura de clasificación de señales en simulaciones, la red neuronal óptica alcanzó una precisión del 85 % en una sola prueba, que puede converger rápidamente a más del 99 % de precisión utilizando múltiples mediciones. MAFT-ONN solo necesitó unos 120 nanosegundos para completar todo el proceso.
Cuanto más tiempo se mida, mayor será la precisión. Dado que MAFT-ONN calcula las inferencias en nanosegundos, no se pierde mucha velocidad para ganar precisión, añade Davis.
Mientras que los dispositivos de radiofrecuencia digital de última generación pueden realizar inferencias de aprendizaje automático en microsegundos, la óptica puede hacerlo en nanosegundos o incluso picosegundos.
En el futuro, los investigadores quieren emplear esquemas de multiplexación para realizar más cálculos y escalar el MAFT-ONN. También desean ampliar su trabajo a arquitecturas de aprendizaje profundo más complejas que puedan ejecutar modelos de transformadores o LLM.
Este trabajo fue financiado, en parte, por el Laboratorio de Investigación del Ejército de EE. UU., la Fuerza Aérea de EE. UU., el Laboratorio Lincoln del MIT, Nippon Telegraph and Telephone y la Fundación Nacional de Ciencias. MIT News. Traducido al español