El Portal de las Tecnologías para la Innovación

Un nuevo enfoque de IA generativa para predecir reacciones químicas

Fuente:

El sistema desarrollado en el MIT podría proporcionar predicciones realistas para una amplia variedad de reacciones, manteniendo al mismo tiempo las restricciones físicas del mundo real.

Se han realizado numerosos intentos para aprovechar el potencial de la nueva inteligencia artificial y los grandes modelos de lenguaje (LLM) para predecir los resultados de nuevas reacciones químicas. Estos han tenido un éxito limitado, en parte porque hasta ahora no se han basado en la comprensión de principios físicos fundamentales, como las leyes de conservación de la masa. Ahora, un equipo de investigadores del MIT ha ideado una forma de incorporar estas restricciones físicas en un modelo de predicción de reacciones, mejorando así considerablemente la precisión y la fiabilidad de sus resultados.

El nuevo trabajo fue publicado el 20 de agosto en la revista Nature , en un artículo del reciente investigador postdoctoral Joonyoung Joung (ahora profesor asistente en la Universidad Kookmin, Corea del Sur); el ex ingeniero de software Mun Hong Fong (ahora en la Universidad de Duke); el estudiante de posgrado en ingeniería química Nicholas Casetti; el investigador postdoctoral Jordan Liles; el estudiante de pregrado en física Ne Dassanayake; y el autor principal Connor Coley, quien es profesor de Desarrollo Profesional de la Clase de 1957 en los departamentos de Ingeniería Química, Ingeniería Eléctrica y Ciencias de la Computación del MIT.

“La predicción de los resultados de una reacción es una tarea fundamental”, explica Joung. Por ejemplo, si se desea crear un nuevo fármaco, “se necesita saber cómo hacerlo. Por lo tanto, esto requiere saber qué producto es probable” que resulte de un conjunto dado de insumos químicos en una reacción. Sin embargo, la mayoría de los esfuerzos previos para realizar tales predicciones se centran únicamente en un conjunto de insumos y un conjunto de productos, sin considerar los pasos intermedios ni las limitaciones para garantizar que no se gane ni se pierda masa en el proceso, lo cual no es posible en las reacciones reales.

Joung señala que, si bien los modelos de lenguaje grandes como ChatGPT han tenido mucho éxito en muchas áreas de investigación, estos modelos no permiten limitar sus resultados a posibilidades físicamente realistas, como exigirles que cumplan con la conservación de la masa. Estos modelos utilizan «tokens» computacionales, que en este caso representan átomos individuales, pero «si no se conservan los tokens, el modelo LLM comienza a generar nuevos átomos o a eliminarlos en la reacción». En lugar de basarse en un conocimiento científico real, «esto es como la alquimia», afirma. Si bien muchos intentos de predicción de reacciones solo se centran en los productos finales, «queremos rastrear todas las sustancias químicas y cómo se transforman» a lo largo del proceso de reacción, de principio a fin, añade.

Para abordar el problema, el equipo empleó un método desarrollado en la década de 1970 por el químico Ivar Ugi, que utiliza una matriz de electrones de enlace para representar los electrones en una reacción. Utilizaron este sistema como base para su nuevo programa, llamado FlowER (Flow Matching for Electron Redistribution), que les permite registrar explícitamente todos los electrones en la reacción para garantizar que no se añadan ni eliminen de forma espuria durante el proceso.

El sistema utiliza una matriz para representar los electrones en una reacción y utiliza valores distintos de cero para representar enlaces o pares de electrones solitarios, y ceros para representar la ausencia de estos. «Esto nos ayuda a conservar átomos y electrones simultáneamente», afirma Fong. Esta representación, añade, fue uno de los elementos clave para incluir la conservación de la masa en su sistema de predicción.

El sistema que desarrollaron aún se encuentra en una etapa inicial, afirma Coley. «El sistema, en su estado actual, es una demostración, una prueba de concepto, de que este enfoque generativo de coincidencia de flujo es muy adecuado para la predicción de reacciones químicas». Si bien el equipo está entusiasmado con este prometedor enfoque, añade, «somos conscientes de que presenta limitaciones específicas en cuanto a la variedad de químicas que ha observado». Si bien el modelo se entrenó con datos de más de un millón de reacciones químicas, obtenidos de una base de datos de la Oficina de Patentes de EE. UU., estos datos no incluyen ciertos metales ni algunos tipos de reacciones catalíticas, añade.

“Estamos sumamente entusiasmados con el hecho de que podemos obtener predicciones tan fiables de los mecanismos químicos” a partir del sistema existente, afirma. “Conserva la masa y los electrones, pero reconocemos que aún queda mucho por expandir y robustecer en los próximos años”.

Pero incluso en su forma actual, disponible gratuitamente a través de la plataforma en línea GitHub, «creemos que permitirá realizar predicciones precisas y será útil como herramienta para evaluar la reactividad y trazar las vías de reacción», afirma Coley. «Si miramos hacia el futuro, para avanzar realmente en la comprensión mecanicista y ayudar a inventar nuevas reacciones, aún no lo hemos logrado. Pero esperamos que esto sea un paso adelante en esa dirección».

«Es todo de código abierto», afirma Fong. «Los modelos, los datos, todo está disponible», incluyendo un conjunto de datos previo desarrollado por Joung que enumera exhaustivamente los pasos mecanísticos de las reacciones conocidas. «Creo que somos uno de los grupos pioneros en crear este conjunto de datos, ponerlo a disposición de todos en código abierto y hacerlo utilizable», concluye.

El modelo FlowerER iguala o supera los enfoques existentes para encontrar vías mecanísticas estándar, afirma el equipo, y permite generalizarlo a tipos de reacción nunca antes vistos. Afirman que el modelo podría ser relevante para predecir reacciones en la química medicinal, el descubrimiento de materiales, la combustión, la química atmosférica y los sistemas electroquímicos.

En sus comparaciones con los sistemas de predicción de reacciones existentes, Coley dice: «utilizando las opciones de arquitectura que hemos hecho, logramos este aumento masivo en validez y conservación, y obtenemos una precisión equivalente o ligeramente mejor en términos de rendimiento».

Añade que «lo singular de nuestro enfoque es que, si bien utilizamos la comprensión teórica de los mecanismos para generar este conjunto de datos, basamos los reactivos y productos de la reacción general en datos validados experimentalmente de la literatura de patentes». Están infiriendo los mecanismos subyacentes, afirma, en lugar de simplemente inventarlos. «Los imputamos a partir de datos experimentales, algo que no se había hecho ni compartido a esta escala antes».

El siguiente paso, dice, es «estamos muy interesados ​​en ampliar la comprensión del modelo sobre los metales y los ciclos catalíticos. Apenas hemos arañado la superficie en este primer artículo», y la mayoría de las reacciones incluidas hasta ahora no incluyen metales ni catalizadores, «así que esa es una dirección que nos interesa mucho».

A largo plazo, afirma, «gran parte del entusiasmo reside en usar este tipo de sistema para descubrir nuevas reacciones complejas y dilucidar nuevos mecanismos. Creo que el impacto potencial a largo plazo es considerable, pero, por supuesto, esto es solo un primer paso».

El trabajo fue apoyado por el consorcio Machine Learning for Pharmaceutical Discovery and Synthesis y la National Science Foundation.

MIT News. D. Ch. Traducido al español

Artículos relacionados

Epic Games Store

Shrine’s Legacy es un título de 16 bits que retoma la clásica fórmula de los RPG de Super Nintendo

Un joven héroe valiente, un mago misterioso, gemas mágicas y un tirano con tanta armadura que parece que no pueda ni moverse. ¿Os suena de algo? Shrine’s Legacy, el título debut de Positive Concept Games, se inspira en conceptos que han definido los juegos de rol durante décadas. Su protagonista, Rio Shrine, se embarca en una aventura para reunir ocho gemas elementales y restaurar la espada de Shrine (Sword of Shrine), la clave para derrotar al malvado Aklor.

Continuar leyendo...
Scroll al inicio