De la previsión de tormentas al diseño de moléculas: cómo los nuevos modelos de IA pueden acelerar los descubrimientos científicos
La gente siempre ha buscado patrones para explicar el universo y predecir el futuro. “Cielo rojo por la noche, alegría del marinero. Cielo rojo por la mañana, advertencia del marinero” es un adagio que predice el tiempo. La IA es muy buena para detectar patrones y hacer predicciones. Ahora, los investigadores de Microsoft están trabajando para aplicar “modelos básicos” (modelos a gran escala que aprovechan los avances recientes de la IA) a las disciplinas científicas. Estos modelos se entrenan con una amplia variedad de datos y pueden sobresalir en muchas tareas, a diferencia de los modelos más especializados. Tienen el potencial de generar respuestas en una fracción del tiempo que se requería tradicionalmente y ayudan a resolver problemas más sofisticados. Algunas de las disciplinas científicas más diversas que prometen avances gracias a la IA son la ciencia de los materiales, la ciencia del clima, la atención sanitaria y las ciencias de la vida. Los expertos afirman que los modelos básicos adaptados a estas disciplinas acelerarán el proceso de descubrimiento científico, lo que les permitirá crear con mayor rapidez cosas prácticas como medicamentos, nuevos materiales o previsiones meteorológicas más precisas, pero también comprender mejor los átomos, el cuerpo humano o la Tierra. Actualmente, muchos de estos modelos todavía están en desarrollo en Microsoft Research, y el primero, un modelo meteorológico llamado Aurora , ya está disponible. “La IA es una herramienta de nuestro arsenal que puede ayudarnos”, afirmó Bonnie Kruft, socia y subdirectora de Microsoft Research, que colabora en la supervisión del laboratorio de IA para la ciencia . “La idea es que estamos trabajando en modelos muy específicos de la ciencia en lugar de modelos específicos del lenguaje. Vemos esta increíble oportunidad de ir más allá de los grandes modelos tradicionales basados en el lenguaje humano hacia un nuevo paradigma que emplea las matemáticas y las simulaciones moleculares para crear un modelo aún más potente para el descubrimiento científico”. Los recientes avances en inteligencia artificial que han permitido a las personas planificar fiestas, generar presentaciones gráficas con algunas indicaciones para conversar u obtener resúmenes instantáneos de reuniones a las que no han asistido fueron impulsados inicialmente por una nueva clase de modelos de inteligencia artificial conocidos como modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés). Este tipo de modelo de base se entrena con grandes cantidades de texto para realizar una amplia variedad de tareas relacionadas con el lenguaje. Ahora, los investigadores de Microsoft están descubriendo cómo algunas de estas mismas arquitecturas y enfoques de inteligencia artificial pueden impulsar avances en el descubrimiento científico. “Los modelos de lenguaje a gran escala tienen dos propiedades notables que son muy útiles. La primera es, por supuesto, que pueden generar y comprender el lenguaje humano, por lo que proporcionan una maravillosa interfaz humana para tecnologías muy sofisticadas. Pero la otra propiedad de los modelos de lenguaje a gran escala –y creo que esto fue una gran sorpresa para muchos de nosotros– es que pueden funcionar como motores de razonamiento efectivos. Y, por supuesto, eso será muy útil en el descubrimiento científico”, dijo Chris Bishop, miembro técnico y director de Microsoft Research AI for Science, en una conferencia magistral en el Microsoft Research Forum a principios de este año. En un principio, los investigadores de IA pensaron que modelos muy específicos entrenados para realizar una tarea específica (como los que podían ganar al ajedrez o al backgammon (pero no a ambos), o los que podían traducir idiomas o transcribir grabaciones (pero no a ambos)) superarían a modelos generalizados más grandes, como los LLM. Pero resultó que sucedió lo contrario: no hubo necesidad de entrenar un modelo para responder preguntas o resumir investigaciones sobre derecho, otro sobre física y otro sobre Shakespeare, porque un modelo grande y generalizado era capaz de superar en diferentes materias y tareas. Ahora, los investigadores están investigando la posibilidad de que los modelos básicos puedan hacer lo mismo en el caso de la ciencia. https://youtube.com/watch?v=CJejmZ5Luo4%3Ffeature%3Doembed%26enablejsapi%3D1%26origin%3Dhttps%253A%252F%252Fnews.microsoft.com Tradicionalmente, el descubrimiento científico implicaba desarrollar una hipótesis, probarla, ajustarla a lo largo de muchas iteraciones hasta encontrar una solución o empezar de nuevo, un proceso de eliminación de lo que no funciona. En cambio, algunos modelos básicos invierten ese guión al construir en lugar de eliminar. Los científicos pueden dar parámetros a los modelos básicos, como las cualidades que desean, y los modelos pueden predecir, por ejemplo, las combinaciones de moléculas que podrían funcionar. En lugar de buscar una aguja en un pajar, los modelos sugieren directamente cómo fabricar agujas. En algunos casos, estos modelos básicos también están diseñados para comprender el lenguaje natural, lo que facilita a los científicos la redacción de indicaciones. Para buscar un nuevo material, por ejemplo, los científicos podrían especificar que quieren una molécula que sea estable (que no se deshaga), que no sea magnética, que no conduzca electricidad y que no sea rara ni cara. Los LLM se entrenan en texto (palabras), pero los modelos básicos que los investigadores de Microsoft han estado desarrollando para avanzar en el descubrimiento se han entrenado principalmente en los lenguajes de la ciencia (no solo libros de texto científicos y artículos de investigación, sino también montañas de datos generados a partir de la resolución de esas ecuaciones de física o química). Aurora , que lleva la previsión meteorológica y de contaminación a nuevos niveles, fue entrenada en el lenguaje de la atmósfera terrestre. MatterGen , que sugiere nuevos materiales a partir de indicaciones, y MatterSim , que predice cómo se comportarán los nuevos materiales, fueron entrenados en el lenguaje de las moléculas. TamGen , desarrollado en colaboración entre Microsoft Research y el Global Health Drug Discovery Institute (GHDDI), que desarrolla medicamentos para enfermedades infecciosas que afectan desproporcionadamente a las poblaciones del mundo en desarrollo, se centra en otras moléculas, para nuevos medicamentos e inhibidores de proteínas para enfermedades como la tuberculosis y la COVID-19. Pero la otra propiedad de los grandes modelos lingüísticos –y creo que esto fue una gran sorpresa para muchos de nosotros– es que pueden funcionar como motores de razonamiento eficaces. Así como algunos alimentos se cocinan mejor friéndolos,