El uso de inteligencia artificial generativa en el diseño de proteínas podría revolucionar el desarrollo de nuevos fármacos. La EPFL aspira a formar un consorcio para explorar más a fondo esta vía.
Todos los seres vivos están compuestos de proteínas, que desempeñan un papel fundamental en la estructura, la nutrición y la salud de las células, así como en las interacciones entre los fármacos y el organismo.
Los recientes avances en el diseño de proteínas están llamados a marcar el comienzo de una nueva era en la investigación de fármacos. A la vanguardia de esta revolución se encuentra la inteligencia artificial generativa (GenAI), que es capaz de diseñar tipos de proteínas completamente nuevos. Los nuevos métodos de obtención de imágenes, como la cristalografía de rayos X y la microscopía electrónica criogénica, también desempeñan un papel clave, ya que permiten a los científicos observar la composición de las proteínas del mundo real con una precisión sin precedentes. La combinación de estas nuevas tecnologías podría allanar el camino hacia nuevos procesos que permitan a los investigadores desarrollar, entre otras cosas, medicamentos biológicos innovadores, a menudo llamados productos biológicos.
Una vista de cerca de las biomoléculas
Nuestra comprensión actual de cómo interactúan las proteínas y las células se basa en datos empíricos recopilados a lo largo de años de investigación biomédica. Por poner un solo ejemplo, conocemos perfectamente el papel que desempeña la insulina en el metabolismo de la glucosa, pero otras innumerables interacciones entre proteínas y células siguen siendo un misterio, al igual que las razones y los mecanismos que se esconden detrás de los fallos en las proteínas que provocan enfermedades.
La aparición de nuevos métodos y tecnologías está ampliando el conjunto de conocimientos científicos a un ritmo exponencial. La microscopía electrónica criogénica, un método practicado y desarrollado en el Centro de Imágenes Dubochet de la EPFL-UNIL, permitió a los investigadores observar, in vitro , cómo la proteína de la espícula de la variante ómicron del SARS-CoV-2 interactuaba con los receptores de la superficie de las células humanas, lo que ofrece información sobre la rápida propagación del virus en el organismo y su inmunidad a las vacunas desarrolladas para variantes anteriores.
Espiga
Conocida por ser la punta de lanza que permite al virus SARS-CoV-2 penetrar en las células humanas, la proteína Spike saltó a la fama durante la pandemia. La proteína Spike se une a las proteínas ACE2 en membranas celulares específicas (incluidas las de nuestro sistema respiratorio), abriendo la puerta para que entre el virus. Consiste en tres cadenas idénticas que sobresalen de la envoltura viral. La proteína Spike es una glicoproteína, es decir, está recubierta de azúcares que son de origen humano. Si la capa de azúcar es lo suficientemente gruesa, actúa como una «capa invisible», haciendo que el virus sea indetectable para nuestro sistema inmunológico.La proteína Spike es un objetivo principal para nuestro sistema inmunológico cuando lucha contra una infección, y las vacunas son un poderoso aliado en esta lucha. Los científicos utilizaron una variedad de métodos para desarrollar vacunas contra el SARS-CoV-2. Uno implicó sintetizar y luego purificar la proteína Spike del virus, que luego se depositó en nanopartículas y se administró mediante inyecciones subcutáneas. La vacuna incita al sistema inmunológico del receptor a producir anticuerpos, ya que la proteína Spike es reconocida como una sustancia extraña. En el caso de las vacunas de ARNm, no se trata de una réplica de la proteína de la espícula que se administra, sino más bien del “modelo” de la proteína en forma de ARNm. Esto permite que las propias células del receptor sinteticen la proteína de la espícula, contra la cual el sistema inmunitario desarrolla anticuerpos específicos.
Aplicando el aprendizaje profundo a la vida
Otro campo en el que se están produciendo avances igualmente rápidos es el de la aplicación del aprendizaje automático a las ciencias de la vida. Los ganadores del Premio Nobel de Química de 2024 fueron David Baker, un pionero estadounidense de la biología computacional, junto con Demis Hassabis (Doctor Honoris Causa de la EPFL) y John M. Jumper, quienes juntos desarrollaron AlphaFold, un modelo de referencia de IA que ha ganado múltiples premios para predecir la estructura de las moléculas.
Diseño de nuevas biomoléculas
La EPFL también es muy activa en el campo del diseño de proteínas. Desde hace más de cinco años, el Laboratorio de Diseño de Proteínas e Inmunoingeniería de la Escuela, dirigido por Bruno Correia, utiliza el aprendizaje automático para predecir el potencial de interacción entre las proteínas y sus receptores. «El uso del aprendizaje profundo en la ingeniería biológica abre nuevas y apasionantes oportunidades», afirma Correia.
Si bien este trabajo pionero está ampliando nuestra comprensión de cómo funcionan los organismos vivos, también marca el punto de partida de una revolución naciente en la investigación de fármacos. Porque cuando los programas GenAI como ChatGPT se entrenan con datos de proteínas e interacciones moleculares generados por investigadores y modelos como AlphaFold, los programas pueden diseñar y modelar tipos de moléculas completamente nuevos, en innumerables formas, y simular sus interacciones con las células. Y los programas pueden realizar miles de millones de cálculos de este tipo por segundo hasta que encuentren moléculas con relevancia teórica para el desarrollo de fármacos. «Este nuevo enfoque será nada menos que un cambio de paradigma para todo el campo de la biotecnología», agrega Correia.
Este nuevo enfoque será nada menos que un cambio de paradigma para todo el campo de la biotecnología.Bruno Correia
De la planificación a la realidad
Sin embargo, existen diversas formas de producir proteínas existentes o desconocidas a demanda. Es lo que hacen Florence Pojer y su grupo de investigación en el Centro de Producción y Estructura de Proteínas (PTPSP) de la EPFL, donde se agitan botellas que contienen líquidos rojizos en vitrinas durante horas. “Por ejemplo, estas botellas contienen células de riñón embrionario humano (HEK), que han sido inmortalizadas y cultivadas durante décadas”, dice Pojer. “Las utilizamos para producir proteínas como anticuerpos, después de transfectar primero las células con plásmidos que contienen la secuencia deseada”.
Los científicos del PTPSP también crean otros tipos de mezclas celulares y bacterianas, según los resultados que se pretenden conseguir. A continuación, la solución final se purifica para aislar las proteínas objetivo. “En teoría, es posible producir cualquier proteína a partir de su secuencia genética”, añade. “Pero, tal y como están las cosas actualmente, sólo una pequeña fracción de las proteínas diseñadas in silico , por ordenador, se pueden fabricar y funcionar en el mundo real. La idea que subyace a los nuevos enfoques biotecnológicos es ampliar la gama de lo que podemos producir en el futuro”.
Gran parte de esta tecnología innovadora se aplica o se desarrolla en la EPFL, no sólo en el laboratorio de Correia y su grupo de investigación, sino también en el laboratorio dirigido por Sebastian Maerkl, donde los investigadores no se centran en los procesos biológicos en células vivas, sino en la investigación in vitro , utilizando las aproximadamente 30 enzimas necesarias para la producción de proteínas. Mientras tanto, el grupo de investigación de Matteo Dal Peraro utiliza la observación, el modelado y la simulación para estudiar los grandes sistemas macromoleculares y sus capacidades de acción, que están determinadas por su estructura y composición.
Un gran consorcio en formación
Actualmente, en escuelas y universidades de Suiza se están llevando a cabo varios proyectos de investigación complementarios. En la EPFL, Correia y Beat Fierz están creando un consorcio con el objetivo de marcar el comienzo de una nueva era en la investigación de fármacos, una era impulsada por el aprendizaje automático. Reunir todo esto bajo un mismo techo no solo consolidaría la posición del país como centro de excelencia en este campo, sino que también estimularía la rápida aparición de nuevas proteínas eficaces para aplicaciones clínicas. La idea es promover el desarrollo de tecnología de diseño de moléculas habilitada por IA, explorar nuevos tipos de interacciones fármaco-célula, crear nuevas bases de datos para mejorar aún más el rendimiento del software de diseño y preparar a los científicos en el inicio de su carrera para aprovechar nuevas oportunidades de investigación y transferencia de tecnología. Es un esfuerzo ambicioso que seguramente cautivará a los científicos de las próximas generaciones. EPFL News. E. B. Traducido al español