Evo 2, un nuevo y poderoso modelo de IA construido con NVIDIA DGX Cloud en Amazon Web Services (AWS), proporciona información sobre el ADN, el ARN y las proteínas en diversas especies.
Los científicos de todo el mundo ahora pueden acceder a Evo 2, una nueva y poderosa modelo de fundación eso entiende el código genético para todos los dominios de la vida. Presentado hoy como el modelo de IA más grande disponible públicamente para datos genómicos, se construyó en la plataforma NVIDIA DGX Cloud en una colaboración dirigida por la organización de investigación biomédica sin fines de lucro Arc Institute y la Universidad de Stanford.
Evo 2 está disponible para desarrolladores globales en el Plataforma NVIDIA BioNeMo, incluso como un microservicio NVIDIA NIM para una implementación de IA fácil y segura.
Formado en un enorme conjunto de datos de casi 9 billones de nucleótidos —, los componentes básicos del ADN y el ARN — Evo 2 se pueden aplicar a aplicaciones de investigación biomolecular, incluida la predicción de la forma y función de las proteínas en función de su secuencia genética, la identificación de nuevas moléculas para aplicaciones industriales y de atención médica, y la evaluación de cómo las mutaciones genéticas afectan su función.
“Evo 2 representa un hito importante para la genómica generativa,” dijo Patrick Hsu, cofundador e investigador principal del Instituto Arc, y profesor asistente de bioingeniería en la Universidad de California, Berkeley. “Al avanzar en nuestra comprensión de estos bloques de construcción fundamentales de la vida, podemos buscar soluciones en salud y ciencias ambientales que son inimaginables hoy.”
El NVIDIA microservicio NIM para Evo 2 permite a los usuarios generar una variedad de secuencias biológicas, con configuraciones para ajustar los parámetros del modelo. Los desarrolladores interesados en ajustar Evo 2 en sus conjuntos de datos propietarios pueden descargar el modelo a través del código abierto Marco BioNeMo de NVIDIA, una colección de herramientas informáticas aceleradas para la investigación biomolecular.
“Diseñar nueva biología ha sido tradicionalmente un proceso laborioso, impredecible y artesanal,” dijo Brian Hie, profesor asistente de ingeniería química en la Universidad de Stanford, el miembro de la Facultad de Ciencias de Datos de la Fundación Dieter Schwarz Stanford y un investigador de innovación del Instituto Arc. “Con Evo 2, hacemos que el diseño biológico de sistemas complejos sea más accesible para los investigadores, lo que permite la creación de nuevos y beneficiosos avances en una fracción del tiempo que previamente habría tomado.”
Habilitando la Investigación Científica Compleja
Establecido en 2021 con $650 millones de sus donantes fundadores, Arc Institute permite a los investigadores abordar los desafíos científicos a largo plazo al proporcionar a los científicos fondos de varios años — permitiendo a los científicos centrarse en la investigación innovadora en lugar de la redacción de subvenciones.
Sus investigadores principales reciben espacio de laboratorio de última generación y fondos para términos renovables de ocho años que se pueden llevar a cabo simultáneamente con citas de la facultad con uno de los socios universitarios del instituto, que incluyen la Universidad de Stanford, la Universidad de California, Berkeley y la Universidad de California, San Francisco.
Al combinar este entorno de investigación único con la experiencia informática acelerada y los recursos de NVIDIA, los investigadores de Arc Institute pueden realizar proyectos más complejos, analizar conjuntos de datos más grandes y lograr resultados más rápidamente. Sus científicos se centran en áreas de enfermedades como el cáncer, la disfunción inmune y la neurodegeneración.
NVIDIA aceleró el proyecto Evo 2 al dar a los científicos acceso a 2.000 GPU NVIDIA H100 a través de NVIDIA DGX Cloud en AWS. DGX Cloud proporciona acceso a corto plazo a grandes grupos de cómputo, lo que brinda a los investigadores la flexibilidad de innovar. La plataforma de IA totalmente administrada incluye BioNeMo NVIDIA, que cuenta con un software optimizado en forma de microservicios NVIDIA NIM y NVIDIA BioNeMo Blueprints.
Los investigadores e ingenieros de NVIDIA también colaboraron estrechamente en la escala y optimización de la IA.
Aplicaciones en Ciencias Biomoleculares
Evo 2 puede proporcionar información sobre ADN, ARN y proteínas. Formado en una amplia gama de especies en todos los dominios de la vida — incluyendo plantas, animales y bacterias — el modelo se puede aplicar a campos científicos como la salud, la biotecnología agrícola y la ciencia de los materiales.
Evo 2 utiliza una novedosa arquitectura de modelo que puede procesar largas secuencias de información genética, hasta 1 millón de tokens. Esta visión ampliada del genoma podría desbloquear la comprensión de los científicos de la conexión entre partes distantes del código genético de un organismo y la mecánica de la función celular, la expresión génica y la enfermedad.
“Un solo gen humano contiene miles de nucleótidos —, por lo que para que un modelo de IA analice cómo funcionan estos sistemas biológicos complejos, necesita procesar la mayor parte posible de una secuencia genética a la vez,” dijo Hsu.
En la atención médica y el descubrimiento de fármacos, Evo 2 podría ayudar a los investigadores a comprender qué variantes genéticas están vinculadas a una enfermedad específica — y diseñar nuevas moléculas que se dirijan con precisión a esas áreas para tratar la enfermedad. Por ejemplo, los investigadores de Stanford y el Instituto Arc encontraron que en las pruebas con BRCA1, un gen asociado con el cáncer de mama, Evo 2 podría predecir con un 90% de precisión si las mutaciones no reconocidas previamente afectarían la función del gen.
En la agricultura, el modelo podría ayudar a abordar la escasez mundial de alimentos al proporcionar información sobre la biología de las plantas y ayudar a los científicos a desarrollar variedades de cultivos que sean más resistentes al clima o más densos en nutrientes. Y en otros campos científicos, Evo 2 podría aplicarse para diseñar biocombustibles o diseñar proteínas que descompongan el petróleo o el plástico.
“Implementar un modelo como Evo 2 es como enviar un nuevo telescopio poderoso a los confines más lejanos del universo,” dijo Dave Burke, director de tecnología de Arcarys. “Sabemos que hay una inmensa oportunidad para la exploración, pero aún no sabemos qué vamos a descubrir.” NVIDIA News. A. C. Traducido al español