Los investigadores de la EPFL han desarrollado Systema, una nueva herramienta para evaluar el funcionamiento de los modelos de IA al predecir los efectos de las perturbaciones genéticas.
Comprender cómo se producen las perturbaciones genéticas, cuando los científicos alteran intencionalmente los genes para ver cómo afectan a las células, es clave para comprender la función de nuestros genes y cómo se controlan. Este conocimiento tiene importantes aplicaciones en la ingeniería celular y en el desarrollo de nuevos tratamientos.
Hoy en día, los científicos pueden probar muchas perturbaciones genéticas diferentes en el laboratorio. Pero hay tantas combinaciones posibles que es imposible analizarlas todas.
La IA y el aprendizaje automático han creado la oportunidad de usar información de grandes conjuntos de datos biológicos para predecir qué sucederá cuando se modifique un gen, incluso si ese cambio nunca se ha probado en el laboratorio. Pero ¿qué tan bien funcionan realmente estos modelos?
Evaluación de diferentes modelos de predicción
Para evaluar esto, investigadores del Laboratorio de Aprendizaje Automático para Biomedicina (MLBio) de la EPFL, afiliado tanto a la Facultad de Ciencias de la Computación y la Comunicación como a la Facultad de Ciencias de la Vida , en colaboración con colegas internacionales, probaron los mejores modelos de IA. Utilizaron datos de diez experimentos diferentes y los compararon con enfoques estadísticos sencillos.
En un estudio recién publicado en Nature Biotechnology, el equipo descubrió algo sorprendente: los enfoques sencillos funcionaron igual de bien, o incluso mejor, que los modelos avanzados de IA en muchos conjuntos de datos.
La observación de que los enfoques sencillos funcionan tan bien como los modelos avanzados de IA nos hizo preguntarnos: ¿comprenden realmente los modelos avanzados el efecto de los cambios genéticos? ¿Son las métricas estándar adecuadas para evaluar estos modelos?, afirmó la profesora adjunta Maria Brbic, jefa del Laboratorio MLBio.
¿Por qué los métodos simples funcionaron tan bien?
Los modelos avanzados pueden parecer mejores de lo que son. Esto se debe a las diferencias sistemáticas entre las células tratadas y las no tratadas. En estos casos, es posible que los modelos no estén aprendiendo los verdaderos efectos de los cambios genéticos. En cambio, es posible que simplemente detecten patrones causados por el diseño del experimento o efectos que ocurren con casi todos los cambios genéticos.
Los investigadores también descubrieron que las formas habituales de comprobar el rendimiento del modelo pueden ser engañosas, ya que a menudo no tienen en cuenta estas diferencias sistemáticas.
Para abordar esto, creamos una herramienta llamada Systema. Esta herramienta reduce la influencia de los sesgos sistemáticos y se centra en los efectos únicos de cada perturbación genética. Systema también facilita la comprensión del verdadero efecto de las perturbaciones genéticas, explicó Ramón Viñas Torné, investigador postdoctoral del Laboratorio MLBio y primer autor del artículo.
La predicción es más difícil de lo que sugieren las métricas estándar
Con Systema, los investigadores descubrieron que aún es muy difícil para los modelos de IA predecir los efectos de nuevos cambios genéticos. Algunos modelos podían acertar cuando los genes formaban parte del mismo proceso biológico, pero, en general, el desafío persiste.
Systema ayuda a diferenciar entre los modelos que sólo detectan sesgos y aquellos que realmente entienden cómo las modificaciones genéticas afectan a las células.
Los investigadores sugieren que los modelos de IA se evalúen en función de su valor biológico. Esto implica observar la precisión con la que las predicciones explican las características celulares.
De cara al futuro, realizar experimentos más amplios y diversos ayudará a mejorar estas predicciones. Además, las nuevas tecnologías que analizan las células con más detalle, como su forma o ubicación, podrían ayudarnos a comprender mejor cómo los cambios genéticos afectan a las células y los tejidos, concluyó Brbic.
Referencias
Obtenga más información sobre Systema .
Viñas Torné, R., Wiatrak, M., Piran, Z. et al. Systema: un marco para evaluar la predicción de la respuesta a perturbaciones genéticas más allá de la variación sistemática. Nat Biotechnol (2025). https://doi.org/10.1038/s41587-025-02777-8
EPFL News. T. P. Traducido al español