Al permitir la anotación rápida de áreas de interés en imágenes médicas, la herramienta puede ayudar a los científicos a estudiar nuevos tratamientos o mapear la progresión de enfermedades.
La anotación de regiones de interés en imágenes médicas, un proceso conocido como segmentación, es a menudo uno de los primeros pasos que dan los investigadores clínicos cuando realizan un nuevo estudio que involucra imágenes biomédicas.
Por ejemplo, para determinar cómo cambia el tamaño del hipocampo cerebral con la edad, el científico primero delinea cada hipocampo en una serie de escáneres cerebrales. Para muchas estructuras y tipos de imágenes, este suele ser un proceso manual que puede requerir mucho tiempo, especialmente si las regiones en estudio son difíciles de delinear.
Para agilizar el proceso, investigadores del MIT desarrollaron un sistema basado en inteligencia artificial que permite segmentar rápidamente nuevos conjuntos de datos de imágenes biomédicas haciendo clic, dibujando y dibujando recuadros en las imágenes. Este nuevo modelo de IA utiliza estas interacciones para predecir la segmentación.
A medida que el usuario marca imágenes adicionales, el número de interacciones que necesita realizar disminuye, hasta llegar a cero. El modelo puede entonces segmentar cada nueva imagen con precisión sin intervención del usuario.
Puede hacer esto porque la arquitectura del modelo ha sido especialmente diseñada para utilizar información de imágenes que ya ha segmentado para hacer nuevas predicciones.
A diferencia de otros modelos de segmentación de imágenes médicas, este sistema permite al usuario segmentar un conjunto de datos completo sin repetir su trabajo para cada imagen.
Además, la herramienta interactiva no requiere un conjunto de datos de imágenes presegmentadas para el entrenamiento, por lo que los usuarios no necesitan conocimientos de aprendizaje automático ni grandes recursos computacionales. Pueden usar el sistema para una nueva tarea de segmentación sin tener que volver a entrenar el modelo.
A largo plazo, esta herramienta podría acelerar los estudios de nuevos métodos de tratamiento y reducir el coste de los ensayos clínicos y la investigación médica. Además, podría ser utilizada por los médicos para mejorar la eficiencia de las aplicaciones clínicas, como la planificación de la radioterapia.
Muchos científicos podrían tener tiempo para segmentar solo unas pocas imágenes al día para sus investigaciones debido a que la segmentación manual de imágenes requiere mucho tiempo. Esperamos que este sistema impulse la ciencia innovadora, permitiendo a los investigadores clínicos realizar estudios que antes les era imposible realizar por falta de una herramienta eficiente, afirma Hallee Wong, estudiante de posgrado en ingeniería eléctrica e informática y autora principal de un artículo sobre esta nueva herramienta .
En este artículo, la acompañan José Javier González Ortiz, doctor (promoción 24); John Guttag, profesor Dugald C. Jackson de Ciencias de la Computación e Ingeniería Eléctrica; y el autor principal, Adrian Dalca, profesor adjunto de la Facultad de Medicina de Harvard y el MGH, e investigador del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL). La investigación se presentará en la Conferencia Internacional sobre Visión por Computador.
Optimización de la segmentación
Los investigadores utilizan principalmente dos métodos para segmentar nuevos conjuntos de imágenes médicas. Con la segmentación interactiva, introducen una imagen en un sistema de IA y utilizan una interfaz para marcar las áreas de interés. El modelo predice la segmentación basándose en esas interacciones.
Una herramienta desarrollada previamente por los investigadores del MIT, ScribblePrompt , permite a los usuarios hacer esto, pero deben repetir el proceso para cada nueva imagen.
Otro enfoque consiste en desarrollar un modelo de IA específico para cada tarea para segmentar automáticamente las imágenes. Este enfoque requiere que el usuario segmente manualmente cientos de imágenes para crear un conjunto de datos y luego entrene un modelo de aprendizaje automático. Este modelo predice la segmentación de una nueva imagen. Sin embargo, el usuario debe iniciar el complejo proceso de aprendizaje automático desde cero para cada nueva tarea, y no hay forma de corregir el modelo si comete un error.
Este nuevo sistema, MultiverSeg , combina lo mejor de cada enfoque. Predice la segmentación de una nueva imagen basándose en las interacciones del usuario, como los garabatos, pero también mantiene cada imagen segmentada en un contexto al que hace referencia posteriormente.
Cuando el usuario carga una nueva imagen y marca áreas de interés, el modelo recurre a los ejemplos de su conjunto de contexto para realizar una predicción más precisa, con menos intervención del usuario.
Los investigadores diseñaron la arquitectura del modelo para usar un conjunto de contexto de cualquier tamaño, de modo que el usuario no necesite tener un número determinado de imágenes. Esto le da a MultiverSeg la flexibilidad para usarse en diversas aplicaciones.
“En algún momento, para muchas tareas, no debería ser necesario proporcionar interacciones. Si se tienen suficientes ejemplos en el contexto, el modelo puede predecir la segmentación con precisión por sí solo”, afirma Wong.
Los investigadores diseñaron y entrenaron cuidadosamente el modelo en una colección diversa de datos de imágenes biomédicas para garantizar que tuviera la capacidad de mejorar gradualmente sus predicciones en función de la información del usuario.
El usuario no necesita reentrenar ni personalizar el modelo para sus datos. Para usar MultiverSeg en una nueva tarea, puede cargar una nueva imagen médica y comenzar a marcarla.
Cuando los investigadores compararon MultiverSeg con herramientas de última generación para la segmentación de imágenes interactivas y en contexto, superó cada línea de base.
Menos clics, mejores resultados
A diferencia de otras herramientas, MultiverSeg requiere menos intervención del usuario con cada imagen. Con la novena imagen nueva, solo necesitaba dos clics del usuario para generar una segmentación más precisa que un modelo diseñado específicamente para la tarea.
Para algunos tipos de imágenes, como los rayos X, es posible que el usuario solo necesite segmentar una o dos imágenes manualmente antes de que el modelo sea lo suficientemente preciso como para hacer predicciones por sí solo.
La interactividad de la herramienta también permite al usuario realizar correcciones a la predicción del modelo, iterando hasta alcanzar el nivel de precisión deseado. En comparación con el sistema anterior de los investigadores, MultiverSeg alcanzó una precisión del 90 % con aproximadamente dos tercios del número de garabatos y tres cuartos del número de clics.
Con MultiverSeg, los usuarios siempre pueden ofrecer más interacciones para refinar las predicciones de la IA. Esto acelera drásticamente el proceso, ya que suele ser más rápido corregir algo existente que empezar desde cero, afirma Wong.
En el futuro, los investigadores quieren probar esta herramienta en situaciones reales con colaboradores clínicos y mejorarla basándose en los comentarios de los usuarios. También quieren que MultiverSeg pueda segmentar imágenes biomédicas 3D.
Este trabajo cuenta con el apoyo, en parte, de Quanta Computer, Inc. y los Institutos Nacionales de Salud, con soporte de hardware del Centro de Ciencias de la Vida de Massachusetts.
MIT News. A. Z. Traducido al español