Ya-Ting Jan , La reina Pei Shan , Wen-Hui Huang , Ling Ying Chou , Shih Chieh Huang , Rey Jing-Zhe ,Pei-Hsuan Lu , Lin Dao Chen , Chun-Sheng Yen , Ju-Ping Teng , Greta SP Mok , Shih Cheng-Ting yTung-Hsin Wu
Perspectivas sobre imágenes volumen 14 , Número de artículo: 68 ( 2023 ) Citar este artículo
3962 Accesos I 14 Citas I 4 Altmétrica I Métrica
Abstracto
Fondo
Desarrollar un modelo de inteligencia artificial (IA) con características radiómicas y de aprendizaje profundo (DL) extraídas de imágenes de TC para distinguir tumores de ovario benignos de malignos.
Métodos
Inscribimos a 149 pacientes con tumores de ovario confirmados patológicamente. Se incluyeron 185 tumores en total y se dividieron en conjuntos de prueba y entrenamiento en una proporción de 7:3. Todos los tumores se segmentaron manualmente a partir de imágenes de TC con contraste preoperatorias. Las características de las imágenes de TC se extrajeron mediante radiómica y DL. Se construyeron cinco modelos con diferentes combinaciones de conjuntos de características. Los tumores benignos y malignos se clasificaron utilizando clasificadores de aprendizaje automático (ML). El rendimiento del modelo se comparó con cinco radiólogos en el conjunto de prueba.
Resultados
Entre los cinco modelos, el modelo con mejor desempeño es el modelo de conjunto con una combinación de radiómica, DL y conjuntos de características clínicas. El modelo logró una precisión del 82%, una especificidad del 89% y una sensibilidad del 68%. En comparación con los resultados promedio de los radiólogos jóvenes, el modelo tuvo una mayor precisión (82% frente al 66%) y especificidad (89% frente al 65%) con una sensibilidad comparable (68% frente al 67%). Con la ayuda del modelo, los radiólogos jóvenes lograron una mayor precisión promedio (81% frente al 66%), especificidad (80% frente al 65%) y sensibilidad (82% frente al 67%), acercándose al desempeño de los radiólogos experimentados.
Conclusiones
Desarrollamos un modelo de IA basado en TC que puede diferenciar tumores ováricos benignos y malignos con gran precisión y especificidad. Este modelo mejoró significativamente el desempeño de los radiólogos con menos experiencia en la evaluación de tumores ováricos y podría orientar a los ginecólogos para brindar mejores estrategias terapéuticas para estas pacientes.
Puntos clave
- 1.La radiómica basada en TC y las funciones de aprendizaje profundo podrían diferenciar los tumores ováricos.
- 2.La radiómica, las funciones de aprendizaje profundo y los datos clínicos proporcionaron información complementaria sobre el tumor.
- 3.El modelo de conjunto mejoró el desempeño de los radiólogos en la evaluación de tumores ováricos.
Fondo
El cáncer de ovario es la principal causa de muerte relacionada con el cáncer ginecológico [ 1 ], y un diagnóstico erróneo puede retrasar el tratamiento y empeorar el pronóstico. La derivación acelerada de pacientes con cáncer de ovario a un oncólogo ginecológico para una estadificación quirúrgica completa y una citorreducción óptima se correlaciona con mejores tasas de supervivencia [ 2 ]. Por el contrario, los pacientes con tumores ováricos benignos solo necesitan un tratamiento conservador o una cistectomía laparoscópica [ 3 ]. Por lo tanto, la distinción precisa entre tumores ováricos benignos y malignos es de suma importancia para guiar el tratamiento y sigue siendo un gran desafío en la práctica clínica.
Actualmente, la distinción entre tumores ováricos benignos y malignos se basa en gran medida en la apariencia de las imágenes [ 4 , 5 , 6 ]. La ecografía suele ser la herramienta de detección por imágenes de primera línea. Debido a la excelente resolución espacial y la amplia disponibilidad, a menudo se solicita la tomografía computarizada (TC) para una mayor caracterización del tumor. Sin embargo, una diferenciación definitiva entre tumores ováricos benignos y malignos mediante TC sigue siendo un desafío, especialmente para excluir la posibilidad de malignidad en tumores quísticos multiseptados. Dado que los tumores ováricos benignos superan en gran medida a los malignos, no es raro que las pacientes con tumores de características de imagen indeterminadas se sometan a cirugía y luego se demuestre que los tumores son benignos. Se estima que aproximadamente el 28% de las ooforectomías realizadas son de tumores benignos [ 7 ]. Estas cirugías innecesarias representan una gran preocupación clínica con consecuencias a largo plazo de disminución de la fertilidad y menopausia prematura [ 8 , 9 ]. Por lo tanto, un método no invasivo que pueda distinguir con precisión los tumores ováricos benignos de los malignos para evitar el retraso en el tratamiento en casos malignos y evitar que las pacientes con tumores benignos tengan que someterse a una cirugía innecesaria tiene un impacto clínico significativo.
Se ha demostrado que la inteligencia artificial (IA) mejora el rendimiento de la detección de tumores, la clasificación de tumores y el seguimiento del tratamiento en las imágenes del cáncer [ 10 , 11 , 12 , 13 ]. A diferencia de la evaluación subjetiva de imágenes radiológicas por parte de humanos, la extracción de características de la imagen mediante radiómica o aprendizaje profundo (DL) puede proporcionar información de imagen cuantificada indetectable para los ojos humanos y ha mostrado resultados prometedores en el análisis de tumores [ 14 , 15 , 16 , 17 , 18 , 19 , 20 , 21 , 22 , 23 , 24 , 25 ]. Varios estudios recientes utilizaron radiómica en imágenes de TC y aplicaron clasificadores de aprendizaje automático (ML) para diferenciar tumores de ovario [ 26 , 27 , 28 ]. Sin embargo, existe una investigación limitada sobre la aplicación de DL para diferenciar tumores de ovario mediante imágenes de TC. Christiansen et al. [ 29 ] y Wang et al. [ 30 ] aplicaron DL para la diferenciación de tumores ováricos utilizando ultrasonido e imágenes por resonancia magnética (IRM) respectivamente. Además de los estudios que aplicaron directamente redes DL para la diferenciación de tumores ováricos, hubo pocos estudios que usaron redes DL para la extracción de características de imágenes de TC para predecir la recurrencia del cáncer de ovario o clasificar subtipos de nódulos pulmonares [ 24 , 25 ]. Hasta donde sabemos, el rendimiento de la aplicación de ML basado en radiómica combinada y características DL extraídas de imágenes de TC para diferenciar tumores ováricos sigue siendo desconocido.
En este estudio, nos propusimos desarrollar un modelo de IA basado en TC con extracción de características mediante radiómica y DL para distinguir tumores ováricos benignos de malignos. Aplicamos clasificadores con radiómica y características DL extraídas de imágenes de TC para clasificar tumores ováricos benignos y malignos. Se comparó el desempeño de varias combinaciones de clasificadores y conjuntos de características con radiólogos en la tarea de clasificación utilizando el diagnóstico patológico como estándar de oro. Además, también se evaluó la mejora del desempeño de los radiólogos con la ayuda del modelo óptimo.
Métodos
Población de estudio
En este estudio aprobado por la junta de revisión institucional, recopilamos retrospectivamente 245 pacientes consecutivas con sospecha de tumores ováricos del Hospital MacKay Memorial entre julio de 2018 y diciembre de 2019. Se incluyeron pacientes que cumplían los siguientes criterios: (1) tumor ovárico confirmado patológicamente resecado mediante cirugía, (2) tomografía computarizada con contraste realizada antes de la cirugía, (3) imágenes de TC claras sin artefactos y aptas para el análisis. La cohorte final consistió en 149 pacientes con 185 tumores ováricos (Fig. 1 ).
Los datos se dividieron en conjuntos de entrenamiento y prueba en una proporción de 7:3. El conjunto de entrenamiento se utilizó para desarrollar cinco modelos con diferentes combinaciones de conjuntos de características: modelo radiómico, modelo de aprendizaje a distancia, modelo clínico, modelo radiómico y de aprendizaje a distancia combinados, y modelo de conjunto (conjuntos de características radiómicas, de aprendizaje a distancia y clínicas combinados). A continuación, los modelos se probaron en el conjunto de prueba no visto. La figura 2 ilustra el diagrama de flujo del diseño del estudio.
Adquisición y segmentación de imágenes
Los exámenes de TC se realizaron en 4 escáneres de TC multidetector diferentes: Siemens Somatom Definition Flash, Siemens Somatom Definition AS, Toshiba Aquilion ONE (TSX-301C), Toshiba Aquilion PRIME (TSX-303A). Los parámetros de escaneo fueron los siguientes: voltaje del tubo, 120 kVp; corriente del tubo, 200-230 mA; tiempo de rotación del gantry, 0,5 s; paso del haz, 1,0; espesor de reconstrucción, 2 mm; intervalo de reconstrucción, 1,5 mm. Se inyectó medio de contraste (concentración de yodo: 300 mg/ml) 80-100 ml utilizando un inyector mecánico a una velocidad de 2,5-3,5 ml/s. El retraso de tiempo desde la inyección del agente de contraste hasta la adquisición de la imagen fue de 70 s.
Las imágenes de TC con contraste preoperatorias se obtuvieron del PACS. Un radiólogo experimentado segmentó manualmente los tumores utilizando un cortador 3D (IEEE Cat No. 04EX821). El límite de todo el tumor se definió manualmente en cada corte axial de TC.
Extracción de características, selección y clasificación de tumores
Después de la resolución y la normalización de la intensidad, se extrajeron las características radiómicas de las imágenes del tumor. Se extrajeron un total de 129 características radiómicas de cada tumor, incluidas 12 características de histograma, 9 características de matriz de coocurrencia de niveles de gris (GLCM), 96 características de wavelet y 12 características de Laplaciano de Gauss (LoG) (Archivo adicional 1 : Tabla S1).
Además de la radiómica, se aplicó una red neuronal convolucional (CNN) 3D U-Net como extractor de características. La Figura 3 ilustra la arquitectura de la U-Net aplicada en este estudio, que consta de un codificador y un decodificador. La idea básica del uso de la U-net como extractor de características es que las características extraídas por el codificador de una imagen de tumor de entrada podrían representar el tumor si la imagen reconstruida por el decodificador usando las características es similar a la imagen de entrada [31 , 32 , 33 , 34 ] . En este estudio, la U-net fue entrenada y validada respectivamente por el 90% y el 10% del conjunto de entrenamiento usando el optimizador Adam con una función de pérdida de la mitad del error cuadrático medio. Se utilizó un tamaño de lote de 1 debido al tamaño de memoria limitado de la tarjeta gráfica aplicada. La tasa de aprendizaje y la cantidad de épocas para el entrenamiento se ajustaron en función del error cuadrático medio (RMSE) promedio entre las imágenes de entrada y las reconstruidas para garantizar que las imágenes reconstruidas por el decodificador fueran lo más similares posible a las imágenes de entrada. Al ingresar las imágenes del tumor en la U-net entrenada, las características generadas por la última capa de activación del codificador se adoptaron como características DL del tumor. Para cada tumor, se extrajeron 224 características DL.
Utilizando la radiómica y U-net, se extrajeron 353 características de cada tumor. Sin embargo, el rendimiento de la clasificación utilizando una cantidad tan grande de características podría ser bajo debido a la colinealidad múltiple y al sobreajuste. Utilizamos una regresión LASSO (operador de selección y contracción mínima absoluta) con validación cruzada de diez veces para eliminar las características irrelevantes [ 35 ]. Se seleccionaron características con coeficientes de regresión > 0,1 para la clasificación.
Después de la selección de características, los tumores benignos y malignos se clasificaron utilizando cuatro clasificadores, incluidos K-nearest neighbor (KNN), support vector machine (SVM), logística regression (LR) y random forest (RF), con cinco tipos de conjuntos de características, incluidas características radiómicas, características DL, características clínicas, características radiómicas y DL combinadas, y características de conjunto (todas las características combinadas). El resultado de la clasificación generaría una probabilidad (0-100%) de malignidad para cada tumor. El rendimiento de la clasificación utilizando diferentes combinaciones de clasificadores y conjuntos de características se evaluó y comparó utilizando los datos de entrenamiento con validación cruzada de diez veces. En este estudio, la extracción de características, la selección y el entrenamiento y evaluación de clasificadores se implementaron utilizando MATLAB R2020a (MathWorks, Natick, MA).
Evaluación del radiólogo
En función de los años de experiencia en la lectura de imágenes de TC abdominal, los radiólogos se dividieron en dos grupos: los jóvenes (3 radiólogos, experiencia < 10 años) y los veteranos (2 radiólogos, experiencia > 10 años). Todos los radiólogos desconocían los diagnósticos patológicos de los pacientes. Se les pidió que interpretaran de forma independiente las imágenes de TC del equipo de prueba y que registraran cada tumor como benigno o maligno con la información proporcionada sobre la edad de los pacientes y el nivel de CA-125. Después de un mes, se les pidió que interpretaran las imágenes nuevamente con la ayuda del modelo con mejor rendimiento.
Análisis estadístico
Para evaluar el desempeño de los modelos de IA y de los radiólogos, se calcularon los siguientes índices: precisión, sensibilidad, especificidad, curva característica operativa del receptor (ROC), área bajo la curva ROC (AUC) y puntuación F1. La confiabilidad interobservador se evaluó utilizando el coeficiente alfa de Krippendorff. Al evaluar las características clínicas entre los grupos, se examinaron las diferencias en las variables continuas y las variables categóricas utilizando la prueba t de muestras independientes y la prueba de chi-cuadrado, respectivamente. p < 0,05 se consideró diferencia significativa. El análisis estadístico se realizó utilizando SPSS versión 24.0 (IBM Corporation, Armonk, NY, EE. UU.).
Resultados
Demografía de los pacientes
La cohorte final consistió en 149 pacientes con 185 tumores ováricos, 112 benignos y 73 malignos. La edad de los pacientes osciló entre 18 y 80 años (media 46,4 ± 12,4 años). Hubo 78 pacientes (52,3%) con CA-125 elevado y 36 pacientes (24,2%) con tumores bilaterales. Hubo diferencias significativas en la edad ( p < 0,0001), el volumen del tumor ( p < 0,0001) y el CA-125 ( p = 0,0003) entre los grupos benignos y malignos (Tabla 1 ). Los conjuntos de entrenamiento y prueba se equilibraron en términos de todas las variables clínicas (Archivo adicional 1 : Tabla S2). Los subtipos histológicos de tumores se resumen en la Tabla 2. Para fines de clasificación, los tumores limítrofes y malignos se agruparon en una sola categoría y se denominaron malignos.Tabla 1 Características de los pacientes y tumores para los grupos benignos y malignos
Mesa de tamaño completoTabla 2 Resumen de subtipos patológicos
Selección de características y clasificación de tumores
Los detalles de las características seleccionadas por el método LASSO se describen en la Tabla 3. En el modelo radiómico, se seleccionaron 4 características de las 129 características radiómicas iniciales. Para las características DL, el modelo DL de extracción de características (U-net) se entrenó utilizando una tasa de aprendizaje de 0,001 s y 25 épocas. El RMSE promedio entre las imágenes de entrada y reconstruidas fue de 25,45 ± 39,05. Se seleccionaron cuatro características de las 224 características DL iniciales para el modelo DL. En el modelo combinado radiómico y DL, se seleccionaron 6 características del total de 353 características radiómicas y DL, incluida una característica radiómica y cinco características DL. El modelo clínico tenía cuatro características clínicas: edad, CA-125, volumen del tumor y lado del tumor. El modelo de conjunto constaba de 10 características, incluidas 4 características clínicas y 6 características utilizadas en el modelo combinado radiómico y DL. El desempeño detallado del modelo en los conjuntos de entrenamiento y prueba utilizando diferentes clasificadores, es decir, KNN, SVM, LR y RF, se puede encontrar en el archivo adicional 1 : Tablas S3-S4. Debido al mejor desempeño general del clasificador LR en comparación con otros clasificadores en el conjunto de prueba, los resultados de su análisis se presentaron para su evaluación durante el resto del estudio.Tabla 3 Características de radiómica y aprendizaje profundo seleccionadas por LASSO
Rendimiento de los modelos de IA
Las métricas de rendimiento de los modelos de IA y los radiólogos en el conjunto de pruebas se resumen en la Tabla 4. La precisión de los modelos en orden descendente fueron modelo de conjunto 82%, modelo DL 73%, modelo clínico 73%, modelo combinado de radiómica y DL 71% y modelo de radiómica 61%. El modelo con mejor rendimiento fue el modelo de conjunto con la mayor precisión (82%), sensibilidad (68%), tasa predictiva negativa (85%) y puntuación F1 (0,72). El modelo de conjunto logró una especificidad del 89%, AUC de 0,83 y tasa predictiva positiva del 77%. El modelo DL tuvo la AUC más alta (0,89), especificidad (100%) y tasa predictiva positiva (100%) pero la sensibilidad más baja (21%).Tabla 4 Métricas de rendimiento de los modelos de IA y radiólogos
Desempeño de los radiólogos
Los radiólogos senior lograron mayor precisión, especificidad, AUC, tasa predictiva positiva y puntuación F1 que todos los radiólogos junior (Tabla 4 ). Con la asistencia del modelo de IA, todos los radiólogos junior mostraron una mejora general en las métricas de rendimiento, mientras que los radiólogos senior solo tuvieron una mejora leve en la precisión, el AUC y la puntuación F1. La confiabilidad interobservador de los radiólogos junior (alfa de Krippendorff, 0,4757 frente a 0,6333) y los radiólogos senior (alfa de Krippendorff, 0,4806 frente a 0,7331) también reveló una mejora con la asistencia de IA. Los resultados de rendimiento promedio de los radiólogos se resumen en la Tabla 5. Con la asistencia del modelo de conjunto, los radiólogos junior lograron una mejora significativa en la precisión promedio (81% frente a 66%), la sensibilidad (82% frente a 67%) y la especificidad (80% frente a 65%) que fueron comparables con los radiólogos senior. Los radiólogos experimentados solo mostraron una leve mejora en la precisión promedio (85 % frente al 83 %) y la especificidad (87 % frente al 83 %) y la misma sensibilidad (82 %) con la asistencia de IA. Con la ayuda de las probabilidades producidas por el conjunto, los radiólogos jóvenes también lograron una mejora en el AUC que no mostró una diferencia estadísticamente significativa con respecto a los radiólogos experimentados. Las comparaciones del AUC entre radiólogos se pueden encontrar en el archivo adicional 1 : Tablas S5–S7.Tabla 5 Comparación del desempeño de los radiólogos y el modelo de conjunto
Comparación del rendimiento del modelo de conjunto y los radiólogos
La Figura 4 muestra las curvas ROC del modelo de conjunto y los radiólogos. El AUC del modelo de conjunto (0,83) fue comparable con los radiólogos experimentados (0,82-0,83) y mejor que el de los radiólogos jóvenes (0,61-0,73). En comparación con los resultados promedio de los radiólogos jóvenes (Tabla 5 ), el modelo de conjunto tuvo mayor precisión (82% frente a 66%) y especificidad (89% frente a 65%) con una sensibilidad comparable (68% frente a 67%). En comparación con los resultados promedio de los radiólogos experimentados, el modelo de conjunto tuvo una precisión comparable (82% frente a 83%), mayor especificidad (89% frente a 83%), pero menor sensibilidad (68% frente a 82%). La comparación del AUC entre el modelo de conjunto y los radiólogos se puede encontrar en el archivo adicional 1 : Tabla S8.
Muestra clasificada erróneamente por el modelo de IA y/o radiólogos
La Figura 5 muestra ejemplos de tumores clasificados erróneamente por el modelo de IA y/o los radiólogos en tres escenarios. Las Figuras 5a y b representan tumores de ovario que fueron clasificados erróneamente por el modelo de IA pero que fueron diferenciados correctamente por todos los radiólogos junior, seleccionados de 4 casos de este escenario, incluidos 2 tumores malignos y 2 benignos. La Figura 5c muestra el único tumor que fue clasificado erróneamente tanto por el modelo de IA como por todos los radiólogos junior. La Figura 5d muestra un tumor de ovario que fue diferenciado erróneamente por los 3 radiólogos junior pero que fue clasificado correctamente por el modelo de IA, seleccionado de 9 casos de este escenario, incluidos 1 tumor maligno y 8 benignos.
Discusión
En este estudio, desarrollamos un modelo de IA basado en TC que incorpora radiómica y características de DL con datos clínicos para clasificar tumores ováricos benignos y malignos utilizando clasificadores de ML. El modelo puede distinguir tumores ováricos benignos de malignos con alta precisión (82%) y especificidad (89%) para una sensibilidad aceptable (68%). El modelo tuvo un mejor desempeño que los resultados promedio de los radiólogos junior. Con las probabilidades proporcionadas por el modelo, los radiólogos junior mostraron una mejora significativa en el desempeño acercándose a los radiólogos senior. Estos resultados demuestran que el modelo de IA puede ayudar a los radiólogos menos experimentados a evaluar tumores ováricos, lo que proporciona evidencia de la validez clínica de este modelo.
Este es el primer estudio que aplica ML combinado con radiómica y características DL extraídas de imágenes de TC para diferenciar entre tumores de ovario benignos y malignos. Hay investigaciones limitadas sobre la aplicación de DL para diferenciar tumores de ovario utilizando imágenes de TC. Christiansen et al. [ 29 ] y Wang et al. [ 30 ] aplicaron DL para la diferenciación de tumores de ovario utilizando ultrasonido y MRI respectivamente. Ambos estudios utilizaron la CNN para construir un modelo de clasificación de extremo a extremo que necesitaba ser entrenado con un conjunto de datos más grande. Sin embargo, en condiciones médicas comunes, recopilar un gran conjunto de datos de imágenes de tumores uniformes con diagnóstico patológico es muy difícil. Las características DL, características de imagen cuantificadas extraídas a través de una CNN codificadora-decodificadora [ 31 , 32 , 33 , 34 ], pueden proporcionar una forma alternativa para el análisis de imágenes de tumores en un conjunto de datos relativamente pequeño. Wang et al. [ 24 ] extrajeron características DL de imágenes de TC para predecir la recurrencia del tumor en cáncer de ovario seroso de alto grado. Xia et al. [ 25 ] desarrollaron un esquema basado en TC para clasificar los nódulos pulmonares en vidrio esmerilado mediante la fusión de la radiómica y las características de DL. Hasta el momento, no hay ningún estudio que utilice características de DL o que incorpore la radiómica con las características de DL para diferenciar los tumores de ovario. Dado que la radiómica, las características de DL y los datos clínicos representan diferentes características del tumor, asumimos que un modelo de IA que integre estas características puede distinguir con precisión los tumores de ovario benignos y malignos. El mejor rendimiento del modelo de conjunto verificó nuestra suposición de que la radiómica, las características de DL y los datos clínicos pueden proporcionar información complementaria sobre los tumores de ovario y trabajar mejor juntos para distinguir los tumores benignos de los malignos.
El ML se considera a menudo como una caja negra. Para comprender las decisiones y los errores que cometieron el modelo de IA y los radiólogos, analizamos tres escenarios de resultados mal clasificados. En el primer escenario, donde los tumores fueron clasificados incorrectamente por el modelo de IA pero diferenciados correctamente por todos los radiólogos junior, el tumor maligno (Fig. 5 a) tenía una porción sólida obvia, mientras que el benigno (Fig. 5 b) era un tumor de hipoatenuación sin porción sólida ni nódulo mural. En la evaluación radiológica tradicional, la porción sólida, el nódulo mural y los septos gruesos de un tumor ovárico son pistas de malignidad. Los tumores con características típicas de la imagen de TC, como los dos tumores anteriores (Fig. 5 a y b), no serían diagnosticados erróneamente por los radiólogos a pesar de que fueron clasificados incorrectamente por el modelo de IA. En el segundo escenario, en el que tanto el modelo de IA como todos los radiólogos jóvenes estaban equivocados, el tumor benigno (Fig. 5 c) era un tumor quístico multiseptado con tabiques de grosor desigual que podría generar sospechas de malignidad en la evaluación radiológica. En el tercer escenario, en el que el modelo de IA estaba en lo cierto, pero todos los radiólogos jóvenes estaban equivocados, el tumor (Fig. 5 d) era un tumor quístico multiseptado benigno con tabique grueso. Como se mencionó anteriormente, es un desafío para los radiólogos excluir la posibilidad de malignidad en tales tumores ováricos quísticos multiseptados. El modelo de IA puede ser mejor que los radiólogos en la identificación de características sutiles inexplicables mediante la evaluación radiológica tradicional y ayudar a los radiólogos a tomar decisiones correctas en casos difíciles como el de la Fig. 5 d.
El modelo propuesto puede ayudar potencialmente a los radiólogos y ginecólogos a evaluar los tumores ováricos y guiar las estrategias terapéuticas para estos pacientes, especialmente en hospitales que carecen de radiólogos experimentados. Con el creciente problema de escasez mundial de médicos, la disponibilidad de un sistema de asistencia de IA es muy importante. Aunque la resonancia magnética puede proporcionar un mejor rendimiento que la TC en la diferenciación de tumores debido a su contraste tisular superior [ 36 , 37 ], creemos que un modelo de IA basado en TC beneficiaría a más pacientes, especialmente aquellos en áreas remotas. Aunque la sensibilidad de nuestro modelo es relativamente baja, su aplicación clínica prevista no es para la detección. La alta especificidad del modelo es considerablemente más importante que la sensibilidad, ya que el estudio de TC generalmente sirve como una modalidad de confirmación para la evaluación de tumores indeterminados en la ecografía.
Este estudio tiene varias limitaciones. En primer lugar, el tamaño de los datos es relativamente pequeño y no cuenta con una cohorte de validación externa, y el diseño del estudio es retrospectivo. Es esencial realizar estudios futuros que utilicen conjuntos de datos más grandes de diferentes instituciones con un diseño de estudio prospectivo para mejorar y validar el rendimiento del modelo. En segundo lugar, la segmentación manual de los tumores de ovario por parte de un solo radiólogo puede sesgar los resultados. Sin embargo, considerando que la segmentación precisa del tumor es importante para la radiómica y la extracción de características de DL, decidimos utilizar la segmentación manual por parte de un radiólogo experimentado. En tercer lugar, el recuerdo de los casos de la primera sesión puede ser una preocupación cuando se les pide a los radiólogos que reevalúen las imágenes de TC con asistencia de IA. Para abordar este problema, organizamos un retraso de al menos un mes entre las dos sesiones. En cuarto lugar, elegimos la TC como nuestra herramienta de imágenes porque está mucho más disponible que la RM. Sin embargo, esto sigue siendo una debilidad potencial para la aplicabilidad de la herramienta desarrollada, ya que un modelo basado en RM podría superar al modelo basado en TC propuesto. En quinto lugar, aplicamos clasificadores de ML en lugar del método de DL para la clasificación de tumores debido a la limitación del pequeño tamaño de los datos.
Conclusiones
En este estudio, desarrollamos un modelo de IA basado en TC que incorpora radiómica y características de DL con datos clínicos para distinguir tumores ováricos benignos de malignos utilizando clasificadores de ML. El modelo puede distinguir tumores ováricos benignos de malignos con alta precisión y especificidad. Además, el modelo puede mejorar el desempeño de los radiólogos con menos experiencia en la evaluación de tumores ováricos y potencialmente guiar a los ginecólogos para proporcionar mejores estrategias terapéuticas para estas pacientes.
Disponibilidad de datos y materiales
Los conjuntos de datos utilizados y/o analizados durante el presente estudio están disponibles a pedido razonable del autor correspondiente.
Abreviaturas
AI: Inteligencia artificial
AUC: Área bajo la curva
ROCCA-125: Antígeno del cáncer 125
CNN: Red neuronal convolucional
CONNECTICUT: Tomografía computarizada
DESCARGAR: Aprendizaje profundo
GLC: Matriz de coocurrencia de niveles de grises
Conoce: K-vecino más cercano
LAZO: Operador de selección y contracción mínima absoluta
Registro: Laplaciano de Gauss
De izquierda a derecha: Regresión logística
ML: Aprendizaje automático
Resonancia magnética: Imágenes por resonancia magnética
De radio: Bosque aleatorio
Valores medios de medición: Error cuadrático medio
República Checa: Curva característica de funcionamiento del receptor
SVM: Máquina de vectores de soporte
Referencias
- Siegel RL, Miller KD, Jemal A (2019) Estadísticas del cáncer. CA Cancer J Clinic 69: 7–34
- Hand R, Fremgen A, Chmiel JS et al (1993) Procedimientos de estadificación, tratamiento clínico y resultados de supervivencia para el carcinoma de ovario. JAMA 269:1119–1122Artículo CAS PubMed Google Académico
- Boletín de práctica del Comité de boletines de práctica del Colegio Estadounidense de Obstetras y Ginecólogos: ginecología (2016) Boletín de práctica n.º 174: evaluación y tratamiento de masas anexiales. Obstet Gynecol 128(5):e210–e226.Artículo Google Académico
- Jeong YY, Outwater EK, Kang HK (2000) Evaluación por imágenes de masas ováricas. Radiographics 20:1445–1470Artículo CAS PubMed Google Académico
- Iyer VR, Lee SI (2010) Resonancia magnética, tomografía computarizada y tomografía por emisión de positrones/tomografía computarizada para la detección del cáncer de ovario y la caracterización de las lesiones anexiales. AJR Am J Roentgenol 194:311–321Artículo PubMed Google Académico
- Kinkel K, Lu Y, Mehdizade A, Pelte MF, Hricak H (2005) Masa ovárica indeterminada en la ecografía: valor incremental de una segunda prueba de diagnóstico por imágenes para caracterización: metanálisis y análisis bayesiano. Radiology 236:85–94Artículo PubMed Google Académico
- Moore BJ, Steiner CA, Davis PH, Stocks C, Barrett ML (2006) Tendencias en histerectomías y ooforectomías en entornos hospitalarios para pacientes internados y ambulatorios, 2005-2013: resumen estadístico n.° 214, resumen estadístico del proyecto de utilización y costos de la atención médica (HCUP). Agencia para la investigación y la calidad de la atención médica (EE. UU.), Rockville (MD)
- Lass A (1999) El potencial de fertilidad de las mujeres con un solo ovario. Hum Reprod Update 5:546–550Artículo CAS PubMed Google Académico
- Parker WH, Broder MS, Liu Z, Shoupe D, Farquhar C, Berek JS (2005) Conservación de los ovarios en el momento de la histerectomía por enfermedad benigna. Obstet Gynecol 106:219–226Artículo PubMed Google Académico
- Bi WL, Hosny A, Schabath MB et al (2019) Inteligencia artificial en imágenes de cáncer: desafíos clínicos y aplicaciones. CA: A Cancer J Clinic 69:127–157
- Zhou J, Zeng ZY, Li L (2020) Progreso de la inteligencia artificial en tumores malignos ginecológicos. Cancer Manage Res 12:12823–12840Artículo CAS Google Académico
- Akazawa M, Hashimoto K (2021) Inteligencia artificial en cánceres ginecológicos: estado actual y desafíos futuros: una revisión sistemática. Artif Intell Med 120:102164Artículo PubMed Google Académico
- Shrestha P, Poudyal B, Yadollahi S et al (2022) Una revisión sistemática sobre el uso de inteligencia artificial en imágenes ginecológicas: antecedentes, estado del arte y direcciones futuras. Gynecol Oncol. https://doi.org/10.1016/j.ygyno.2022.07.024Artículo PubMed Google Académico
- Sun R, Limkin EJ, Vakalopoulou M et al (2018) Un enfoque radiómico para evaluar las células CD8 infiltradas en tumores y la respuesta a la inmunoterapia anti-PD-1 o anti-PD-L1: un biomarcador de imágenes, estudio multicohorte retrospectivo. Lancet Oncol 19:1180–1191Artículo CAS PubMed Google Académico
- Chiappa V, Interlenghi M, Salvatore C et al (2021) Uso de radiomics y aprendizaje automático con ultrasonografía para el diagnóstico diferencial de tumores miometriales (estudio piloto ADMIRAL). Radiomics y diagnóstico diferencial de tumores miometriales. Gynecol Oncol 161:838–844Artículo CAS PubMed Google Académico
- Chaudhary K, Poirion OB, Lu L, Garmire LX (2018) La integración multiómica basada en aprendizaje profundo predice de manera sólida la supervivencia en el cáncer de hígado. Clin Cancer Res 24:1248–1259Artículo CAS PubMed Google Académico
- Chiappa V, Interlenghi M, Bogani G et al (2021) Un sistema de apoyo a la toma de decisiones basado en radiómica y aprendizaje automático para predecir el riesgo de malignidad de masas ováricas a partir de la ecografía transvaginal y el CA-125 sérico. Eur Radiol Exp 5:28Artículo PubMed Centro de PubMed Google Académico
- Newtson AM, Mattson JN, Goodheart MJ et al (2019) Predicción de resultados quirúrgicos óptimos con imágenes radiológicas utilizando inteligencia artificial de aprendizaje profundo. Gynecol Oncol 154:156Artículo Google Académico
- Rizzo S, Botta F, Raimondi S et al (2018) Radiómica del cáncer de ovario seroso de alto grado: asociación entre las características cuantitativas de la TC, el tumor residual y la progresión de la enfermedad en un plazo de 12 meses. Eur Radiol 28:4849–4859Artículo PubMed Google Académico
- Song XL, Ren JL, Zhao D, Wang L, Ren H, Niu J (2021) Radiómica derivada de las características del protocolo farmacocinético de la resonancia magnética con contraste dinámico: el valor del diagnóstico de precisión de las neoplasias ováricas. Eur Radiol 31:368–378Artículo CAS PubMed Google Académico
- Vargas HA, Veeraraghavan H, Micco M et al (2017) Una nueva representación de la heterogeneidad tumoral entre sitios a partir de texturas de tomografía computarizada previa al tratamiento clasifica los cánceres de ovario según el resultado clínico. Eur Radiol 27:3991–4001Artículo PubMed Centro de PubMed Google Académico
- Jian J, Ya Li, Pickhardt PJ et al (2021) Radiómica basada en imágenes de RM para diferenciar los cánceres de ovario epiteliales tipo I y tipo IIΙ. Eur Radiol 31:403–410Artículo PubMed Google Académico
- Zhang H, Mao Y, Chen X et al (2019) Imágenes por resonancia magnética radiómica para categorizar masas ováricas y predecir resultados clínicos: un estudio preliminar. Eur Radiol 29:3358–3371Artículo PubMed Google Académico
- Wang S, Liu Z, Rong Y et al (2019) El aprendizaje profundo proporciona un nuevo biomarcador pronóstico basado en tomografía computarizada para la predicción de recurrencia en cáncer de ovario seroso de alto grado. Radiother Oncol 132:171–177Artículo PubMed Google Académico
- Xia X, Gong J, Hao W et al (2020) Comparación y fusión de características de aprendizaje profundo y radiomómica de nódulos en vidrio esmerilado para predecir el riesgo de invasividad de los adenocarcinomas de pulmón en estadio I en tomografías computarizadas. Front Oncol 10:418Artículo PubMed Centro de PubMed Google Académico
- Yu XP, Wang L, Yu HY et al (2021) Características radiómicas basadas en MDCT para la diferenciación de tumores ováricos serosos limítrofes y tumores ováricos serosos malignos. Cancer Manage Res 13:329–336Artículo Google Académico
- An H, Wang Y, Wong EMF et al (2021) Análisis de textura de TC en la clasificación histológica del carcinoma epitelial de ovario. Eur Radiol 31:5050–5058Artículo PubMed Google Académico
- Park H, Qin L, Guerra P, Bay CP, Shinagare AB (2021) Descodificación de lesiones ováricas incidentales: uso de análisis de textura y aprendizaje automático para la caracterización y detección de malignidad. Abdom Radiol (NY) 46:2376–2383Artículo PubMed Google Académico
- Christiansen F, Epstein EL, Smedberg E, Åkerlund M, Smith K, Epstein E (2021) Análisis de imágenes de ultrasonidos mediante redes neuronales profundas para discriminar entre tumores ováricos benignos y malignos: comparación con la evaluación subjetiva de expertos. Ultrasound Obstet Gynecol 57:155–163Artículo CAS PubMed Centro de PubMed Google Académico
- Wang R, Cai Y, Lee IK et al (2020) Evaluación de una red neuronal convolucional para la diferenciación de tumores ováricos basada en imágenes por resonancia magnética. Eur Radiol. https://doi.org/10.1007/s00330-020-07266-xArtículo PubMed Centro de PubMed Google Académico
- Masci J, Meier U, Cireşan D, Schmidhuber J (2011) Autocodificadores convolucionales apilados para extracción de características jerárquicas. En: Honkela T, Duch W, Girolami M, Kaski S (eds) Redes neuronales artificiales y aprendizaje automático – ICANN 2011. Springer, Berlín Heidelberg, págs. 52-59Capítulo Google Académico
- Huang G, Liu Z, Maaten LVD, Weinberger KQ (2017) Redes convolucionales densamente conectadas, conferencia IEEE de 2017 sobre visión artificial y reconocimiento de patrones (CVPR), págs. 2261-2269
- Dara S, Tumma P (2018) Extracción de características mediante aprendizaje profundo: una encuesta2018 Segunda conferencia internacional sobre electrónica, comunicación y tecnología aeroespacial (ICECA), págs. 1795-1801
- Vununu C, Lee SH, Kwon KR (2019) Un método de extracción de características profundas para la clasificación de imágenes de células HEp-2. Electrónica 8:20Artículo Google Académico
- Fonti V, Belitser E (2017) Selección de características mediante lazo. VU Amsterdam Res Paper Business Anal 30:1–25Google Académico
- Hricak H, Chen M, Coakley FV et al (2000) Masas anexiales complejas: detección y caracterización con imágenes por RM: análisis multivariado. Radiology 214:39–46Artículo CAS PubMed Google Académico
- Foti PV, Attinà G, Spadola S et al (2016) Imágenes por resonancia magnética de masas ováricas: clasificación y diagnóstico diferencial. Insights Imaging 7:21–41Artículo PubMed Google Académico
Fondos
El estudio fue apoyado por el Consejo Nacional de Ciencia y Tecnología (MOST 111-2314-B-039-042) y la Universidad Médica de China (CMU111-MF-62).
Información del autor
Notas del autor
- Cheng-Ting Shih y Tung-Hsin Wu contribuyeron igualmente a este trabajo.
Autores y afiliaciones
- Departamento de Imágenes Biomédicas y Ciencias Radiológicas, Universidad Nacional Yang Ming Chiao Tung, Taipei, 112, TaiwánYa-Ting Jan, Pei-Shan Tsai, Wen-Hui Huang, Chun-Sheng Yen, Ju-Ping Teng y Tung-Hsin Wu
- Departamento de Radiología, Hospital MacKay Memorial, Taipei, TaiwánYa-Ting Jan, Pei-Shan Tsai, Wen-Hui Huang, Ling-Ying Chou, Shih-Chieh Huang, Jing-Zhe Wang y Pei-Hsuan Lu
- Departamento de Medicina, Facultad de Medicina MacKay, Nueva Ciudad de Taipei, TaiwánYa-Ting Jan, Pei-Shan Tsai, Wen-Hui Huang, Ling-Ying Chou, Shih-Chieh Huang, Jing-Zhe Wang y Pei-Hsuan Lu
- Facultad de Medicina, Enfermería y Gestión de MacKay, Nueva Ciudad de Taipei, TaiwánYa-Ting Jan, Pei-Shan Tsai, Wen-Hui Huang, Ling-Ying Chou, Shih-Chieh Huang, Jing-Zhe Wang y Pei-Hsuan Lu
- División de Endocrinología y Metabolismo, Departamento de Medicina, Hospital General de Veteranos de Taipei, Taipei, TaiwánLin Dao Chen
- Departamento de Radiología, Hospital General de Veteranos de Taipei, Taipei, TaiwánLin Dao Chen
- Facultad de Medicina, Universidad Nacional Yang Ming Chiao Tung, Taipei, TaiwánLin Dao Chen
- Laboratorio de imágenes biomédicas (BIG), Departamento de Ingeniería eléctrica e informática, Facultad de Ciencias y Tecnología, Universidad de Macao, Macao, ChinaGreta SP Mok
- Departamento de Imágenes Biomédicas y Ciencias Radiológicas, Universidad Médica de China, Taichung, 404, TaiwánShih Cheng-Ting
Contribuciones
CTS y THW contribuyeron por igual a este trabajo. YTJ, CTS y THW concibieron y diseñaron el estudio, analizaron e interpretaron los datos, prepararon el borrador y dieron la aprobación final de la versión que se presentará. PST, WHH, LYC, SCH, JZW y PHL realizaron el análisis e interpretación de los datos. DCL, CSY y JPT recopilaron los datos y realizaron el análisis estadístico. GSPM revisó críticamente el contenido intelectual y dio la aprobación final de la versión que se presentará. Todos los autores leyeron y aprobaron el manuscrito final.
Autores correspondientes
Correspondencia con Cheng-Ting Shih o Tung-Hsin Wu .
Declaraciones éticas
Aprobación ética y consentimiento para participar
La Junta de Revisión Institucional aprobó este estudio y renunció al requisito del consentimiento del paciente.
Consentimiento para publicación
No aplica.
Intereses en competencia
Los autores declaran que no tienen intereses en conflicto.
Información adicional
Nota del editor
Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Información adicional
Archivo adicional 1. Tabla S1.
Características radiómicas extraídas en este estudio. Tabla S2. Características del paciente y del tumor para los conjuntos de entrenamiento y prueba. Tabla S3. Métricas de rendimiento de los modelos de IA en el conjunto de entrenamiento. Tabla S4. Métricas de rendimiento de los modelos de IA en el conjunto de prueba. Tabla S5. Comparación del AUC entre radiólogos con y sin asistencia de IA. Tabla S6. Comparación del AUC entre radiólogos junior y radiólogos senior. Tabla S7. Comparación del AUC entre radiólogos junior con IA y radiólogos senior. Tabla S8. Comparación del AUC entre el modelo de conjunto y los radiólogos.
Derechos y permisos
Acceso abierto Este artículo está licenciado bajo una Licencia Creative Commons Atribución 4.0 Internacional, que permite el uso, intercambio, adaptación, distribución y reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor original y a la fuente, se proporcione un enlace a la licencia Creative Commons y se indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y el uso que pretende darle no está permitido por la regulación legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor.