El Portal de las Tecnologías para la Innovación

Un nuevo marco de criptografía para estudios genómicos seguros

Desarrollado a partir de la investigación EPFL, en colaboración con MIT y Yale, la combinación de computación segura y algoritmos distribuidos abre una nueva era para las colaboraciones de datos en investigación médica.

Los avances en inteligencia artificial generativa y aprendizaje automático, capacitados en conjuntos de datos a gran escala en múltiples instituciones, tienen el potencial de revolucionar la medicina. Sin embargo, los datos son difíciles de recopilar. Está aislado en hospitales individuales, prácticas médicas y clínicas de todo el mundo. Los riesgos de privacidad derivados de la divulgación de datos médicos también son una preocupación seria, por lo que las regulaciones existentes de intercambio de datos han limitado en gran medida el alcance de las colaboraciones de datos para la investigación médica.

Existen herramientas criptográficas para la computación segura, pero no son prácticas o no implementan métodos actuales de vanguardia. Ahora, un enfoque desarrollado por EPFL se ha demostrado con éxito a escala y se está implementando en toda Europa.

Secure federated genome-wide association studies o SF-GWAS es una combinación de marcos de computación seguros y algoritmos distribuidos que permite estudios eficientes y precisos sobre datos privados en poder de múltiples entidades al tiempo que garantiza la confidencialidad de los datos. Un estudio sobre cinco conjuntos de datos, incluida una cohorte del Biobanco del Reino Unido de 410,000 individuos, ha mostrado una mejora en el orden de magnitud en el tiempo de ejecución en comparación con los métodos anteriores.

“En muchos casos no es posible centralizar los datos por razones prácticas o legales o simplemente porque las personas no están dispuestas a compartirlos. Entonces, el objetivo es extraer información sin compartir los datos,” dijo Jean-Pierre Hubaux, Director Académico de EPFLf Centro de Confianza Digital (C4DT), afiliado a la Escuela de Ciencias de la Computación y la Comunicación.

“Nos desarrollamos un prototipo hace varios años, pero lo que faltaba era la demostración de que funciona a escala con conjuntos de datos de tamaño real. Esto ahora se ha hecho en colaboración con MIT y Yale con nuestra última investigación que muestra que es posible extraer información de conjuntos de datos que permanecen distribuidos geográficamente, sin pérdida de precisión significativa en términos de resultados; Esto abre una nueva era en términos de colaboraciones de datos, ” continuó.

SF-GWAS combina dos conceptos clave. Primero, se necesita un enfoque federado para asegurar la computación, lo que significa que cada conjunto de datos se mantiene en el sitio de origen respectivo. Esto minimiza los costos computacionales al evitar grandes transferencias de datos entre sitios y permite el uso de operaciones criptográficas eficientes que protegen la salida computacional parcial generada en cada sitio.

En segundo lugar, introduce un diseño algorítmico eficiente para apoyar la ejecución federada de varias tuberías GWAS de extremo a extremo.

“Suena contradictorio, pero nuestro enfoque comparte datos sin compartir,” explicó Hubaux. “Aprovecha la existencia de los conjuntos de datos sin tener que transferirlos y es esencialmente un valor adicional a los datos, una motivación adicional para trabajar juntos sin perder el control.”

SF-GWAS ya se ha instalado en cinco hospitales universitarios de Suiza; Actualmente se está implementando en varios hospitales italianos y para redes europeas de cáncer Tune Insight, el spin-off de EPFL liderando este trabajo. La compañía también está en conversaciones con instituciones médicas en otros países.

Además de desbloquear la investigación médica a escala para definir y optimizar la política de salud pública, lo que simplemente no es posible en un mundo de silos, Hubaux cree que SF-GWAS tendrá un valioso beneficio secundario. Actualmente, los conjuntos de datos se distribuyen de facto en todo el mundo, sentados en discos duros y cintas aquí y allá, porque tradicionalmente ha sido tan complicado transferir datos. El registro de datos médicos también se aplica de manera diferente en diferentes lugares. Hubaux llama a esto “prehistoric” y dice que, como resultado, los conjuntos de datos están muy subutilizados.

“Estamos configurando un sistema de valores para asegurarnos de que los datos futuros sean interoperables, que se registren de la misma manera lugar a lugar, de lo contrario será basura, basura. Es costoso y la transición llevará tiempo, pero hemos desarrollado las herramientas para facilitarlo y hay una evolución en marcha, dijo ” Hubaux.

“La voluntad de trabajar a escala es un cambio de cultura y espero que este sea un círculo virtuoso: las personas se sienten alentadas a ser más rigurosas en términos de la forma en que almacenan y estructuran sus datos para garantizar la interoperabilidad porque si no lo hacen, su institución puede ser excluida del resto de la comunidad. Esto es realmente un beneficio secundario – mejor calidad general de salud y datos médicos.”

Enlace al documento completo: https://rdcu.be/ea16o

EPFL News. T. P. Traducido al español

Artículos relacionados

Scroll al inicio