Jiqun Tu, ingeniero sénior de tecnología de desarrollo en NVIDIA, y Ellery Russell, responsable técnico del motor Desmond en Schrödinger, exploran técnicas avanzadas de optimización de GPU diseñadas para acelerar las simulaciones de dinámica molecular.
La investigación farmacéutica exige simulaciones rápidas y eficientes para predecir cómo interactúan las moléculas, acelerando así el descubrimiento de fármacos. Jiqun Tu, ingeniero sénior de tecnología de desarrollo en NVIDIA, y Ellery Russell, responsable técnico del motor Desmond en Schrödinger, exploran técnicas avanzadas de optimización de GPU diseñadas para acelerar las simulaciones de dinámica molecular.
En esta sesión de NVIDIA GTC 2024, presentan estrategias prácticas para mejorar la eficiencia y el rendimiento de la carga de trabajo, lo que brinda a los investigadores farmacéuticos las herramientas para mejorar el descubrimiento computacional de fármacos. Basándose en los flujos de trabajo de CUDA existentes, cubren innovaciones como CUDA Graphs, corrutinas de C++ y memoria mapeada para superar los desafíos de escalabilidad y los cuellos de botella.Play on TV
Siga con un PDF de la sesión , que proporciona a los asistentes técnicas prácticas para optimizar el rendimiento, minimizar la latencia y aprovechar al máximo las capacidades de la GPU para simulaciones moleculares. Los temas incluyen:
Gráficos CUDA: cómo la agrupación de los lanzamientos del kernel en árboles de dependencia reduce la sobrecarga y permite una ejecución más eficiente.
Optimización del rendimiento de la GPU: concéntrese en el rendimiento programando múltiples simulaciones independientes en la misma GPU para enmascarar los cuellos de botella en serie.
Memoria mapeada: utiliza el acceso directo a la memoria entre el host y el dispositivo para eliminar retrasos en la transferencia de datos.
Corrutinas de C++: estrategias para superponer cálculos y controlar el rendimiento en múltiples simulaciones, mejorando la utilización de la GPU sin una reestructuración compleja del código.
Rendimiento del motor FEP+ y Desmond: estudios de caso sobre cómo se utilizan estas herramientas en el motor de dinámica molecular de Schrödinger, logrando una aceleración de hasta 2,02x en cargas de trabajo clave. Nvidia Blog Técnico. M.H. Traducido al español