Original title:
Rozsáhlé simulace ultrazvuku za použití akcelerovaných clusterů
Translated title:
Large-scale Ultrasound Simulations using Accelerated Clusters
Authors:
Vaverka, Filip ; Boehm, Christian (referee) ; Říha, Lubomír (referee) ; Jaroš, Jiří (advisor) Document type: Doctoral theses
Year:
2023
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Efektivní využití akcelerovaných HPC clusterů je obzvlášť závislé na efektivitě komunikace použitých algoritmů. Tato práce se tedy věnuje přezkoumání pseudo-spektrálních algorimů používaných pro řešení vlnových problémů převážně v oblasti medicínského ultrazvuku s cílem umožnit jejich běh na akcelerovaných strojích. Je ukázáno, že doménová dekompozice je preferovaný způsob dosažení daného cíle, jelikož řada alternativních přístupů vykazuje výrazně horší numerické vlastnosti. Na základě tohoto přístupu a k-Wave modelu ultrazvuku, široce používaného v medicíně, je navržen nový simulační algoritmus. Následnými experimenty je ukázáno, že tento přístup dosahuje až 7.5x zrychlení a dosahuje téměř perfektního slabého škálování až do 512 GPU akcelerovaných uzlů. Zároveň toto řešení umožňuje plné využití výpočetních uzlů s několika GPU akcelerátory a pokročilým propojením jako je NVIDIA DGX-2 s NVLink. Tato metoda také nabízí možnost flexibilní volby mezi přesností a efektivitou. Volbou hloubky překryvu subdomén lze dosáhnout jak přesnosti srovnatelné s původní k-Space metodou, tak i maximalizovat výkon při zachování dostatečné přesnosti.
Efficient utilization of accelerated HPC clusters is particularly sensitive to communication efficiency of deployed algorithms. In this thesis, we reexamine pseudo-spectral solvers for wave-like problems in medical ultrasonics to allow their deployment on these machines. The domain decomposition is shown to be a preferable approach to improving data locality of these solvers as a range of suitable alternative discretizations exhibited considerably worse numerical properties. The local Fourier basis domain decomposition is then used to construct a novel solver based on the state of the art model for ultrasound in medicine -- k-Wave. We show that this approach is up to 7.5x faster and achieves almost perfect weak-scaling up to 512 GPU accelerated nodes, while being able to take full advantage of advanced GPU interconnects such as NVLink in NVIDIA DGX-2 multi-GPU nodes. The method offers flexible accuracy--efficiency trade off, which allows to nearly match accuracy of the global k-Space method or maximize performance at sufficient accuracy by subdomain overlap scaling.
Keywords:
akcelerované počítání; CUDA; GPU; HIFU; lokální Fourierova báze; metody doménové dekompozice; MPI+X; nelineární ultrazvuk; pseudo-spektrální metody; simulace ultrazvuku v lékařství; superpočítání; accelerated computing; CUDA; domain decomposition methods; GPU; HIFU; local Fourier basis; medical ultrasound simulation; MPI+X; non-linear ultrasound; pseudo-spectral methods; supercomputing
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: https://hdl.handle.net/11012/245277