Název: Performance of parallel QR factorization methods on the NVIDIA Grace CPU Superchip
Autoři: Břichňáč, V. ; Šístek, Jakub
Typ dokumentu: Příspěvky z konference
Konference/Akce: Programs and Algorithms of Numerical Mathematics /22./, Hejnice (CZ), 20240623
Rok: 2025
Jazyk: eng
Abstrakt: This article studies several algorithms for QR factorization based on hierarchical Householder reflectors organized into elimination trees, which are particularly suited for tall-and-skinny matrices and allow parallelization. We examine the effect of various parameters on the performance of the tree-based algorithms. The work is accompanied with a custom implementation that utilizes a task-based runtime system (OpenMP or StarPU). The same algorithm is implemented in the PLASMA library. The performance evaluation is done on the recent NVIDIA Grace CPU Superchip.
Klíčová slova: NVIDIA Grace CPU; QR factorization; task-based programming
Číslo projektu: GA23-06159S (CEP)
Poskytovatel projektu: GA ČR
Zdrojový dokument: Programs and Algorithms of Numerical Mathematics 22 : Proceedings of Seminar, ISBN 978-80-85823-74-5
Poznámka: Související webová stránka: http://dx.doi.org/10.21136/panm.2024.03

Instituce: Matematický ústav AV ČR (web)
Informace o dostupnosti dokumentu: Dokument je dostupný v repozitáři Akademie věd.
Původní záznam: https://hdl.handle.net/11104/0368021

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-684970


Záznam je zařazen do těchto sbírek:
Věda a výzkum > AV ČR > Matematický ústav
Konferenční materiály > Příspěvky z konference
 Záznam vytvořen dne 2025-07-05, naposledy upraven 2025-07-05.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet