Název:
Implementace neúplného inverzního rozkladu na grafických kartách
Překlad názvu:
Implementing incomplete inverse decomposition on graphical processing units
Autoři:
Dědeček, Jan ; Tůma, Miroslav (vedoucí práce) ; Hakl, František (oponent) Typ dokumentu: Diplomové práce
Rok:
2013
Jazyk:
eng
Abstrakt: [eng][cze] The goal of this Thesis was to evaluate a possibility to solve systems of linear algebraic equations with the help of graphical processing units (GPUs). While such solvers for generally dense systems seem to be more or less a part of standard production libraries, the Thesis concentrates on this low-level parallelization of equations with a sparse system that still presents a challenge. In particular, the Thesis considers a specific algorithm of an approximate inverse decomposition of symmetric and positive definite systems combined with the conjugate gradient method. An important part of this work is an innovative parallel implementation. The presented experimental results for systems of various sizes and sparsity structures point out that the approach is rather promising and should be further developed. Summarizing our results, efficient preconditioning of sparse systems by approximate inverses on GPUs seems to be worth of consideration. Powered by TCPDF (www.tcpdf.org)Cílem této práce bylo vyhodnocení možnosti řešit soustavy lineárních algebraických rovnic na grafických akcelerátorech. Zatímco řešiče obecně hustých soustav na těchto procesorech jsou víceméně součástí standardních uživatelských knihoven, tato práce se zaměřuje na soustavy řídké, kde tomu tak zdaleka není. Konkrétně se tato práce zaměřuje na jeden specifický algoritmus přibližného inverzního rozkladu symetrických a pozitivně definitních matic, který je kombinován s příslušnou krylovovskou metodou, metodou sdružených gradientů. Důležitou součástí této práce je inovativní paralelní implementace. Předkládané výsledky experimentů se systémy různých velikostí i struktur řídkosti ukazují, že nový přístup je slibný a v jeho vývoji by se mělo pokračovat. Sumárně, práce ukazuje, že přepodmiňování řídkých soustav přibližnými inverzemi na grafických akcelerátorech je jeden z možných efektivních postupů řešení. Powered by TCPDF (www.tcpdf.org)
Klíčová slova:
grafický procesor; neúplná faktorizace; Přibližná inverze; Approximate inverse; graphical processing unit (GPU); incomplete decomposition