|
Akcelerace neuronových sítí s využitím GPU
Šimíček, Ondřej ; Jaroš, Jiří (oponent) ; Petrlík, Jiří (vedoucí práce)
Tato práce se zabývá využitím grafických čipů pro akceleraci neuronových sítí s učením typu backpropagation. Pro řešení tohoto problému byla zvolena technologie OpenCL umožňující využít grafické čipy různých výrobců. Hlavním cílem práce byla akcelerace časově náročného procesu učení sítí a procesu klasifikace. Zrychlení bylo docíleno trénováním velkého množství neuronových sítí současně. Získané zrychlení bylo využito pro nalezení vhodné topologie a nastavení neuronové sítě pro zadanou úlohu pomocí genetického algoritmu.
|
|
Využití GPU pro akceleraci optimalizace systému vodních děl
Marek, Jan ; Petrlík, Jiří (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato práce se zabývá optimalizací řízení zásobní funkce vodohospodářských soustav. Vycházíme z dizertační práce Ing. Pavla Menšíka Ph.D., Automatizace řešení zásobní funkce vodohospodářské soustavy. Jako optimalizační metoda byla zvolena diferenciální evoluce. Daná metoda bude implmentována sekvečne a poté paralelizována nejdříve na procesoru a poté na GPU
|
|
Interaktivní simulace chování tkaniny akcelerovaná pomocí GPU
Melichar, Vojtěch ; Klepárník, Petr (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato práce se zabývá interaktivní simulací chování tkanin s využitím GPU pro obecné výpočty. V první části jsou rozebrány všechny technologie, které jsou následně využity při implementaci programu. Druhá část poté diskutuje různé způsoby řešení simulací. Především se věnuje částicovým systémům, které patří k nejpoužívanějším metodám. Následně je navržen program, který je v rámci této práce také implementován. Implementace proběhla ve čtyřech různých variantách. První variantou je čistě CPU implementace, druhou variantou je optimalizace CPU implementace pomocí technologie OpenMP. Z těchto implementací vychází CUDA implemntace. Poslední zde implementovanou variantou byla optimalizovaná CUDA implementace. Na závěr práce jsou všechny implementace vyhodnoceny z pohledu jejich výpočetní složitosti a vhodnosti pro použití v grafice počítané v reálném čase.
|
| |
|
Akcelerace ultrazvukových simulací pomocí multi-GPU systémů
Stodůlka, Martin ; Vaverka, Filip (oponent) ; Jaroš, Jiří (vedoucí práce)
V této práci je kladen důraz na multi - GPU systémy a využití CUDA unifikované paměti.Hlavním cílem je akcelerovat výpočet 3D FFT, který je hlavní součástí simulací knihovny k- Wave .K- Wave je C++/ Matlab knihovna určena pro simulaci šíření ultrazvukových vln v 1D , 2D nebo 3D prostoru.Akcelerace těchto funkcí je potřebná, jelikož se jedná o výpočetně náročně simulace.
|
|
Optimalizace spouštěcích konfigurací k-Wave úloh
Sasák, Tomáš ; Jaroš, Marta (oponent) ; Jaroš, Jiří (vedoucí práce)
Táto práca sa zaoberá plánovaním, resp. správnym odhadom spúšťacích konfigurácií úloh k-Wave na superpočítačoch infraštruktúry IT4Innovations. Presnejšie pre klastre Salomon a Anselm. Úloha predstavuje množinu simulácií, kde každá simulácia je spúšťaná pod toolboxom k-Wave. Pre spustenie jednotlivých simulácií je nutné správne vytvoriť konfiguráciu, ktorá sa skladá z množstva zdrojov (počet výpočtových uzlov, resp. jadier) a času rezervácie superpočítača, čo je pre neskúseného zložité odhadnúť. Zvolený problém odhadu je riešený na základe empirických dát, ktoré boli získané viacnásobným spúšťaním rôznych množín simulácií na klastroch. Tieto dáta sú uložené a spracované aproximátormi, ktoré konkrétne vykonávajú odhad týchto parametrov na základe metód interpolácie a regresie. V práci je popísaný a bol implementovaný systém predstavujúci plánovač, ktorý predstavuje rozhranie pre odhad. Experimentovaním bolo zistené že pre tento špecifický problém najpresnejšie odhady vykonáva trojica Akima spline, PCHIP interpolácia a kubický spline. Výsledky tejto práce umožňujú vykonávať istý odhad exekučného času a počtu vlákien pre ľubovolné simulácie automaticky a bez znalosti kódu k-Wave.
|
| |
| |
|
Akcelerace částicových rojů PSO pomocí GPU
Krézek, Vladimír ; Schwarz, Josef (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato práce se zabývá technikou PSO (Particle Swarm Optimization neboli Optimalizace pomocí částicových rojů), s jejíž pomocí je možné řešit komplexní problémy. Tuto techniku lze využít při řešení složitých kombinatorických problémů (obchodní cestující, úloha o batohu), návrh integrovaných obvodů a antén, v oborech jako je biomedicína, robotika, umělá inteligence nebo i finančnictví. Přestože je algoritmus PSO velice efektivní, čas nezbytný pro nalezení vhodného řešení reálných problémů často přesahuje hranice únosnosti. Cílem této práce je tedy urychlit běh tohoto algoritmu pomocí grafického adaptéru, který nabízí velmi vysoký výpočetní potenciál při zachování příznivé ceny a rozměru. Pro demonstrační účely a ověření kvality implementace byl zvolen problém rozhodnutelnosti systému logických formulí (SAT), jenž patří do třídy NP-úplných problémů. Redukcí časové náročnosti algoritmu PSO při řešení SAT problému jsme tedy schopni akcelerovat celou třídu úloh a řešit problémy, které byly dosud prakticky neřešitelné.
|
|
Akcelerace algoritmů komprese dat na platformě Sony PS3
Breitenbacher, Dominik ; Jaroš, Jiří (oponent) ; Šimek, Václav (vedoucí práce)
Tato práce představuje použití zařízení PlayStationu 3 pro akceleraci kompresního algoritmu a snaží se tak prezentovat potenciál PlayStationu 3 pro použití na tyto úlohy. Pro demonstraci byla vybrána kompresní metoda založená na Burrows-Wheelerově transformaci. Výstup transformace je dále transformován pomocí Move-To-Front transformace a následně zakódován pomocí statického Huffmanova kódování. Kompresní algoritmus byl nazván PS3BWT. Ten vykonává kompresi po jednotlivých úlohách a snaží se vždy využít maximální počet dostupných procesorových jednotek tak, aby komprese byla provedena co nejrychleji.
|