Národní úložiště šedé literatury Nalezeno 37 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Simulace šíření tepla v mozku pomocí knihovny OpenACC
Oškera, Josef ; Kadlubiak, Kristián (oponent) ; Jaroš, Jiří (vedoucí práce)
Cílem této práce je přepsat implementaci šíření tepla v mozkové tkáni naspanou v jazyce Matlab (dostupnou v balíku k-Wave) do jazyka C/C++, akcelerovat ji na GPU za pomoci knihovny OpenACC a CUDA, a následně tyto knihovny porovnat ve výkonnosti a náročnosti implementace. V řešení je popsáno jak programovat grafickou kartu, a jak tyto znalosti aplikovat. Vytvořený program je schopen simulovat šíření tepla na CPU i GPU.
Efektivní implementace výpočetně náročných algoritmů na Intel Xeon Phi
Šimek, Dominik ; Hrbáček, Radek (oponent) ; Jaroš, Jiří (vedoucí práce)
Táto práca sa zaoberá implementáciou a optimalizáciou výpočtovo náročných algoritmov na koprocesore Intel Xeon Phi. Koprocesor Xeon Phi bol predstavený firmou Intel v roku 2012 ako odpoveď na obrovský nárast v používaní technológie GPGPU. Xeon Phi disponuje podstatne väčším výkonom ako procesor, preto je podobne ako GPGPU vhodnou platformou pre beh výpočtovo náročných programov. Xeon Phi zatiaľ v praxi nie je velmi používaný, preto je potrebné hľadať možné oblasti uplatnenia. Rozrastá sa ale jeho použitie v superpočítačových centrách, napríklad Milky Way 2 - Guangzhou (Čina), Salomon - Ostrava. Cieľom tohto dokumentu je oboznámiť čitateľa s problematikou implementácie náročných algoritmov na akceleračnej karte Xeon Phi, ich optimalizácie a meranie výkonu. Výkon koprocesoru Intel Xeon Phi bude porovnávaný s výkonom procesorov Intel Xeon.  V teoretickej časti práce bude čitateľ oboznámený s architektúrou a princípmi koprocesoru Xeon Phi. Budeme sa venovať výhodám ale aj nevýhodám tohto koprocesoru, ktoré budú často porovnávané s všeobecnými vlastnosťami procesorov. Témou bude taktiež otázka, kedy je vhodné zvoliť pre výpočet akcelerečnú kartu Xeon Phi a kedy procesor. Detailne si vysvetlíme a znázorníme výber vhodných algoritmov pre Xeon Phi, postup ich implementácie, optimalizácie a meranie výkonu. Okrem toho budú rozoberané problémy a úskalia, ktoré môžu nastať pri implementácii algoritmov a používaní koprocesoru. Dané demonštrujeme najskôr na ukážkových problémoch, ktoré boli riešené na Ostravskom superpočítači Anselm. V prvom rade to budú jednoduché benchamrky typu násobenie matíc, násobenie matice a vektora, na ktorých budú ukázané základné princípy implementácie optimálnych algoritmov pre koprocesor Xeon Phi. Napríklad pri benchmarku násobenia matice a vektora bolo dosiahnutých asi 6.5% teoretického výkonu koprocesoru. Ďalším, komplexnejším problémom bude N-Body Simulation - simulácia pohybu častíc v priestore, na ktorom sme otestovali potenciál Xeon Phi. Výkon koprocesoru sa pri tomto benchmarku vyšplhal až na viac ako 35% teoretického výkonu - 725 gFLOPS (maximálny výkon 2000 gFLOPS pre dáta s jednoduchou presnosťou). Čitateľ sa okrem iného môže dozvedieť aj zaujímavé informácie z oblasti fyzikálnych simulácií, konkrétne bude reč o module pre MATLAB (k-Wave). K-Wave sa zaoberá simuláciou šírenia akustických vĺn v 1D, 2D a 3D, čo sa využíva napríklad pri simulácii šírenia ultrazvukových vĺn v mäkkých tkanivách. Na koniec si stručne povieme o portovaní už existujúcich knižníc, modulov či programov na Xeon Phi zo snahou využitia jeho potenciálu. Bude to napríklad kroskompilácia knižníc HDF5, ZLIB či konca interpretu jazyka Python s modulmi Numpy a Scipy.
Ultrasound Simulation in Python
Černý, David ; Olšák, Ondřej (oponent) ; Jaroš, Jiří (vedoucí práce)
k-Wave is a MATLAB toolbox for the simulation of sound wave propagation. The aim of this thesis is to re-implement a subset of k-Wave in Python while focusing on computational performance. The second goal is to develop a set of guidelines for transforming MATLAB source code to Python that could aid in further development. The thesis first summarises core features of the k-Wave toolbox, explores available technologies for high performance computing in Python, and highlights the most important aspects of transforming MATLAB source codes to Python. The second part of the thesis discusses architecture, testing and benchmarking of the Python implementation. The result of this thesis is a Python implementation of the three-dimensional sound propagation simulation compatible with k-Wave. The new implementation improves the structure of the original toolbox while providing performance comparable to the original k-Wave. In some instances, the performance of the new implementation surpasses the original implementation.
Implementace ultrazvukových měničů a tkáňových reprezentací do toolboxu k-Wave
Hanzl, Martin ; Budiský, Jakub (oponent) ; Jaroš, Jiří (vedoucí práce)
Práce popisuje návrh rozšíření nástroje k-Wave určeného k modelování šíření ultrazvuku. Cílem rozšíření je minimalizace prosotorové a časové složitosti pomocí alternativního návrhu reprezentace tkání a měničů v simulaci. V práci jsou objasněny základní principy a vlastnosti k-Wave a následně navržena rozšíření a popsána jejich implementace.
Paralelizace ultrazvukových simulací pomocí akcelerátoru Intel Xeon Phi
Vrbenský, Andrej ; Hrbáček, Radek (oponent) ; Jaroš, Jiří (vedoucí práce)
Simulácia šírenia ultrazvukových akustických vĺn má v dnešnej dobe široké praktické použitie. Jedným z nich je simulácia v reálnom tkanivovom prostredí, ktorá má dobré uplatnenie v medicíne. Jednou z aplikácií, ktoré sú na túto simuláciu určené, je k-Wave toolbox. Výpočtová náročnosť takýchto simulácii je veľmi veľká a preto sa vyvíjajú nové metódy pre jej zrýchlenie. V tejto diplomovej práci sme navrhli riešenie pre urýchlenie simulácie, založené na paralelizácii výpočtu na akceleračnej karte Intel Xeon Phi. Akcelerátor obsahuje vysoký počet jadier a extra-širokú vektorovú jednotku, a je preto ideálny na paralelizáciu a vektorizáciu. Implementácia využíva OpenMP verzie 4.0, ktorá prináša niektoré nové možnosti ako napríklad explicitnú vektorizáciu. Dosiahnuté výsledky boli namerané počas rozsiahlych experimentov.
Paralelizace ultrazvukových simulací pomocí 2D dekompozice
Nikl, Vojtěch ; Dvořák, Václav (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato práce je součástí projektu k-Wave, což je simulační nástroj akustické tomografie sloužící k simulaci a rekonstrukci akustických vlnových polí a jeho hlavním přínosem je plánování ultrazvukových operací lidské tkáně, např. nádoru na mozku. Dopředné simulace jsou založeny na řešení k-prostorové pseudospektrální časové domény. Simulace jsou časově a výpočetně velice náročné. Simulace probíhají na 3D maticích, které reprezentují určité vlastnosti reálné tkáně, např. hustotu absorbce nebo rychlost šíření zvuku. K výpočtu gradientu se používá Rychlá Fourierova transformace (dále jen FFT), jejíž výpočet zabere zhruba 60% simulačního času. 3D FFT byla do této doby počítána pomocí softwarové knihovny FFTW, která interně využívá 1D dekompozici, tj. dekompozici podél jedné osy. Hlavní nevýhoda 1D dekompozice je relativně malý maximální počet výpočetních jader, přes které lze paralelizovat výpočet. Matice mají velikost řádově 1024x2048x3072, tím pádem lze efektivně paralelizovat přes maximálně 1024 jader. Dnešní superpočítače umožnují využít až stovky tisíc jader a tomu bychom se rádi přiblížili.  Řešením je využití 2D dekompozice, která by teoretický maximální počet jader posunula až do řádu milionů. Její efektivní implementací se zabývá právě tato práce. 2D dekompozice je obecně paralelizována pouze pomocí MPI procesů, např. v~knihovnách PFFT nebo P3DFFT, v této práci ale využíváme pokročilejší kombinace MPI procesů a OpenMP vláken, kterou jsme nazvali hybridní 2D dekompozice (HybridFFT). Má tři hlavní části: výpočet 1D FFTs, lokální transpozice dat a globální transpozice dat. Pro výpočet sérií 1D FFT je využita knihovna FFTW.Lokální transpozice jsou implementovány pomocí blokové transpozice 2D matice, která je vektorizována pomocí SSE/AVX instrukcí. Jak 1D FFT, tak lokální lokální transpozice, jsou akcelerovány pomocí OpenMP vláken. Globální transpozice je opět implementována prostřednictvím knihovny FFTW, která při použití pokročilého plánování dokáže výrazně snížit dobu potřebnou pro její realizaci. Hlavním cílem této práce je tedy dosáhnout maximálního možného zrychlení a škálovatelnosti oproti předchozímu řešení, zároveň ale i zachovat kompatibilitu a přenositelnost. Hybridní transformace pracuje nejlépe, pokud na jednom socketu spustíme jeden MPI proces a v rámci tohoto socketu využijeme tolik vláken, kolik máme k dispozici jader. Díky tomu nemusí jádra v rámci jednoho socketu komunikovat přes MPI zprávy, ale využívají rychlejší sdílenou paměť, a zároveň je MPI komunikace efektivnější, protože máme pouze jeden MPI proces na socket a tím pádem jsou MPI zprávy vetší a je jich méně, což vede k menšímu zahlcení propojovací sítě a lepší efektivitě komunikace. Řešení bylo testováno na superpočítačích Anselm (Ostrava), Zapat (Brno) a Supernova (Wroclaw). Pro nižší počty jader, v řádu několika set, je výkon přibližně stejný nebo o pár procent lepší, než původně použitá 1D dekompozice FFTW knihovny nebo knihony PFFT a P3DFFT. Jeden z velmi dobrých výsledků je např. 512^3 FFT na 512 jádrech, kde hybridní dekompozice dosáhla času 31 ms, zatímco FFTW 39 ms a PFFT 44ms. Na stroji Anselm jsme spustili výpočet až na 2048 jádrech a škálovatelnost byla stále lineární. Nejlepší nárust výkonu oproti ostatním knihovnám by se měl projevit při počtu zhruba 8-16 tisíc jader pro kostky velikosti 1024^3, protože v této konfiguraci bude mít jeden MPI proces na starosti jednu desku matice a zároveň budou MPI zprávy dostatečně velké a v takovém počtu, že by se měla projevit lepší efektivita komunikace oproti ostatním knihovnám.
Vizualizace šíření ultrazvuku v lidském těle
Klepárník, Petr ; Jaroš, Jiří (oponent) ; Španěl, Michal (vedoucí práce)
Tato práce se věnuje 2D a 3D vizualizaci výstupů softwarového balíku k-Wave, který slouží k simulaci šíření ultrazvuku v lidském těle. Balík k-Wave běžně generuje specifická výstupní data nadměrných velikostí (v řádu desítek GB), proto je třeba řešit předzpracování těchto dat. Vizualizace těchto dat má za cíl usnadnit uživatelům zkoumání výsledků simulace. Práce se odvíjí od formátu simulačních dat - HDF5, hledá nejvhodnější způsob pro rychlé čtení těchto dat. Hlavní částí práce je návrh a popis implementace konzolové aplikace pro předzpracování rozměrných simulačních výstupů z k-Wave a aplikace s grafickým uživatelským rozhraním pro interaktivní zobrazování předzpracovaných dat. Nejpodstatnějšími funkcemi těchto aplikací je podvzorkování dat, změna formátu jejich uložení, zobrazování 2D řezů, planární a volumetrické zobrazení, animace průběhu simulace. Navržená implementace umožňuje průchod vizualizovanou doménou o velikosti jednotek GB s latencí v řádu ms - toto významně zefektivňuje práci vědcům a lékařům v oblasti HIFU.
Akcelerace ultrazvukové neurostimulace pomocí multi-GPU systémů
Bayer, David ; Kadlubiak, Kristián (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato diplomová práce se věnuje rozšíření akcelerované implementace simulace šíření akustických vln v médiu balíku k-Wave o možnost využití více GPU pro výpočet. Nejprve popisuje multi-GPU systémy a nástroje, pomocí kterých je s nimi možné pracovat. Pokračuje popisem balíku k-Wave a analýzou existujících akcelerovaných implementací. Dále testuje vybrané technologie na simulaci šíření tepla v médiu a na základě zjištěných výsledků vybírá nástroje pro návrh výsledné implementace. Nakonec shrnuje dosažené výsledky.
Odhad doby běhu algoritmu pomocí strojového učení
Buchta, Martin ; Chlebík, Jakub (oponent) ; Jaroš, Jiří (vedoucí práce)
Cílem této práce je vytvořit model pro odhad doby běhu ultrazvukové simulace k-Wave na základě dané velikosti domény. Program využívá MPI a může být spuštěn na více uzlech superpočítače. Predikční modely byly vytvořeny s využitím symbolické regrese a následně porovnány s modely založenými na neuronových sítích. Tyto modely byly natrénovány na zaznamenaných datech. Výsledky ukazují, že modely překonávají stávající řešení. Model se symbolickou regresí dosáhl průměrné relativní odchylky 5,64% u vhodných úloh. Model neuronové sítě dosáhl průměrné relativní odchylky 8,25% na neznámých doménách včetně těch, které nejsou optimalizované pro simulaci k-Wave. Tato práce přináší nový, přesnější model pro předpovídání doby běhu a porovnává chybovost neuronových sítí a symbolické regrese pro tento konkrétní typ regresní úlohy. Celkově tyto modely mají potenciál praktického využití při spouštění a plánování simulací k-Wave.
Akcelerace ultrazvukové neurostimulace pomocí aritmetiky se sníženou přesností.
Duchoň, Radek ; Olšák, Ondřej (oponent) ; Jaroš, Jiří (vedoucí práce)
K-Wave je nástroj pro akustickou a ultrazvukovou simulaci s otevřeným zdrojovým kódem. Aktuální dostupné implementace jsou napsány v jazycích C++ a Matlab. Cílem této diplomové práce je akcelerovat existující implementaci ultrazvukové simulace pomocí výpočtů s nižší přesností na grafických kartách Nvidia za využití softwarové platformy CUDA. Dalším přínosem této práce by měla být snížená paměťová náročnost, což umožní provádění větších simulací. Snížená přesnost však nesmí vzhledem k využití například pro neurostimulaci mozku příliš narušit výsledky jako celek. Důležité je proto identifikovat vhodné veličiny, které lze uložit v nižší přesnosti. V této práci budou analyzovány možné přístupy a jejich efektivita při využití nižší přesnosti. Dále pak bude proveden návrh řešení, jehož částí bude identifikace potenciálních veličin pro redukci. Na to bude navazovat specifikace docílené implementace a její testování. Závěr se bude věnovat zhodnocení řešení na základě dosažených výsledků z testování.

Národní úložiště šedé literatury : Nalezeno 37 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.