Národní úložiště šedé literatury Nalezeno 37 záznamů.  začátekpředchozí21 - 30další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Ultrasound Simulation in Python
Černý, David ; Olšák, Ondřej (oponent) ; Jaroš, Jiří (vedoucí práce)
k-Wave is a MATLAB toolbox for the simulation of sound wave propagation. The aim of this thesis is to re-implement a subset of k-Wave in Python while focusing on computational performance. The second goal is to develop a set of guidelines for transforming MATLAB source code to Python that could aid in further development. The thesis first summarises core features of the k-Wave toolbox, explores available technologies for high performance computing in Python, and highlights the most important aspects of transforming MATLAB source codes to Python. The second part of the thesis discusses architecture, testing and benchmarking of the Python implementation. The result of this thesis is a Python implementation of the three-dimensional sound propagation simulation compatible with k-Wave. The new implementation improves the structure of the original toolbox while providing performance comparable to the original k-Wave. In some instances, the performance of the new implementation surpasses the original implementation.
Akcelerace ultrazvukové neurostimulace pomocí vysokoúrovňových GPGPU knihoven
Mička, Richard ; Kadlubiak, Kristián (oponent) ; Jaroš, Jiří (vedoucí práce)
Táto práca sa zaoberá akceleráciou výpočtu simulácie šírenia akustických vĺn z balíku k-Wave pomocou GPGPU knižníc. Ako prvé, sú v práci preskúmané a ohodnotené dostupné vysokoúrovňové GPGPU knižnice. Následne je, po oboznámení sa so súčasným stavom riešenia akcelerácie simulácie v k-Wave, navrhnutý spôsob, ktorým je možné transformovať kód určený pre procesor, do podoby spustiteľnej aj na grafickej karte. Výsledkom tejto práce je aplikácia schopná akcelerovať výpočet simulácie na grafickej karte. V prípade neprítomnosti grafickej karty, je schopná bežať na procesore, s využitím vláknového a SIMD paralelizmu. Táto implementácia je následne ohodnotená z hľadiska výkonnosti, náročnosti a užitočnosti.
Simulace šíření tepla v mozku pomocí knihovny OpenACC
Oškera, Josef ; Kadlubiak, Kristián (oponent) ; Jaroš, Jiří (vedoucí práce)
Cílem této práce je přepsat implementaci šíření tepla v mozkové tkáni naspanou v jazyce Matlab (dostupnou v balíku k-Wave) do jazyka C/C++, akcelerovat ji na GPU za pomoci knihovny OpenACC a CUDA, a následně tyto knihovny porovnat ve výkonnosti a náročnosti implementace. V řešení je popsáno jak programovat grafickou kartu, a jak tyto znalosti aplikovat. Vytvořený program je schopen simulovat šíření tepla na CPU i GPU.
Neblokující vstup/výstup pro projekt k-Wave
Kondula, Václav ; Vaverka, Filip (oponent) ; Jaroš, Jiří (vedoucí práce)
Práce se zabývá implementací neblokujícího vstupně výstupního rozhraní pro projekt k-Wave, jež je navržen pro simulaci šíření ultrazvuku. Hlavní zaměření je na simulace velkých domén, jež kvůli vysokým nárokům na výpočetní výkon musí být spuštěny na superpočítačích a produkují až desítky GB dat během jediného simulačního kroku. V rámci této diplomové práce jsem navrhl a implementoval neblokující rozhraní pro ukládání dat využitím dedikovaných vláken, čímž se umožní překrytí výpočtu simulace s diskovými operacemi za účelem zkrácení doby provádění simulace. V projektu k-Wave se díky tomuto přístupu podařilo dosáhnout zrychlení až 33%, což má za následek mimo jiné také snížení finanční zátěže běhu simulace.
Optimalizace spouštěcích konfigurací k-Wave úloh
Sasák, Tomáš ; Jaroš, Marta (oponent) ; Jaroš, Jiří (vedoucí práce)
Táto práca sa zaoberá plánovaním, resp. správnym odhadom spúšťacích konfigurácií úloh k-Wave na superpočítačoch infraštruktúry IT4Innovations. Presnejšie pre klastre Salomon a Anselm. Úloha predstavuje množinu simulácií, kde každá simulácia je spúšťaná pod toolboxom k-Wave. Pre spustenie jednotlivých simulácií je nutné správne vytvoriť konfiguráciu, ktorá sa skladá z množstva zdrojov (počet výpočtových uzlov, resp. jadier) a času rezervácie superpočítača, čo je pre neskúseného zložité odhadnúť. Zvolený problém odhadu je riešený na základe empirických dát, ktoré boli získané viacnásobným spúšťaním rôznych množín simulácií na klastroch. Tieto dáta sú uložené a spracované aproximátormi, ktoré konkrétne vykonávajú odhad týchto parametrov na základe metód interpolácie a regresie. V práci je popísaný a bol implementovaný systém predstavujúci plánovač, ktorý predstavuje rozhranie pre odhad. Experimentovaním bolo zistené že pre tento špecifický problém najpresnejšie odhady vykonáva trojica Akima spline, PCHIP interpolácia a kubický spline. Výsledky tejto práce umožňujú vykonávať istý odhad exekučného času a počtu vlákien pre ľubovolné simulácie automaticky a bez znalosti kódu k-Wave.
Paralelizace ultrazvukových simulací pomocí 2D dekompozice
Nikl, Vojtěch ; Dvořák, Václav (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato práce je součástí projektu k-Wave, což je simulační nástroj akustické tomografie sloužící k simulaci a rekonstrukci akustických vlnových polí a jeho hlavním přínosem je plánování ultrazvukových operací lidské tkáně, např. nádoru na mozku. Dopředné simulace jsou založeny na řešení k-prostorové pseudospektrální časové domény. Simulace jsou časově a výpočetně velice náročné. Simulace probíhají na 3D maticích, které reprezentují určité vlastnosti reálné tkáně, např. hustotu absorbce nebo rychlost šíření zvuku. K výpočtu gradientu se používá Rychlá Fourierova transformace (dále jen FFT), jejíž výpočet zabere zhruba 60% simulačního času. 3D FFT byla do této doby počítána pomocí softwarové knihovny FFTW, která interně využívá 1D dekompozici, tj. dekompozici podél jedné osy. Hlavní nevýhoda 1D dekompozice je relativně malý maximální počet výpočetních jader, přes které lze paralelizovat výpočet. Matice mají velikost řádově 1024x2048x3072, tím pádem lze efektivně paralelizovat přes maximálně 1024 jader. Dnešní superpočítače umožnují využít až stovky tisíc jader a tomu bychom se rádi přiblížili.  Řešením je využití 2D dekompozice, která by teoretický maximální počet jader posunula až do řádu milionů. Její efektivní implementací se zabývá právě tato práce. 2D dekompozice je obecně paralelizována pouze pomocí MPI procesů, např. v~knihovnách PFFT nebo P3DFFT, v této práci ale využíváme pokročilejší kombinace MPI procesů a OpenMP vláken, kterou jsme nazvali hybridní 2D dekompozice (HybridFFT). Má tři hlavní části: výpočet 1D FFTs, lokální transpozice dat a globální transpozice dat. Pro výpočet sérií 1D FFT je využita knihovna FFTW.Lokální transpozice jsou implementovány pomocí blokové transpozice 2D matice, která je vektorizována pomocí SSE/AVX instrukcí. Jak 1D FFT, tak lokální lokální transpozice, jsou akcelerovány pomocí OpenMP vláken. Globální transpozice je opět implementována prostřednictvím knihovny FFTW, která při použití pokročilého plánování dokáže výrazně snížit dobu potřebnou pro její realizaci. Hlavním cílem této práce je tedy dosáhnout maximálního možného zrychlení a škálovatelnosti oproti předchozímu řešení, zároveň ale i zachovat kompatibilitu a přenositelnost. Hybridní transformace pracuje nejlépe, pokud na jednom socketu spustíme jeden MPI proces a v rámci tohoto socketu využijeme tolik vláken, kolik máme k dispozici jader. Díky tomu nemusí jádra v rámci jednoho socketu komunikovat přes MPI zprávy, ale využívají rychlejší sdílenou paměť, a zároveň je MPI komunikace efektivnější, protože máme pouze jeden MPI proces na socket a tím pádem jsou MPI zprávy vetší a je jich méně, což vede k menšímu zahlcení propojovací sítě a lepší efektivitě komunikace. Řešení bylo testováno na superpočítačích Anselm (Ostrava), Zapat (Brno) a Supernova (Wroclaw). Pro nižší počty jader, v řádu několika set, je výkon přibližně stejný nebo o pár procent lepší, než původně použitá 1D dekompozice FFTW knihovny nebo knihony PFFT a P3DFFT. Jeden z velmi dobrých výsledků je např. 512^3 FFT na 512 jádrech, kde hybridní dekompozice dosáhla času 31 ms, zatímco FFTW 39 ms a PFFT 44ms. Na stroji Anselm jsme spustili výpočet až na 2048 jádrech a škálovatelnost byla stále lineární. Nejlepší nárust výkonu oproti ostatním knihovnám by se měl projevit při počtu zhruba 8-16 tisíc jader pro kostky velikosti 1024^3, protože v této konfiguraci bude mít jeden MPI proces na starosti jednu desku matice a zároveň budou MPI zprávy dostatečně velké a v takovém počtu, že by se měla projevit lepší efektivita komunikace oproti ostatním knihovnám.
Acceleration of Axisymetric Ultrasound Simulations
Kukliš, Filip ; Vaverka, Filip (oponent) ; Jaroš, Jiří (vedoucí práce)
The simulation of ultrasound propagation through soft biological tissue has a wide range of practical applications. These include the design of transducers for diagnostic and therapeutic ultrasound, the development of new signal processing and imaging techniques, studying the aberration of ultrasound beams in heterogeneous media, ultrasonic tissue classification, training ultrasonographers to use ultrasound equipment and interpret ultrasound images, model-based medical image registration, and treatment planning and dosimetry for high-intensity focused ultrasound. However, ultrasound simulation presents a computationally difficult problem, as simulation domains are very large compared with the acoustic wavelengths of interest. But if the problem is axisymmetric, the governing equations can also be solved in 2D. This allows running simulations with larger grid size, with less computational resources and in a shorter time. This paper model and implements an acceleration of the Full-wave Nonlinear Ultrasound Simulation in an Axisymmetric Coordinate System implemented in Matlab using Mex Files for FFTW DST and DCT transformations. The axisymmetric simulation was implemented in C++ as an extension to the open source K-WAVE toolbox. The codes were optimized to run using one node of Salomon supercomputer cluster (IT4Innovations, Ostrava, Czechia) with two twelve-core Intel Xeon E5-2680v3 processors. To maximize computational efficiency, several stages of code optimization were performed. First, the FFTs were computed using the real-to-complex FFT from the FFTW library. Compared to the complex-to-complex FFT, this reduced the compute time and memory associated with the FFT by nearly 50%. Also, real-to-real DCTs and DSTs were computed using FFTW library, which ones in Matlab version, had to be invoked from dynamically loaded MEX Files. Second, to save memory bandwidth, all operations were computed in single precision. Third, element-wise operations were parallelized using OpenMP and then optimized using streaming SIMD extensions (SSE). The overall computation of the C++ k-space model is up to 34-times faster and uses less than one-third of the memory than Matlab version. The simulation which would take nearly two days by Matlab implementation can be now computed in one and half hour. This all allows running the simulation on the computational grid with 16384 × 8192 grid points within a reasonable time.
Implementace 2D ultrazvukových simulací
Šimek, Dominik ; Vaverka, Filip (oponent) ; Jaroš, Jiří (vedoucí práce)
Práca sa zaoberá návrhom a implementáciou 2D simulácie ultrazvukových vĺn. Simulácia ultrazvuku nachádza svoje uplatnenie v medicíne, biofyzike či rekonštrukcii obrazu. Ako príklad môžme uviesť použitie fokusovaného ultrazvuku na diagnostiku a liečbu rakoviny. Program je súčasťou simulačného balíka k-Wave určeného pre superpočítačové systémy, konkrétne stroje s architektúrou zdieľaného adresového priestoru. Program je implementovaný v jazyku C++ s využitím akcelerácie pomocou OpenMP. Pomocou implementovaného riešenia je možné riešiť simulácie veľkých rozmerov v 2D priestore. Práca sa ďalej zaoberá zjednotením kódu 2D a 3D simulácie pomocou moderných prostriedkov C++. Reálnym príkladom využitia je simulácia ultrazvuku pri transkraniálnej neuromodulácii a neurostimulácii, ktorá prebieha v doménach o veľkosti 16384x16384 (a viac) bodov mriežky. Simulácia takýchto rozmerov môže pri použití pôvodnej MATLAB 2D k-Wave trvať niekoľko dní. Implementované riešenie dosahuje voči MATLAB 2D k-Wave 7 až 8 násobné zrýchlenie na superpočítačoch Anselm a Salomon.
Implementace ultrazvukových měničů a tkáňových reprezentací do toolboxu k-Wave
Hanzl, Martin ; Budiský, Jakub (oponent) ; Jaroš, Jiří (vedoucí práce)
Práce popisuje návrh rozšíření nástroje k-Wave určeného k modelování šíření ultrazvuku. Cílem rozšíření je minimalizace prosotorové a časové složitosti pomocí alternativního návrhu reprezentace tkání a měničů v simulaci. V práci jsou objasněny základní principy a vlastnosti k-Wave a následně navržena rozšíření a popsána jejich implementace.
Simulace šíření ultrazvuku v kostech
Kadlubiak, Kristián ; Vaverka, Filip (oponent) ; Jaroš, Jiří (vedoucí práce)
Odhaduje sa, že v roku 2012 sa objavilo celosvetovo neuveriteľných 14.1 milióna nových prípadov rakoviny. Toto číslo je alarmujúce. Napriek tomu, že zdravý životný štýl môže zredukovať riziko vzniku rakoviny, vždy existuje istá pravdepodobnosť, že sa rakovina objaví aj u úplne zdravého jedinca. Na úspech liečenia rakoviny majú vplyv najmä dva faktory.  Po prvé -  včasná diagnostika je absolútne nevyhnutná,  po druhé - musí existovať vhodná operačná metóda na odstránenie poškodeného tkaniva. V obidvoch prípadoch má ultrazvuk veľký potenciál ako neinvazívna metóda. Fotoakustická spektroskopia je zobrazovacia metóda so skvelými vlastnosťami, založená na princípe ultrazvuku, schopná detegovať tumor.  High-Intensity Focused Ultrasound (HIFU) je neinvazívny chirurgický postup. Tieto metódy by však neboli možné bez presnej simulácie šírenia ultrazvuku. Balíček k-Wave je open source toolbox pre MATLAB, ktorý implementuje tieto simulácie. Vyvstáva otázka,  prečo nie sú tieto metódy bežne používané v praxi? Dôvodom je fakt, že simulácia šírenia ultrazvuku je veľmi časovo náročná operácia, čo robi tieto metódy neefektívnymi. Avšak existujú spôsoby akcelerácie takýchto simulácií. Implementácia simulácie na GPU je veľmi perspektívny prístup k akcelerácií.     Hlavnou úlohou tejto diplomovej práce je akcelerácia simulácie šírenia ultrazvuku v kostiach a iných tvrdých tkanivách. Implementácia vyvinutá v rámci diplomovej práce bola testovná na rôznych superpočítačoch ako napríklad Anselm v Ostrave alebo Piz Daint v Lugane. Implementované riešenie dosahuje pozoruhodné zrýchlenie v porovnaní s originálnym prototypom v prostredí MATLAB. V najlepšom prípade bola implementácia schopná urýchliť simuláciu približne 160 násobne. To znamená, že simulácia, ktorá by za iných okolností trvala 6,5 dňa, je dnes dokončená za jednu hodinu. Toto zrýchlenie bolo dosiahnuté počas simulácie s rozmermi 416x416x416  bodov a za použitia karty NVIDIA Tesla P100. Diplomová práca obsahuje porovnanie výkonu na rôznych grafických kartách, aby čitateľovi umožnila komplexnejší náhľad na akceleračné schopnosti vyvinutej implementácie a tiež poskytuje bližší pohľad na pamäťovú náročnosť a numerickú presnosť aplikácie. Vďaka schopnosti aplikácie naplno využiť potenciál grafických kariet, majú lekári a vyskumníci z celého sveta  v rukách mocný nástroj.

Národní úložiště šedé literatury : Nalezeno 37 záznamů.   začátekpředchozí21 - 30další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.