Národní úložiště šedé literatury Nalezeno 64 záznamů.  začátekpředchozí43 - 52dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Paralelizace ultrazvukových simulací pomocí akcelerátoru Intel Xeon Phi
Vrbenský, Andrej ; Hrbáček, Radek (oponent) ; Jaroš, Jiří (vedoucí práce)
Simulácia šírenia ultrazvukových akustických vĺn má v dnešnej dobe široké praktické použitie. Jedným z nich je simulácia v reálnom tkanivovom prostredí, ktorá má dobré uplatnenie v medicíne. Jednou z aplikácií, ktoré sú na túto simuláciu určené, je k-Wave toolbox. Výpočtová náročnosť takýchto simulácii je veľmi veľká a preto sa vyvíjajú nové metódy pre jej zrýchlenie. V tejto diplomovej práci sme navrhli riešenie pre urýchlenie simulácie, založené na paralelizácii výpočtu na akceleračnej karte Intel Xeon Phi. Akcelerátor obsahuje vysoký počet jadier a extra-širokú vektorovú jednotku, a je preto ideálny na paralelizáciu a vektorizáciu. Implementácia využíva OpenMP verzie 4.0, ktorá prináša niektoré nové možnosti ako napríklad explicitnú vektorizáciu. Dosiahnuté výsledky boli namerané počas rozsiahlych experimentov.
Taktování moderních procesorů s ohledem na výkon, spotřebu a teplotu
Kelečéni, Jakub ; Vaverka, Filip (oponent) ; Nikl, Vojtěch (vedoucí práce)
Táto práca rieši problematiku závislosti - celkovej doby výpočtu, spotreby energie a teploty - na pracovnej frekvencií serverového procesora. V teoretickej časti je popísaná architektúra použitého procesora, sada benchmarkov a druhy algoritmov. Praktická časť je zameraná na testovanie navrhnutej sady benchmarkov (násobenie matíc, quicksort, výpočet PI, Ackermannova funkcia, LAMMPS, PMBW, Linpack). Sada benchmarkov pozostáva z jednovláknových a paralelných algoritmov. Testovanie prebiehalo pri nastavení troch rôznych frekvencií CPU a pri spustení paralelných benchmarkov na rôznom počte výpočtových vlákien. Pri každom teste boli zaznamenávaná údaje o spotrebe CPU a RAM. V práci je zohľadnený vplyv paralelizácie na spotrebu energie a na čas výpočtu. Získané údaje sú zhrnuté do tabuliek a grafov. Výsledkom práce je zhodnotenie vhodnosti konfigurácie CPU s ohľadom na čas výpočtu a spotrebu energie, pre jednotlivé benchmarky. Zo získaných výsledkov vyplýva, že vhodnosť použitej frekvencie CPU je závislá od charakteru výpočtového problému, a tiež od požiadavky pre dosiahnutie najlepšieho času, alebo spotreby.
Efektivní implementace vysoce náročných algoritmů na vícejádrových procesorech
Tomečko, Lukáš ; Bidlo, Michal (oponent) ; Jaroš, Jiří (vedoucí práce)
Cieľom tejto práce je paralelizovať a vektorizovať simuláciu toku kvapalín. Dosiahne sa to pomocou knižnice OpenMP a prekladaču od Intelu. Implementované boli rôzne prístupy k problému, ako napr. cache blocking, zoraďovanie dát počas behu a dočasné reorganizovanie dát v pamäti. Skombinovaním najrýchlejších riešení sa podarilo simuláciu celkovo zrýchliť 11,4krát na 16 jadrách, pričom testy prebiehali na ostravskom superpočítači Anselm. Výsledky ukazujú, že výsledná aplikácia dobre škáluje s pribúdajúcim počtom jadier. Ďalej, vektorizovanie daného problému bolo možné len čiastočne z dôvodu nevhodného spôsobu práce s dátami.
Návrh binárních amplitudových hologramů pro optické generování ultrazvuku akcelerovaný pomocí GPU
Knotek, Martin ; Vaverka, Filip (oponent) ; Jaroš, Jiří (vedoucí práce)
V této práci se zabýváme možnostmi urychlení vědeckých výpočtů s použitím grafických výpočetních jednotek. Termínem vědecký výpočet v tomto kontextu rozumíme specifický algoritmus, který počítá povrch binárních hologramů, jež se používají při generování ultrazvuku. Zaměříme se na návrh hologramu, zvláště pak na rychlost, se kterou můžeme vypočítat povrch takového hologramu. Za tímto účelem použijeme dvě populární platformy pro paralelní zpracování dat - CUDA a OpenMP. Výsledný povrch hologramu je důležitý, protože ovlivňuje specifické fyzikální vlastnosti hologramu.
Interaktivní simulace chování tkaniny akcelerovaná pomocí GPU
Melichar, Vojtěch ; Klepárník, Petr (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato práce se zabývá interaktivní simulací chování tkanin s využitím GPU pro obecné výpočty. V první části jsou rozebrány všechny technologie, které jsou následně využity při implementaci programu. Druhá část poté diskutuje různé způsoby řešení simulací. Především se věnuje částicovým systémům, které patří k nejpoužívanějším metodám. Následně je navržen program, který je v rámci této práce také implementován. Implementace proběhla ve čtyřech různých variantách. První variantou je čistě CPU implementace, druhou variantou je optimalizace CPU implementace pomocí technologie OpenMP. Z těchto implementací vychází CUDA implemntace. Poslední zde implementovanou variantou byla optimalizovaná CUDA implementace. Na závěr práce jsou všechny implementace vyhodnoceny z pohledu jejich výpočetní složitosti a vhodnosti pro použití v grafice počítané v reálném čase.
Vysoce náročné aplikace na svazku karet Intel Xeon Phi
Kačurik, Tomáš ; Hrbáček, Radek (oponent) ; Jaroš, Jiří (vedoucí práce)
Táto práca sa zaoberá implementáciou a optimalizáciou vysoko náročných aplikácií na zväzku Intel Xeon Phi koprocesorov. Na dvoch prístupoch k riešeniu N-Body problému boli demonštrované možnosti behu programov na zväzku procesorov, koprocesorov a s využitím oboch typov zariadení. Zvolené boli dva verzie N-Body problému -  naivná a Barnes-hut. Oba problémy boli implementované a optimalizované. Práca tiež zachytáva proces optimalizácie a zmeny vo výkone po aplikovaní jednotlivých optimalizácií. Pre lepšie porovnanie dosiahnutých výkonov sme porovnávali programy na základe dosiahnutého zrýchlenia voči behu programu na jednom výpočtovom uzle pri využití len procesorov. V prípade naivnej verzie bolo dosiahnuté 15 násobné zrýchlenie pri využití procesorov a koprocesorov na 8 výpočtových uzloch. Výkon dosiahnutý v tomto prípade predstavoval 9 TFLOP/s. Na základe dosiahnutých výsledkov sme v závere zhodnotili výhody a nevýhody pri behu programov v distribuovanom prostredí na procesoroch, koprocesoroch alebo s využitím oboch typov zariadení.
Akcelerace algoritmů Lattice-Boltzmann pro modelování toku krve v mozku
Kompová, Radmila ; Kešner, Filip (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato práce se zabývá implementací a možnými optimalizacemi metody lattice-Boltzmann. Tato metoda umožňuje modelovat tok kapalin pomocí simulace pohybu fiktivních částic. Práce se zaměřuje na možná vylepšení existujícícho nástroje HemeLB, který se specializuje na simulaci proudění krve v mozku. V práci jsou mimo jiné zkoumány techniky vektorizace a paralelizace jejichž implementace by mohla pro tento nástroj být přínosná. Součástí práce je implementace aplikace srovnávající několik vybraných algoritmů pro metodu lattice-Boltzmann včetně jejich možných optimalizací. Zahrnuty jsou rovněž testy zaměřené na srovnání těchto algoritmů dle dosaženého výkonu, využití paměti cache a celkové spotřeby paměti. Nejlepší dosažený výkon byl 150 milionů aktualizovaných bodů mřížky za sekundu.
Simulace šíření tepla s časově proměnným zdrojem s využitím GPU
Hála, Pavel ; Záň, Drahoslav (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato bakalářská práce se zabývá simulací šíření tepla v živých tkáních, které je dodáváno časově proměnným externím tepelným zdrojem. Simulace byla implementována pomocí metody konečných diferencí čtvrtého řádu v prostoru a prvního v čase. V rámci práce byla nejprve implementována vícevláknová verze využívající procesoru CPU. Následně bylo implementováno několik verzí pro grafickou kartu GPU s důrazem na maximální adaptaci algoritmu na danou architekturu a co nejlepší využít výpočetního potenciálu grafické karty. Experimentálním měřením se ukázalo, že nejrychlejší je naivní algoritmus využívající pouze globální paměť grafické karty. Dále byla zkoumána efektivita Gauss-Seidelovy obarvovací metody, jejíž cílem je redukce paměťové náročnosti. Na CPU se tato metoda ukázala použitelná, neboť její nejrychlejší verze byla pouze o 13% pomalejší, ale při použití této metody je možné snížit paměťovou náročnost až na polovinu. Implementace této metody na GPU byla 2x pomalejší a její přínos proto není tak velký. Na CPU bylo dosaženo maximálního výkonu 32GFLOPS zatímco na GPU 135GFLOPS. To odpovídá 10% (CPU) a 9% (GPU) maximálního teoretického výkonu obou architektur.
Paralelizace v jazyce Rust
Šlampa, Ondřej ; Bařina, David (oponent) ; Kobrtek, Jozef (vedoucí práce)
Tato práce se zabývá paralelizací v jazyce Rust. Cílem této práce je zhodnotit výkon a použitelnost jazyka Rust pro tvorbu paralelních aplikací ve srovnání s již používanou alternativou - OpenMP. Toto porovnání bylo provedeno na výpočtu n-rozměrné konvoluce. V závěru se nachází zhodnocení výsledků a návrhy pro jejich další využití.
Optické pole a syntéza hologramů
Šulgan, Marián ; Seeman, Michal (oponent) ; Zemčík, Pavel (vedoucí práce)
Cílem této práce je implementovat syntézu optického pole vybranou metodou v různých podobách, porovnat je a výsledek potvrdit rekonstrukcí hologramu vyrobeného na základě vypočteného optického pole. Z důvodu náročnosti je výpočet urychlený pomoci později popsané optimalizace algoritmu, pomoci paralelizace a využitím technologie C++ AMP, díky které je možné zužitkovat výpočetní sílu GPU. Práce na začátku vysvětluje známé fyzikální principy holografie, následuje návrh řešení stanovených problémů. Závěrečná část popisuje konkrétní řešení v podobě konsolové aplikace naprogramované v C++, způsob testování, získané výsledky a jejich zhodnocení. Konec práce tvoří finální shrnutí a uvažování nad možným pokračováním a zlepšením do budoucna.

Národní úložiště šedé literatury : Nalezeno 64 záznamů.   začátekpředchozí43 - 52dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.