Národní úložiště šedé literatury Nalezeno 31 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Efektivní implementace výpočetně náročných algoritmů na Intel Xeon Phi
Šimek, Dominik ; Hrbáček, Radek (oponent) ; Jaroš, Jiří (vedoucí práce)
Táto práca sa zaoberá implementáciou a optimalizáciou výpočtovo náročných algoritmov na koprocesore Intel Xeon Phi. Koprocesor Xeon Phi bol predstavený firmou Intel v roku 2012 ako odpoveď na obrovský nárast v používaní technológie GPGPU. Xeon Phi disponuje podstatne väčším výkonom ako procesor, preto je podobne ako GPGPU vhodnou platformou pre beh výpočtovo náročných programov. Xeon Phi zatiaľ v praxi nie je velmi používaný, preto je potrebné hľadať možné oblasti uplatnenia. Rozrastá sa ale jeho použitie v superpočítačových centrách, napríklad Milky Way 2 - Guangzhou (Čina), Salomon - Ostrava. Cieľom tohto dokumentu je oboznámiť čitateľa s problematikou implementácie náročných algoritmov na akceleračnej karte Xeon Phi, ich optimalizácie a meranie výkonu. Výkon koprocesoru Intel Xeon Phi bude porovnávaný s výkonom procesorov Intel Xeon.  V teoretickej časti práce bude čitateľ oboznámený s architektúrou a princípmi koprocesoru Xeon Phi. Budeme sa venovať výhodám ale aj nevýhodám tohto koprocesoru, ktoré budú často porovnávané s všeobecnými vlastnosťami procesorov. Témou bude taktiež otázka, kedy je vhodné zvoliť pre výpočet akcelerečnú kartu Xeon Phi a kedy procesor. Detailne si vysvetlíme a znázorníme výber vhodných algoritmov pre Xeon Phi, postup ich implementácie, optimalizácie a meranie výkonu. Okrem toho budú rozoberané problémy a úskalia, ktoré môžu nastať pri implementácii algoritmov a používaní koprocesoru. Dané demonštrujeme najskôr na ukážkových problémoch, ktoré boli riešené na Ostravskom superpočítači Anselm. V prvom rade to budú jednoduché benchamrky typu násobenie matíc, násobenie matice a vektora, na ktorých budú ukázané základné princípy implementácie optimálnych algoritmov pre koprocesor Xeon Phi. Napríklad pri benchmarku násobenia matice a vektora bolo dosiahnutých asi 6.5% teoretického výkonu koprocesoru. Ďalším, komplexnejším problémom bude N-Body Simulation - simulácia pohybu častíc v priestore, na ktorom sme otestovali potenciál Xeon Phi. Výkon koprocesoru sa pri tomto benchmarku vyšplhal až na viac ako 35% teoretického výkonu - 725 gFLOPS (maximálny výkon 2000 gFLOPS pre dáta s jednoduchou presnosťou). Čitateľ sa okrem iného môže dozvedieť aj zaujímavé informácie z oblasti fyzikálnych simulácií, konkrétne bude reč o module pre MATLAB (k-Wave). K-Wave sa zaoberá simuláciou šírenia akustických vĺn v 1D, 2D a 3D, čo sa využíva napríklad pri simulácii šírenia ultrazvukových vĺn v mäkkých tkanivách. Na koniec si stručne povieme o portovaní už existujúcich knižníc, modulov či programov na Xeon Phi zo snahou využitia jeho potenciálu. Bude to napríklad kroskompilácia knižníc HDF5, ZLIB či konca interpretu jazyka Python s modulmi Numpy a Scipy.
Efektivní komunikace v multi-GPU systémech
Špeťko, Matej ; Jaroš, Jiří (oponent) ; Vaverka, Filip (vedoucí práce)
Po predstavení CUDA technológie od Nvidie možu byť na grafických kartách počítané všeobecné výpočty. Grafické karty sú v podstate paralelné procesory s vysokým výpočtovým výkonom. Moderné superpočítače bývajú vybavené grafickými kartami ako akcelerátormi. Pri niektorých aplikáciach však výkon alebo pamäť jednej grafickej karty nestačí. Výpočet musí byť rozdelený medzi niekoľko grafických kariet. Počas výpočtu je potrebné vymieňať medzi grafickými kartami čiastkové výsledky. Táto komunikácia značne brzdí výpočet. Preto je potrebné skúmať metódy efektívnej komunikácie medzi grafickými kartami - metódy ktoré menej zapájajú CPU, znižujú odozvu a zdieľajú systémové zásobníky. V tejto práci je skúmaná komunikácia grafických kariet v rámci jedného uzla aj v rámci celého superpočítača. Hlavný dôraz je na technológie GPUDirect od Nvidie a CUDA-Aware MPI. Následne je predstavený k-Wave toolbox, aplikácia pre simuláciu šírenia akustických vĺn. Táto aplikácia je akcelerovaná pomocou CUDA-Aware MPI.
Distribuované zpracování zachycené síťové komunikace
Hvězda, Matěj ; Lichtner, Ondrej (oponent) ; Pluskal, Jan (vedoucí práce)
Pro správce sítí je běžná věc zpracovávat a analyzovat síťové přenosy. Soubory, které obsahují tyto síťové toky, nejsou tak velké pro malé sítě. Ale v případě velkých topologiích, kde soubory rostou až do desítek GB, je zpracování komunikace velice náročné. Naštěstí existují distribuované systémy a výpočty na nich. Představuji paralelní aplikaci, která je škálovatelná a rozšířitelná. Její účel je rozdistribuovat rámce ze souborů na systém, kde proběhne proces zpracování. Aplikace je pro uživatele transparentní a je vyvíjena pro platformu Windows, která poskytuje technologie pro vytváření paralelních systémů a komunikaci potřebnou ke spolupráci. Aplikace podporuje různé formáty souborů. A~využívá databázi k uložení dat a statistik komunikace, aby klientská aplikace uspořila paměť a byla použitelná pro méně výkonné počítače.
Akcelerace ultrazvukové neurostimulace pomocí multi-GPU systémů
Bayer, David ; Kadlubiak, Kristián (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato diplomová práce se věnuje rozšíření akcelerované implementace simulace šíření akustických vln v médiu balíku k-Wave o možnost využití více GPU pro výpočet. Nejprve popisuje multi-GPU systémy a nástroje, pomocí kterých je s nimi možné pracovat. Pokračuje popisem balíku k-Wave a analýzou existujících akcelerovaných implementací. Dále testuje vybrané technologie na simulaci šíření tepla v médiu a na základě zjištěných výsledků vybírá nástroje pro návrh výsledné implementace. Nakonec shrnuje dosažené výsledky.
Graphics Editor for Computational Workflows in TOSCA Format
Swiatkowski, Jan ; Jaroš, Marta (oponent) ; Jaroš, Jiří (vedoucí práce)
This thesis presents the design and implementation of a graphical workflow editor aimed at non-computer scientists, which enables the creation of complex computational workflows with minimal technical knowledge. The editor provides a graphical interface for composing workflow from computational tasks with supports a variety of input and output types, including value-based and dataset-based inputs and outputs. The resulting workflows can be exported to the TOSCA workflow specification, making them compatible with the LEXIS platform. The editor was developed in .NET Blazor Server framework in C# and JavaScript and employs the JointJS library for creating the graphical representation of workflows. The resulting tool provides an accessible means for researchers and other non-technical users to compose and execute advanced computational workflows.
Vysokohodnotné cementové kompozity se zvýšenou odolností proti abrazi
Baranov, Dmitry ; Šuleková, Nikola (oponent) ; Novotný, Radoslav (vedoucí práce)
Bakalářská práce se zabývá vlivem přídavku roztoků hydroxidu draselného o různé koncentrace do HPC kompozitů. Studium byl zaměřen hlavně na parametry důležité pro abrazi kompozitu jako je tvrdost povrchu, která byla změřena dvěma způsoby. První je pomocí ručního tvrdoměru, druhý je vrypovou metodou prostřednictvím vrtáku s wolfram karbidovou korunkou. Nejlepší výsledky měly vzorky s nejvyšší koncentrací hydroxidu draselného. Byl navržen předpoklad, že příčinou může být velmi tenka (400 1000 nm) kompaktní vrstvička na povrchu s majoritním obsahem sloučenin síry a draslíku, což se ukázalo na elektronovém mikroskopu. Kromě tvrdosti povrchu byly sledovány další mechanické vlastnosti důležité pro cementy. Vzorky s odlišnou koncentrací KOH byly vyzkoušeny na pevnost v tlaku a na pevnost v tahu ohybem.
Akcelerace ultrazvukové neurostimulace pomocí aritmetiky se sníženou přesností.
Duchoň, Radek ; Olšák, Ondřej (oponent) ; Jaroš, Jiří (vedoucí práce)
K-Wave je nástroj pro akustickou a ultrazvukovou simulaci s otevřeným zdrojovým kódem. Aktuální dostupné implementace jsou napsány v jazycích C++ a Matlab. Cílem této diplomové práce je akcelerovat existující implementaci ultrazvukové simulace pomocí výpočtů s nižší přesností na grafických kartách Nvidia za využití softwarové platformy CUDA. Dalším přínosem této práce by měla být snížená paměťová náročnost, což umožní provádění větších simulací. Snížená přesnost však nesmí vzhledem k využití například pro neurostimulaci mozku příliš narušit výsledky jako celek. Důležité je proto identifikovat vhodné veličiny, které lze uložit v nižší přesnosti. V této práci budou analyzovány možné přístupy a jejich efektivita při využití nižší přesnosti. Dále pak bude proveden návrh řešení, jehož částí bude identifikace potenciálních veličin pro redukci. Na to bude navazovat specifikace docílené implementace a její testování. Závěr se bude věnovat zhodnocení řešení na základě dosažených výsledků z testování.
Neblokující vstup/výstup pro projekt k-Wave
Kondula, Václav ; Vaverka, Filip (oponent) ; Jaroš, Jiří (vedoucí práce)
Práce se zabývá implementací neblokujícího vstupně výstupního rozhraní pro projekt k-Wave, jež je navržen pro simulaci šíření ultrazvuku. Hlavní zaměření je na simulace velkých domén, jež kvůli vysokým nárokům na výpočetní výkon musí být spuštěny na superpočítačích a produkují až desítky GB dat během jediného simulačního kroku. V rámci této diplomové práce jsem navrhl a implementoval neblokující rozhraní pro ukládání dat využitím dedikovaných vláken, čímž se umožní překrytí výpočtu simulace s diskovými operacemi za účelem zkrácení doby provádění simulace. V projektu k-Wave se díky tomuto přístupu podařilo dosáhnout zrychlení až 33%, což má za následek mimo jiné také snížení finanční zátěže běhu simulace.
Optimalizace spouštěcích konfigurací k-Wave úloh
Sasák, Tomáš ; Jaroš, Marta (oponent) ; Jaroš, Jiří (vedoucí práce)
Táto práca sa zaoberá plánovaním, resp. správnym odhadom spúšťacích konfigurácií úloh k-Wave na superpočítačoch infraštruktúry IT4Innovations. Presnejšie pre klastre Salomon a Anselm. Úloha predstavuje množinu simulácií, kde každá simulácia je spúšťaná pod toolboxom k-Wave. Pre spustenie jednotlivých simulácií je nutné správne vytvoriť konfiguráciu, ktorá sa skladá z množstva zdrojov (počet výpočtových uzlov, resp. jadier) a času rezervácie superpočítača, čo je pre neskúseného zložité odhadnúť. Zvolený problém odhadu je riešený na základe empirických dát, ktoré boli získané viacnásobným spúšťaním rôznych množín simulácií na klastroch. Tieto dáta sú uložené a spracované aproximátormi, ktoré konkrétne vykonávajú odhad týchto parametrov na základe metód interpolácie a regresie. V práci je popísaný a bol implementovaný systém predstavujúci plánovač, ktorý predstavuje rozhranie pre odhad. Experimentovaním bolo zistené že pre tento špecifický problém najpresnejšie odhady vykonáva trojica Akima spline, PCHIP interpolácia a kubický spline. Výsledky tejto práce umožňujú vykonávať istý odhad exekučného času a počtu vlákien pre ľubovolné simulácie automaticky a bez znalosti kódu k-Wave.
Analysis of Operational Data and Detection od Anomalies during Supercomputer Job Execution
Stehlík, Petr ; Nikl, Vojtěch (oponent) ; Jaroš, Jiří (vedoucí práce)
Using the full potential of an HPC system can be difficult when such systems reach the exascale size. This problem is increased by the lack of monitoring tools tailored specifically for users of these systems. This thesis discusses the analysis and visualization of operational data gathered by Examon framework of a high-performance computing system. By applying various data mining techniques on the data, deep knowledge of data can be acquired. To fully utilize the acquired knowledge a tool with a soft-computing approach called Examon Web was made. This tool is able to detect anomalies and unwanted behaviour of submitted jobs on a monitored HPC system and inform the users about such behaviour via a simple to use web-based interface. It also makes available the operational data of the system in a visual, easy to use, manner using different views on the available data. Examon Web is an extension layer above the Examon framework which provides various fine-grain operational data of an HPC system. The resulting soft-computing tool is capable of classifying a job with 84 % success rate and currently, no similar tools are being developed. The Examon Web is developed using Angular for front-end and Python, accompanied by various libraries, for the back-end with the usage of IoT technologies for live data retrieval.

Národní úložiště šedé literatury : Nalezeno 31 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.