National Repository of Grey Literature 31 records found  previous11 - 20nextend  jump to record: Search took 0.01 seconds. 
Efficient Implementation of High Performance Algorithms on Intel Xeon Phi
Šimek, Dominik ; Hrbáček, Radek (referee) ; Jaroš, Jiří (advisor)
This thesis is dedicated to the implementation of high performance algorithms on the Intel Xeon Phi coprocessor. The Xeon phi was introduced by Intel as a new MIC (Many Integrated Core) architecture in 2012. The theoretical part of the thesis is focused on the architecture of the coprocessor (with peak performance of 2 tFLOPS for a single precision data) and on the procedure of algorithms implementation and optimization. The theoretical knowledge is then applied to a practical examples with demonstration of the implementation and  the optimization of algorithms and work with the coprocessor. In the practical part of the thesis, simple benchmarks such as a vector matrix multiplication and a matrix multiplication are explained and implemented. In the first benchmark 6.5% of theoretical coprocessor performance was achieved, in the second it was much more. In following chapter a more complex benchmark - simulation of a particles system (N-Body), that reached more than 35% of coprocessor performance (725 gFLOPS), is discussed. The following section is dedicated to some interesting problems such as optimization of a MATLAB module k-Wave (propagation  of the ultrasound waves), extraction of I-vector (speech processing), cross-compilation of existing libraries, modules and programs. In the conclusion of the thesis the usage the potential of the Intel Xeon Phi is evaluated.
Efficient Communication in Multi-GPU Systems
Špeťko, Matej ; Jaroš, Jiří (referee) ; Vaverka, Filip (advisor)
After the introduction of CUDA by Nvidia, the GPUs became devices capable of accelerating any general purpose computation. GPUs are designed as parallel processors which posses huge computation power. Modern supercomputers are often equipped with GPU accelerators. Sometimes the performance or the memory capacity of a single GPU is not enough for a scientific application. The application needs to be scaled into multiple GPUs. During the computation there is need for the GPUs to exchange partial results. This communication represents computation overhead. For this reason it is important to research the methods of the effective communication between GPUs. This means less CPU involvement, lower latency, shared system buffers. Inter-node and intra-node communication is examined. The main focus is on GPUDirect technologies from Nvidia and CUDA-Aware MPI. Subsequently k-Wave toolbox for simulating the propagation of acoustic waves is introduced. This application is accelerated by using CUDA-Aware MPI.
Captured Communication Processing on Distributed System
Hvězda, Matěj ; Lichtner, Ondrej (referee) ; Pluskal, Jan (advisor)
When you need to assess or troubleshoot network by analysing capture file, you want it done as fast as possible and you do not always have a high-performance computer. Here comes the distributed system, which allows you to use his high computing power and lot of available memory. I introduce distributed application, which is scalable, extensible and capable of processing captured network communication and is developed for Windows platform. That provides technology, like Microsoft HPC Pack and Windows Communication foundation. The application supports multiple capture formats. In parallel system (cluster), exists database in order to save statistics and data of captured communication in order to save user's computer memory so client's application can be used for low-performance computers or make data available to a client after distributed processing.
Acceleration of Ultrasound Neurostimulation Using Multi-GPU Systems
Bayer, David ; Kadlubiak, Kristián (referee) ; Jaroš, Jiří (advisor)
This theses is focused on extending the accelerated implementation of propagating acoustic waves in a medium simulation of k-Wave toolbox by the possibility of using multiple GPUs for the computation. It first describes multi-GPU systems in general and the tools that can be used to work with them. It continues with a description of the k-Wave toolbox and an analysis of existing accelerated implementations. Selected technologies are then tested on a heat diffusion in a medium simulation and the results are used to select tools for the design a resulting implementation. Finally, it summarizes the results obtained.
Graphics Editor for Computational Workflows in TOSCA Format
Swiatkowski, Jan ; Jaroš, Marta (referee) ; Jaroš, Jiří (advisor)
Tato práce se zabývá návrhem a implementací grafického editoru pracovních toků zaměřeného na vědce, kteří nejsou z oboru informačních technologií, a editor jim umožňuje vytváření složitých výpočetních toků s minimální technickou znalostí. Editor poskytuje grafické rozhraní pro sestavení toků z výpočetních úloh s podporou různých typů vstupů a výstupů, včetně hodnotových a datových vstupů a výstupů. Výsledné toky lze exportovat do specifikace TOSCA popisující pracovní tok, což umožňuje jejich použití na platformě LEXIS. Editor byl vyvinut v rámci .NET Blazor Server frameworku v jazyce C\# a JavaScript a využívá knihovnu JointJS pro vytváření grafické reprezentace toků. Výsledný nástroj poskytuje dostupný způsob, jak vytvářet a spouštět pokročilé výpočetní toky pro výzkumníky a další uživatele.
High performace cement composites with increased abrasion resistance
Baranov, Dmitry ; Šuleková, Nikola (referee) ; Novotný, Radoslav (advisor)
The bachelor thesis deals with the effect of addition of potassium hydroxide solutions of different concentrations to HPC composites. The study focused mainly on parameters important for the abrasion of the composite such as surface hardness, which was measured in two ways. The first is by using of a manual hardness tester, the second is by a notching method through a drill with a tungsten carbide crown. The samples with the highest concentration of potassium hydroxide had the best results. It was assumed that the cause could be a very thin (400 1000 nm) dense layer on the surface with a predominant content of sulfur and potassium compounds, which was shown on an electron microscope. In addition to the hardness of the surface, other mechanical properties important for cements were monitored. Samples with different KOH concentration were tested for compressive and flexural strength.
Acceleration of Ultrasound Neurostimulation Using Mixed-Precision Arithmetic
Duchoň, Radek ; Olšák, Ondřej (referee) ; Jaroš, Jiří (advisor)
K-Wave is an open source tool for acoustic and ultrasound simulation. Current available implementations are written in C++ and Matlab. The aim of this thesis is to accelerate the existing implementation of ultrasound simulation by means of lower precision calculations on Nvidia graphics cards using the CUDA software platform. Another benefit of this work should be a reduced memory requirement, which will enable larger simulations to be performed. However, due to the use, for example, for neurostimulation of the brain, the reduced accuracy must not disturb the results as a whole too much. It is therefore important to identify suitable quantities that can be stored in lower precision. In this work, possible approaches and their effectiveness in utilizing lower precision will be analyzed. Furthermore, a solution proposal will be made, which will include identifying potential variables for reduction. This will be followed by specifying the achieved implementation and its testing. The conclusion will focus on evaluating the solution based on the results obtained from the testing.
Non-Blocking Input/Output for the k-Wave Toolbox
Kondula, Václav ; Vaverka, Filip (referee) ; Jaroš, Jiří (advisor)
This thesis deals with an implementation of non-blocking I/O interface for the k-Wave project, which is designed for time-domain simulation of ultrasound propagation. Main focus is on large domain simulations that, due to high computing power requirements, must run on supercomputers and produce tens of GB of data in a single simulation step. In this thesis, I have designed and implemented a non-blocking interface for storing data using dedicated threads, which allows to overlap simulation calculations with disk operations in order to speed up the simulation. An acceleration of up to 33% was achieved compared to the current implementation of project k-Wave, which resulted, among other things, also to reduce cost of the simulation.
Optimization of Run Configurations of k-Wave Jobs
Sasák, Tomáš ; Jaroš, Marta (referee) ; Jaroš, Jiří (advisor)
This thesis focuses on scheduling, i.e. correct approximation of configurations used to run k-Wave simulations on supercomputers from the IT4Innovations infrastructure. Especially, for clusters Salomon and Anselm. A single work is composed of a set which contains many simulations. Every simulation is executed by some code from the k-Wave toolbox. To calculate the simulation, it is necesarry to select a suitable configuration, which means the amount of supercomputer resources (number of nodes, i.e. cores), and the duration of the rental. Creation of an ideal configuration is complicated and is even harder for an inexperienced user. The approximation is made based on the empiric data, obtained from multiple executions of different sets of simulations on given clusters. This data is stored and used by a set of approximators, which performs the actual approximation by methods of interpolation and regression. The text describes the implementation of the final scheduler. By experimenting, the most efficient methods for this problem has found out to be Akima spline, PCHIP interpolation and cubic spline. The main contribution of this work is creation of a tool which can find suitable configuration for k-Wave simulation without knowing the code or having lots of experience with its usage.
Analysis of Operational Data and Detection od Anomalies during Supercomputer Job Execution
Stehlík, Petr ; Nikl, Vojtěch (referee) ; Jaroš, Jiří (advisor)
V posledních letech jsou superpočítače stále větší a složitější, s čímž souvisí problém využití plného potenciálu systému. Tento problém se umocňuje díky nedostatku nástrojů pro monitorování, které jsou specificky přizpůsobeny uživatelům těchto systémů. Cílem práce je vytvořit nástroj, nazvaný Examon Web, pro analýzu a vizualizaci provozních dat superpočítače a provést nad těmito daty hloubkovou analýzu pomocí neurálních sítí. Ty určí, zda daná úloha běžela korektně, či vykazovala známky podezřelého a nežádoucího chování jako je nezarovnaný přístup do operační paměti nebo např. nízké využití alokovaých zdrojů. O těchto  faktech je uživatel informován pomocí GUI. Examon Web je postavený na frameworku Examon, který sbírá a procesuje metrická data ze superpočítače a následně je ukládá do databáze KairosDB. Implementace zahrnuje disciplíny od návrhu a implementace GUI, přes datovou analýzu, těžení dat a neurální sítě až po implementaci rozhraní na serverové straně. Examon Web je zaměřen zejména na uživatele, ale může být také využíván administrátory. GUI je vytvořeno ve frameworku Angular s knihovnami Dygraphs a Bootstrap. Uživatel díky tomu může analyzovat časové řady různých metrik své úlohy a stejně jako administrátor se může informovat o současném stavu superpočítače. Tento stav je zobrazen jako několik globálně agregovaných metrik v posledních 30 minutách nebo jako 3D model (či 2D model) superpočítače, který získává data ze samotných uzlů pomocí protokolu MQTT. Pro kontinuální získávání dat bylo využito rozhraní WebSocket s vlastním mechanismem přihlašování a odhlašování konkretních metrik zobrazovaných v modelu. Při analýze spuštěné úlohy má uživatel dostupné tři různé pohledy na danou úlohu. První nabízí celkový přehled o úloze a informuje o využitých zdrojích, času běhu a vytížení části superpočítače, kterou úloha využila společně s informací z neurálních sítí o podezřelosti úlohy. Další dva pohledy zobrazují metriky z výkonnostiního energetického hlediska. Pro naučení neurálních sítí bylo potřeba vytvořit novou datovou sadu ze superpočítače Galileo. Tato sada obsahuje přes 1100 úloh monitorovaných na tomto superpočítači z čehož 500 úloh bylo ručně anotováno a následně použito pro trénování sítí. Neurální sítě využívají model back-propagation, vhodný pro anotování časových sérií fixní délky. Celkem bylo vytvořeno 12 sítí pro metriky zahrnující vytížení procesoru, paměti a dalších části a např. také podíl celkového času procesoru v úsporném režimu C6. Tyto sítě jsou na sobě nezávislé a po experimentech jejich finální konfigurace 80-20-4-3-1 (80 vstupních až 1 výstupní neuron) podávaly nejlepší výsledky. Poslední síť (v konfiguraci 12-4-3-1) anotovala výsledky předešlých sítí. Celková úspěšnost  systému klasifikace do 2 tříd je 84 %, což je na použitý model velmi dobré. Výstupem této práce jsou dva produkty. Prvním je uživatelské rozhraní a jeho serverová část Examon Web, která jakožto rozšiřující vrstva systému Examon pomůže s rozšířením daného systému mezi další uživatele či přímo další superpočítačová centra. Druhým výstupem je částečně anotovaná datová sada, která může pomoci dalším lidem v jejich výzkumu a je výsledkem spolupráce VUT, UNIBO a CINECA. Oba výstupy budou zveřejněny s otevřenými zdrojovými kódy. Examon Web byl prezentován na konferenci 1st Users' Conference v Ostravě pořádanou IT4Innovations. Další rozšíření práce může být anotace datové sady a také rozšíření Examon Web o rozhodovací stromy, které určí přesný důvod špatného chování dané úlohy.

National Repository of Grey Literature : 31 records found   previous11 - 20nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.