Národní úložiště šedé literatury Nalezeno 92 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Efektivní implementace vysoce náročných algoritmů na vícejádrových procesorech
Tomečko, Lukáš ; Bidlo, Michal (oponent) ; Jaroš, Jiří (vedoucí práce)
Cieľom tejto práce je paralelizovať a vektorizovať simuláciu toku kvapalín. Dosiahne sa to pomocou knižnice OpenMP a prekladaču od Intelu. Implementované boli rôzne prístupy k problému, ako napr. cache blocking, zoraďovanie dát počas behu a dočasné reorganizovanie dát v pamäti. Skombinovaním najrýchlejších riešení sa podarilo simuláciu celkovo zrýchliť 11,4krát na 16 jadrách, pričom testy prebiehali na ostravskom superpočítači Anselm. Výsledky ukazujú, že výsledná aplikácia dobre škáluje s pribúdajúcim počtom jadier. Ďalej, vektorizovanie daného problému bolo možné len čiastočne z dôvodu nevhodného spôsobu práce s dátami.
Fast signal processing
Rychlý, Ivo ; Langerová, Petra (oponent) ; Mikulka, Jan (vedoucí práce)
An increasing amount of data in modern image processing requires a new approach in algorithms. The biggest obstacle for successful speed up of an algorithm is parallelization and subsequent optimization. Architectures like CUDA and OpenCL with modified programing languages and interfaces help to overcome this obstacle and bring parallel computing to a broader audience. In this paper I take a look at basics of image processing and how parallelization can speed up the algorithms in image processing.
Klient-server aplikace založená na technologii JAVA RMI
Salášek, Jan ; Mašek, Jan (oponent) ; Karásek, Jan (vedoucí práce)
Bakalářská práce shrnuje možnosti pro vytváření distribuovaných systémů využitelných v platformě Java. Zabývá se zrychlením výpočtu pomocí paralelizace a distribuovaného zpracování dat.
Client-Server Application Based on CORBA
Majtán, Martin ; Mašek, Jan (oponent) ; Karásek, Jan (vedoucí práce)
Bachelor thesis deals with client-server applications and software technologies used to implement client-server applications in the Java programming language. The goal of bachelor thesis is the parallelization of genetic algorithm for knapsack problem and create two distributed models for technology CORBA and Hessian. In the teoretical part of the thesis are describes the basic concept of network communication, explanation client-server model of network communication, there are discussed technologies Java RMI, CORBA and Hessian. In the thesis is described the parallel and the distributed model of data processing, genetic algorithm and its use to solve the knapsack problem. In the practical part is created parallel and distributed model of a genetic algorithm for knapsack problem using technology CORBA and Hessian. In the thesis is done comparison of parallel model and distributed models in terms of calculation time. Results of measurement time are displayed in tables.
Paralelizace faktorizace celých čísel z pohledu lámání RSA
Breitenbacher, Dominik ; Henzl, Martin (oponent) ; Homoliak, Ivan (vedoucí práce)
Práce se zabývá faktorizací celých čísel. Faktorizace je nejznámější a nejpoužívanější metodou kryptoanalýzy RSA. V rámci této práce byla vybrána a implementována faktorizační metoda zvaná SIQS. I když se jedná o nejrychlejší metodu (do 100 dekadických číslic), není možné ji efektivně počítat v polynomiálním čase, a tak  se hledají různé možnosti, jak tuto metodu co nejvíce urychlit. Jako první se nabízí paralelizace. K tomuto účelu bylo využito OpenMP. Další možností je optimalizace kódu. Cílem této práce je také ukázat, jak jednoduše lze v mnoha případech využít paralelizace kódu a dále, jak díky podrobné analýze kódu lze dosáhnout poměrně velkého urychlení. Použitá metodika iteračního provádění optimalizací se ukázala jako velmi účinná. Touto metodikou byla implementace SIQS vylepšena tak, že faktorizace byla urychlena až 100-krát, v některých částech kódu dokonce ještě více.
Genetic Algorithms - Implementation of Multiprocessing
Tuleja, Martin ; Ilgner, Petr (oponent) ; Oujezský, Václav (vedoucí práce)
Genetic algorithms are modern algorithms intended to solve optimization problems. Inspiration originates in evolutionary principles in nature. Parallelization of genetic algorithms provides not only faster processing but also new and better solutions. Parallel genetic algorithms are also closer to real nature than their sequential counterparts. This paper describes the most used models of parallelization of genetic algorithms. Moreover, it provides the design and implementation in programming language Python. Finally, the implementation is verified in several test cases.
Paralelizace sestavení v prostředí Jenkins
Lukášová, Michaela ; Zachariášová, Marcela (oponent) ; Dolíhal, Luděk (vedoucí práce)
Tato práce se zabývá paralelním sestavením balíku vývojového prostředí Codasip Studio. Zaměřuje se na možnosti paralelizace v prostředí Jenkins. Implementované řešení se soustřeďuje zejména na urychlení aktuálního procesu sestavení. Řešení využívá několika zásuvných modulů prostředí Jenkins a také několika shellových skriptů zajišťujích spuštění překladu, instalace či tvorby výsledného balíku.
Ray-tracing s knihovnou IPP
Kukla, Michal ; Havel, Jiří (oponent) ; Hradiš, Michal (vedoucí práce)
Práce se zabývá návrhem a implementací ray-tracingu a path-tracingu s využitím knihovny IPP. Teoretická část diskutuje současné postupy při akceleraci zmínených algoritmů a možnost paralelizace. V další části práce je popsán návrh algoritmů ray-tracingu a path-tracingu a způsob paralelizace zmiňovaných algoritmů. Tato část taktéž diskutuje možnosti implementace adaptivního vzorkování a metody importance sampling v souvislosti s metodou Monte Carlo pro urychlení algoritmu path-tracingu. Další část se zabývá postupem implementace zmínených zobrazovacích algoritmů v kontextu knihovny IPP a také využitím knihovny Boost při tvorbě síťového rozhrání aplikace. Implementované postupy jsou v závěru práce podrobeny testům výkonnosti a kvality zobrazení pro stanovení úspešnosti zvolených postupů. Výstupem práce je serverová aplikace schopna současné obsluhy více klientů poskytující vizualizaci a klientská aplikace implementující ray-tracing a path-tracing.
Konstrukce kD stromu na GPU
Bajza, Jakub ; Kula, Michal (oponent) ; Kobrtek, Jozef (vedoucí práce)
Táto diplomová práca sa zaoberá konštrukciou akceleračných štruktúr typu kD strom a následnou ich následnou paralelizáciou pomocou GPU. Na začiatku je čitateľ oboznámený s platformou CUDA pre paralelné programovanie. Ide o popis všeobecných princípov ako aj špecifických vlastností, využitých v rámci tejto práce. Potom je čitateľ uvedený do problematiky akceleračných štruktúr pre sledovanie lúčov. Tieto štruktúry sú opísané a akceleračná štruktúra pre kD strom a jej varianty sú popísané do detailov. Následne je rozobraná analýza zvoleného variantu kD stromu a sú prezentované možné problémy a úskalia pri jej paralelnej implementácii. V rámci popisu implementácie je zahrnutý krátky popis CPU variantu a detailné popisy jednotlivých CUDA kernelov. Sekcia o testovaní prináša výsledky implementácie vo forme zrovnania CPU a GPU implementácie, ako aj vyhodnotenie naplnenie metriky stanovenej počas návrhu. V závere je obsiahnuté zhrnutie dosiahnutých cieľov a výsledkov nasledované popisom možných budúcich vylepšení na implementácii.
Simulace šíření tepla s časově proměnným zdrojem s využitím GPU
Hála, Pavel ; Záň, Drahoslav (oponent) ; Jaroš, Jiří (vedoucí práce)
Tato bakalářská práce se zabývá simulací šíření tepla v živých tkáních, které je dodáváno časově proměnným externím tepelným zdrojem. Simulace byla implementována pomocí metody konečných diferencí čtvrtého řádu v prostoru a prvního v čase. V rámci práce byla nejprve implementována vícevláknová verze využívající procesoru CPU. Následně bylo implementováno několik verzí pro grafickou kartu GPU s důrazem na maximální adaptaci algoritmu na danou architekturu a co nejlepší využít výpočetního potenciálu grafické karty. Experimentálním měřením se ukázalo, že nejrychlejší je naivní algoritmus využívající pouze globální paměť grafické karty. Dále byla zkoumána efektivita Gauss-Seidelovy obarvovací metody, jejíž cílem je redukce paměťové náročnosti. Na CPU se tato metoda ukázala použitelná, neboť její nejrychlejší verze byla pouze o 13% pomalejší, ale při použití této metody je možné snížit paměťovou náročnost až na polovinu. Implementace této metody na GPU byla 2x pomalejší a její přínos proto není tak velký. Na CPU bylo dosaženo maximálního výkonu 32GFLOPS zatímco na GPU 135GFLOPS. To odpovídá 10% (CPU) a 9% (GPU) maximálního teoretického výkonu obou architektur.

Národní úložiště šedé literatury : Nalezeno 92 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.