Národní úložiště šedé literatury Nalezeno 45 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.02 vteřin. 
Efektivní implementace vysoce náročných algoritmů na vícejádrových procesorech
Tomečko, Lukáš ; Bidlo, Michal (oponent) ; Jaroš, Jiří (vedoucí práce)
Cieľom tejto práce je paralelizovať a vektorizovať simuláciu toku kvapalín. Dosiahne sa to pomocou knižnice OpenMP a prekladaču od Intelu. Implementované boli rôzne prístupy k problému, ako napr. cache blocking, zoraďovanie dát počas behu a dočasné reorganizovanie dát v pamäti. Skombinovaním najrýchlejších riešení sa podarilo simuláciu celkovo zrýchliť 11,4krát na 16 jadrách, pričom testy prebiehali na ostravskom superpočítači Anselm. Výsledky ukazujú, že výsledná aplikácia dobre škáluje s pribúdajúcim počtom jadier. Ďalej, vektorizovanie daného problému bolo možné len čiastočne z dôvodu nevhodného spôsobu práce s dátami.
Výpočetní jednotky procesorů poslední generace a jejich využití
Šlenker, Samuel ; Pavlíček, Tomáš (oponent) ; Balík, Miroslav (vedoucí práce)
Cieľom tejto práce bolo naštudovať a následne spracovať rozdiely medzi staršími inštrukčnými sadami a novšími inštrukčnými sadami, uviesť prínosy jednotlivých rozšírení, porovnať spôsoby výpočtov jednotlivých výpočtových SIMD jednotiek a porovnať ich implementáciu u firiem Intel a AMD. Súčasťou práce sú dva teoretické úvody k laboratórnym úlohám.
Acceleration of Object Detection Using Classifiers
Juránek, Roman ; Kälviäinen, Heikki (oponent) ; Sojka, Eduard (oponent) ; Zemčík, Pavel (vedoucí práce)
Detection of objects in computer vision is a complex task. One of most popular and well explored  approaches is the use of statistical classifiers and scanning windows. In this approach, classifiers learned by AdaBoost algorithm (or some modification) are often used as they achieve low error rates, high detection rates and they are suitable for detection in real-time applications. Object detection run-time which uses such classifiers can be implemented by various methods and properties of underlying architecture can be used for speed-up of the detection.  For the purpose of acceleration, graphics hardware, multi-core architectures, SIMD or other means can be used. The detection is often implemented on programmable hardware.  The contribution of this thesis is to introduce an optimization technique which enhances object detection performance with respect to an user defined cost function. The optimization balances computations of previously learned classifiers between two or more run-time implementations in order to minimize the cost function.  The optimization method is verified on a basic example -- division of a classifier to a pre-processing unit implemented in FPGA, and a post-processing unit in standard PC.
Akcelerace algoritmů na architektuře Larrabee
Veselý, Ivo ; Seeman, Michal (oponent) ; Zemčík, Pavel (vedoucí práce)
Intel Larrabee je jednou z prvních plně programovatelných grafických architektur. Práce popisuje tuto více-jádrovou architekturu z pohledu hardwarové implementace i z pohledu programovacího modelu. Larrabee sází na mnoho úplných in-order jader vystavěných nad instrukční sadou x86. Jádra obsahují čtyři hardwarová vlákna, každé vybavené svou vlastní sadou registrů, a novou vektorovou jednotkou. Vektorová jednotka společně s rozšířením instrukční sady rapidně zvyšují výkonnost systému. Nové režimy cachování přispívají ke zvýšení propustnosti i v případě nespojitých datových struktur. Zaměření této architektury proto není jen počítačová grafika nebo zpracování obrazu ale všechny paralelní úkoly. Druhá část textu se zabývá syntézou hologramu. Konkrétně přináší dvě nové metody pro generování množiny bodových světelných zdrojů se zadanou vyzařovací charakteristikou.
Vyhledávání korespondujících objektů ve dvojici snímků
Vrbenský, Andrej ; Herman, David (oponent) ; Orság, Filip (vedoucí práce)
Práce shrnuje část problematiky stereoskopie a popisuje nejrozšířenejší metody na hledání korespondujících objeků ve dvojici stereo snímků. Zaměřuje se hlavně na metody hledání vzoru, založených na porovnávání intenzit. Tyto metody se snaží vylepšit za pomoci SIMD SSE instukcí. Výsledek je pak otestován na testovacích snímcích a vyhodnocen. Metody jsou implementovány v jazyce C++ a také v jazyce symbolických instrukcí.
Ray-tracing s knihovnou IPP
Kukla, Michal ; Havel, Jiří (oponent) ; Hradiš, Michal (vedoucí práce)
Práce se zabývá návrhem a implementací ray-tracingu a path-tracingu s využitím knihovny IPP. Teoretická část diskutuje současné postupy při akceleraci zmínených algoritmů a možnost paralelizace. V další části práce je popsán návrh algoritmů ray-tracingu a path-tracingu a způsob paralelizace zmiňovaných algoritmů. Tato část taktéž diskutuje možnosti implementace adaptivního vzorkování a metody importance sampling v souvislosti s metodou Monte Carlo pro urychlení algoritmu path-tracingu. Další část se zabývá postupem implementace zmínených zobrazovacích algoritmů v kontextu knihovny IPP a také využitím knihovny Boost při tvorbě síťového rozhrání aplikace. Implementované postupy jsou v závěru práce podrobeny testům výkonnosti a kvality zobrazení pro stanovení úspešnosti zvolených postupů. Výstupem práce je serverová aplikace schopna současné obsluhy více klientů poskytující vizualizaci a klientská aplikace implementující ray-tracing a path-tracing.
Optimalizace algoritmů SIMD instrukcemi
Sedláček, Marek ; Rydlo, Štěpán (oponent) ; Orság, Filip (vedoucí práce)
Tato práce popisuje a porovnává techniky použitelné pro optimalizaci algoritmů převážně z hlediska zkrácení výpočetní doby. Pro demonstraci praktik byly vybrány algoritmy z rozdílných oblastí a to -- optimalizace hejnem částic, algoritmus pro vykreslování kružnic a algoritmus pro otočení obrázku (matice). Tyto algoritmy byly implementovány v jazyce Python 3, C a jazyce symbolických adres s využitím SIMD technologie. Při psaní kódu byl kladen důraz na co nejefektivnější implementaci algoritmu. V této práci jsou tyto praktiky popsáný a porovnány, stejně tak jako jejich účinek na optimalizaci algoritmů. Provedené testy potvrdily velký potenciál SIMD technologií pro optimalizace, ale také to, že tento přístup není možný využít na všechny algoritmy. V případě optimalizace algoritmu pro vykreslování kružnic dosahovala SIMD implementace více jak desetinásobné rychlosti než sériová implementace v jazyce C a více jak tisíckrát vyšší rychlost než implementace v jazyce Python 3. V případě algoritmu optimalizace hejnem částic byla však implementace v jazyce C rychlejší než SIMD implementace algoritmu.
Akcelerace vektorových a krytografických operací na platformě x86-64
Šlenker, Samuel ; Martinásek, Zdeněk (oponent) ; Balík, Miroslav (vedoucí práce)
Cieľom práce bolo naštudovať a následne spracovať porovnanie starších a novších vektorových výpočtových jednotiek moderných mikroprocesorov na platforme x86-64. Práca mala poskytnúť prehľad najrýchlejších výpočtov vektorových operácií s maticami a vektormi spolu s príslušnými zdrojovými kódmi. Ďalej bola jej zameraním oblasť autentizovaného šifrovania, konkrétne blokovej šifry AES pracujúcej v operačnom móde Galois Counter Mode a pojednanie o možnostiach inštrukčných sád pre podporu kryptografie.
Optimalizace procesorového jádra pro knihovnu OpenCV
Benna, Filip ; Hynek, Jiří (oponent) ; Hruška, Tomáš (vedoucí práce)
Tato bakalářská práce se zabývá překladem knihovny OpenCV pro procesorové jádro Codix RISC a následnou optimalizací vybraných aplikací implementovaných s použitím této knihovny. Optimalizace je založena na rozšiřitelnosti procesorového jádra, proto je v této práci teoreticky popsáno a na příkladu vysvětleno přidání vektorových instrukcí do instrukční sady procesoru. Nakonec jsou uvedeny dosažené výsledky a jejich porovnání s neoptimalizovanou verzí aplikace.
Lifting Scheme Cores for Wavelet Transform
Bařina, David ; Kälviäinen, Heikki (oponent) ; Sojka, Eduard (oponent) ; Zemčík, Pavel (vedoucí práce)
The thesis focuses on efficient computation of the two-dimensional discrete wavelet transform. The state-of-the-art methods are extended in several ways to perform the transform in a single loop, possibly in multi-scale fashion, using a compact streaming core. This core can further be appropriately reorganized to target the minimization of certain platform resources. The approach presented here nicely fits into common SIMD extensions, exploits the cache hierarchy of modern general-purpose processors, and is suitable for parallel evaluation. Finally, the approach presented is incorporated into the JPEG 2000 compression chain, in which it has proved to be fundamentally faster than widely used implementations.

Národní úložiště šedé literatury : Nalezeno 45 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.