Národní úložiště šedé literatury Nalezeno 45 záznamů.  začátekpředchozí26 - 35další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Akcelerace vektorových a krytografických operací na platformě x86-64
Šlenker, Samuel ; Martinásek, Zdeněk (oponent) ; Balík, Miroslav (vedoucí práce)
Cieľom práce bolo naštudovať a následne spracovať porovnanie starších a novších vektorových výpočtových jednotiek moderných mikroprocesorov na platforme x86-64. Práca mala poskytnúť prehľad najrýchlejších výpočtov vektorových operácií s maticami a vektormi spolu s príslušnými zdrojovými kódmi. Ďalej bola jej zameraním oblasť autentizovaného šifrovania, konkrétne blokovej šifry AES pracujúcej v operačnom móde Galois Counter Mode a pojednanie o možnostiach inštrukčných sád pre podporu kryptografie.
Acceleration of Object Detection Using Classifiers
Juránek, Roman ; Kälviäinen, Heikki (oponent) ; Sojka, Eduard (oponent) ; Zemčík, Pavel (vedoucí práce)
Detection of objects in computer vision is a complex task. One of most popular and well explored  approaches is the use of statistical classifiers and scanning windows. In this approach, classifiers learned by AdaBoost algorithm (or some modification) are often used as they achieve low error rates, high detection rates and they are suitable for detection in real-time applications. Object detection run-time which uses such classifiers can be implemented by various methods and properties of underlying architecture can be used for speed-up of the detection.  For the purpose of acceleration, graphics hardware, multi-core architectures, SIMD or other means can be used. The detection is often implemented on programmable hardware.  The contribution of this thesis is to introduce an optimization technique which enhances object detection performance with respect to an user defined cost function. The optimization balances computations of previously learned classifiers between two or more run-time implementations in order to minimize the cost function.  The optimization method is verified on a basic example -- division of a classifier to a pre-processing unit implemented in FPGA, and a post-processing unit in standard PC.
Lifting Scheme Cores for Wavelet Transform
Bařina, David ; Kälviäinen, Heikki (oponent) ; Sojka, Eduard (oponent) ; Zemčík, Pavel (vedoucí práce)
The thesis focuses on efficient computation of the two-dimensional discrete wavelet transform. The state-of-the-art methods are extended in several ways to perform the transform in a single loop, possibly in multi-scale fashion, using a compact streaming core. This core can further be appropriately reorganized to target the minimization of certain platform resources. The approach presented here nicely fits into common SIMD extensions, exploits the cache hierarchy of modern general-purpose processors, and is suitable for parallel evaluation. Finally, the approach presented is incorporated into the JPEG 2000 compression chain, in which it has proved to be fundamentally faster than widely used implementations.
Efektivní implementace vysoce náročných algoritmů na vícejádrových procesorech
Tomečko, Lukáš ; Bidlo, Michal (oponent) ; Jaroš, Jiří (vedoucí práce)
Cieľom tejto práce je paralelizovať a vektorizovať simuláciu toku kvapalín. Dosiahne sa to pomocou knižnice OpenMP a prekladaču od Intelu. Implementované boli rôzne prístupy k problému, ako napr. cache blocking, zoraďovanie dát počas behu a dočasné reorganizovanie dát v pamäti. Skombinovaním najrýchlejších riešení sa podarilo simuláciu celkovo zrýchliť 11,4krát na 16 jadrách, pričom testy prebiehali na ostravskom superpočítači Anselm. Výsledky ukazujú, že výsledná aplikácia dobre škáluje s pribúdajúcim počtom jadier. Ďalej, vektorizovanie daného problému bolo možné len čiastočne z dôvodu nevhodného spôsobu práce s dátami.
Překlad OpenCL aplikací pro vestavěné systémy
Šnobl, Pavel ; Čekan, Ondřej (oponent) ; Hruška, Tomáš (vedoucí práce)
Tato diplomová práce se zabývá podporou pro překlad a spouštění programů napsaných pomocí OpenCL frameworku na vestavěných systémech. OpenCL je systém pro programování heterogenních systémů, složených z procesorů, grafických akcelerátorů a dalších výpočetních zařízení. Využití má ovšem i na systémech skládajících se pouze z jedné výpočetní jednotky, kde umožňuje zápis paralelních programů (funkční a datový paralelismus) a práci s hierarchickým systémem pamětí. V rámci této práce jsou porovnány jednotlivé dostupné open source implementace OpenCL a následně je jedna vybraná integrována s překladačem LLVM. Tento překladač je generován v rámci sady nástrojů poskytovaných vývojovým prostředím pro tvorbu procesorů s aplikačně specifickou instrukční sadou zvaným Codasip Studio. Dále jsou navrženy a implementovány optimalizace pro architektury se SIMD instrukcemi a architektury typu VLIW. Výsledek je otestován a demonstrován na sadě testovacích aplikací.
Výpočetní jednotky procesorů poslední generace a jejich využití
Šlenker, Samuel ; Pavlíček, Tomáš (oponent) ; Balík, Miroslav (vedoucí práce)
Cieľom tejto práce bolo naštudovať a následne spracovať rozdiely medzi staršími inštrukčnými sadami a novšími inštrukčnými sadami, uviesť prínosy jednotlivých rozšírení, porovnať spôsoby výpočtov jednotlivých výpočtových SIMD jednotiek a porovnať ich implementáciu u firiem Intel a AMD. Súčasťou práce sú dva teoretické úvody k laboratórnym úlohám.
Podpora SIMD instrukcí v překladači LLVM
Šnobl, Pavel ; Hynek, Jiří (oponent) ; Masařík, Karel (vedoucí práce)
Tato bakalářská práce se zabývá podporou automatické vektorizace kódu v kompilačním frameworku LLVM a rozšířením modelu procesoru Codix o SIMD instrukce. Výsledkem je schopnost LLVM vytvářet reporty o proběhlém procesu autovektorizace a možnost využívat speciálních direktiv pragma pro dodání dodatečných informací pro optimalizace programů. Rovněž je představen a implementován způsob dodávání informací o architekturách procesorů vytvořených pomocí vývojového prostředí Codasip Framework, potřebných pro efektivnější vektorizaci. Nakonec je pro procesor Codix vybrána a následně do modelu přidána sada celočíselných vektorových instrukcí a souvisejících nových registrů.
Generování kódu optimalizovaných matematických operací
Beneš, Vojtěch ; Horáček, Petr (oponent) ; Čermák, Martin (vedoucí práce)
Bakalářská práce se zabývá vytvořením jednoduchého programovacího jazyka pro práci s matematickými operacemi. Hlavním cílem práce je vytvořit kompilátor tohoto jazyka, který pro generování instrukcí cílového kódu využívá instrukční sadu technologie MMX. Generování optimalizovaného kódu probíhá na základě upraveného algoritmu kontextového generování.
Vyhledávání korespondujících objektů ve dvojici snímků
Vrbenský, Andrej ; Herman, David (oponent) ; Orság, Filip (vedoucí práce)
Práce shrnuje část problematiky stereoskopie a popisuje nejrozšířenejší metody na hledání korespondujících objeků ve dvojici stereo snímků. Zaměřuje se hlavně na metody hledání vzoru, založených na porovnávání intenzit. Tyto metody se snaží vylepšit za pomoci SIMD SSE instukcí. Výsledek je pak otestován na testovacích snímcích a vyhodnocen. Metody jsou implementovány v jazyce C++ a také v jazyce symbolických instrukcí.
Knihovna pro zpracování obrazu v GPU
Čermák, Michal ; Španěl, Michal (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá architekturou grafických karet Nvidia a s ní související programátorské rozhranní CUDA, které je využito při tvorbě knihovny akcelerující algoritmy zpracování obrazu. Velký důraz je kladen na testování výkonnostního zisku oproti optimalizované a používané knihovně OpenCV.

Národní úložiště šedé literatury : Nalezeno 45 záznamů.   začátekpředchozí26 - 35další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.