Národní úložiště šedé literatury Nalezeno 4 záznamů.  Hledání trvalo 0.00 vteřin. 
Asistovaná vektorizace a paralelizace kódu pomocí standardu OpenMP 4.0
Slouka, Lukáš ; Nikl, Vojtěch (oponent) ; Jaroš, Jiří (vedoucí práce)
Predmetom bakalárskej práce je optimalizácia kódu pomocou štandardu OpenMP 4.0, ktorý poskytuje prostriedky pre asistovanú paralelizáciu a vektorizáciu. Okrem popisu štandardu OpenMP 4.0 práca obsahuje aj náhľad do architektúr moderných počítačov a to najmä systému rýchlych vyrovnávacích pamätí a modulov SSE/AVX, ktoré hrajú veľmi významnú rolu v oblasti optimalizácie. Práca demonštruje výhody optimalizovaného kódu pomocou štandardu OpenMP 4.0 oproti neoptimalozavanému kódu na sade benchmarkov zameraných na rôzne aspekty optimalizácie.
Implementace neuronové sítě bez operace násobení
Slouka, Lukáš ; Baskar, Murali Karthick (oponent) ; Szőke, Igor (vedoucí práce)
Predmetom tejto diplomovej práce je akcelerácia neurónových sietí s cieľom redukcie počtu operácií násobenia reálnych čísiel. Teoretická časť tejto práce sleduje súčasné trendy a metódy využívané v oblasti akcelerácie neurónových sietí. Najväčší dôraz je kladený na binarizačné techniky, ktoré umožňujú nahradiť násobenia logickými operátormi. Teoretický základ je zavedený do praxe hneď dvomi spôsobmi. Prvým z nich je implementácia kritických binárnych operátorov spustiteľných na GPU vo frameworku TensorFlow a ich rýchlostný benchmark. Druhým je aplikácia týchto operátorov v jednoduchom klasifikátore obrázkov. Výsledky sú rozhodne povzbudivé. Implementované operátory dosiahli 2,5-násobné zrýchlenie v porovnaní s vysoko optimalizovanými cuBLAS operátormi. Posledná kapitola práce sleduje úspešnosť dosiahnutú binarizačnými modelmi.
Implementace neuronové sítě bez operace násobení
Slouka, Lukáš ; Baskar, Murali Karthick (oponent) ; Szőke, Igor (vedoucí práce)
Predmetom tejto diplomovej práce je akcelerácia neurónových sietí s cieľom redukcie počtu operácií násobenia reálnych čísiel. Teoretická časť tejto práce sleduje súčasné trendy a metódy využívané v oblasti akcelerácie neurónových sietí. Najväčší dôraz je kladený na binarizačné techniky, ktoré umožňujú nahradiť násobenia logickými operátormi. Teoretický základ je zavedený do praxe hneď dvomi spôsobmi. Prvým z nich je implementácia kritických binárnych operátorov spustiteľných na GPU vo frameworku TensorFlow a ich rýchlostný benchmark. Druhým je aplikácia týchto operátorov v jednoduchom klasifikátore obrázkov. Výsledky sú rozhodne povzbudivé. Implementované operátory dosiahli 2,5-násobné zrýchlenie v porovnaní s vysoko optimalizovanými cuBLAS operátormi. Posledná kapitola práce sleduje úspešnosť dosiahnutú binarizačnými modelmi.
Asistovaná vektorizace a paralelizace kódu pomocí standardu OpenMP 4.0
Slouka, Lukáš ; Nikl, Vojtěch (oponent) ; Jaroš, Jiří (vedoucí práce)
Predmetom bakalárskej práce je optimalizácia kódu pomocou štandardu OpenMP 4.0, ktorý poskytuje prostriedky pre asistovanú paralelizáciu a vektorizáciu. Okrem popisu štandardu OpenMP 4.0 práca obsahuje aj náhľad do architektúr moderných počítačov a to najmä systému rýchlych vyrovnávacích pamätí a modulov SSE/AVX, ktoré hrajú veľmi významnú rolu v oblasti optimalizácie. Práca demonštruje výhody optimalizovaného kódu pomocou štandardu OpenMP 4.0 oproti neoptimalozavanému kódu na sade benchmarkov zameraných na rôzne aspekty optimalizácie.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.