National Repository of Grey Literature 24 records found  1 - 10nextend  jump to record: Search took 0.00 seconds. 
The Best Possible Speech Recognizer on Your Own Data
Sýkora, Tomáš ; Veselý, Karel (referee) ; Szőke, Igor (advisor)
Denno-denne vzniká množstvo špičkových objavov v oblasti strojového učenia. Prispôsobením týchto sýstémov tak, aby čo najlepšie fungovali iba na obmedzenej podmnožine všeobecných dát, môžu byť dosiahnuté výrazné zlepšenia v prenosti. Prispôsobením automatického rozpoznávača reči na doménovo špecifické dáta je možné vytvoriť produkt dosahujúci omnoho lepšie výsledky ako rozpoznávač reči natrénovaný na všeobecných dátach. Táto práca prezentuje 17-percentné zlepšenie chybovosti prepísaných slov oproti automatickému rozpoznávaču reči ponúkaného službou Google Speech. Toto zlepšenie bolo dosiahnuté precíznou anotáciou a prípravou doménových dát a kombináciou špičkových techník a algoritmov v oblasti automatického rozpoznávania reči. Popísaný systém bol úspešne nasadený do výrobného prostredia transkripčnej spoločnosti Parrot, ktorej súčasťou som od jej začiatku. Nasadený systém výrazne zvýšil efektivitu zamestancov používajúcich výstup popísaného rozpoznávača.
Music Source Separation
Holík, Viliam ; Veselý, Karel (referee) ; Mošner, Ladislav (advisor)
Neural networks are used for the problem of music source separation from recordings. One such network is Conv-TasNet. The aim of the work is to experiment with the already existing implementation of this network for the purpose of potential improvement. The models were trained on the MUSDB18 dataset. It was successively experimented with the change of the network structure, transforming signals from the time domain to the frequency domain for the purpose of calculating the loss function, replacing different loss functions with the original one, finding the optimal learning rate for each loss function and gradually decreasing the learning rate during the learning process. The best experiments according to the SDR metric were training with loss functions L1 and logarithmic L2 in the time domain with a higher initial learning rate with its gradual decrease during the learning process. In a relative comparison of the best models to the baseline, it is more than 2.5% improvement.
Automatic Speech Detection for VHF Channel
Nováková, Mária ; Veselý, Karel (referee) ; Szőke, Igor (advisor)
Výskyt hluku a šumu v pozadí audio leteckej komunikácie je problémom, ktorému denne čelia operanti riadenia letovej prevádzky. Aby bola zaistená bezpečná letecká preprava, komunikácia medzi vežou a lietatlom musí byť čo najefektívnejšia. Hlavnú rolu vo vylepšovaní kvality komunikácie hrá detekcia hlasovej aktivity. Správna detekcia reči je nevyhnutá pre rozpoznanie začiatku komunikácie pre systémy. Začiatok komunikácie začína stlačením tlačítka push-to-talk pomocou rádiového systému. Na rozpoznávanie reči existujú rôzne prístupy a implementácie. Za pomoci neurónových sietí sa dá detekcia reči upresniť. Výhodou používania umelej inteligencie je jej adaptácia na nové podnety. Táto práca ponúka riešenie na detekciu reči a push-to-talk udalostí v leteckej komunikácií. Navrhnuté riešenia budú evaluované a porovnané. Na záver, dostupná implementácia GPVAD je prepracovaná na riešenie tohto problému. Strojové učenie má zas a znova príležitosť predviesť svoje schopnosti.
Demo(s)
Ščudla, Marek ; Veselý, Karel (referee) ; Šrámek, Jan (advisor)
I have been engaged in creating music as an artist for a long time, which is also the subject of my thesis titled Demo(s). However, unlike my previous works that I have presented in school, this project will not feature a music video or the music itself. The thesis aims to observe and record the progress and events surrounding the creation of my debut album. The documentation and outputs will be presented in the form of a video installation, which will consist of time-lapse videos. These videos will showcase the creative, inspirational, and technical processes associated with rap music production. Additionally, the installation will also include a standalone object.
Hyporehabilitation Havlíčkův Brod
Veselý, Karel ; Kalánek, Jiří (referee) ; Brzoň, Roman (advisor)
The subject of this diploma thesis is to design a NZEB hyporehabilitation building in the hospital campus in Havlíčkův Brod. The building has three above-ground and one underground floors, connected with a staircase and elevator. It contains five therapy rooms with an access to a terrace and stables for up to seven horses. The underground floor includes a corridor, a technical room, an air conditioning unit room and warehouses. On the other floors, there are facilities for hipporehabilitation staff facilities and stables for horses. The building is based on reinforced concrete foundations. The vertical load-bearing structures are designed from ceramic blocks. In the basement, the cast-in-place reinforced concrete cladding is insulated with ETICS. The floor structure consists of prefabricated reinforced concrete panels. The staircase is designed as a reinforced concrete prefabricate. The building is covered with a flat, single-skin roof, partially designed as green roof. The heating and domestic hot water are privided by the connection to the campus central heat supply system using a heat-exchanger. Ventilation in the building is provided by air-conditioning units with heat recovery. Photovoltaic panels are installed on the roof of the building. In the third part, the details in the 2D temperature field of selected parts of the building were assessed, modifications were proposed and an evaluation was carried out. The diploma thesis was processed mainly in ArchiCad and DEKSOFT software.
Adding New Words in a Dynamic Speech Recognition Decoder
Škrdlík, Kryštof ; Veselý, Karel (referee) ; Schwarz, Petr (advisor)
The result of this thesis is a modified speech recognizer developed by the company Phonexia, in which new words that are not part of its dictionary can be added dynamically. The chosen method that was implemented works by inserting finite automata with new words directly into a modified static recognition network describing combined language and pronunciation model of the recognizer in places that are specified in advance. This method offers comparable results with a speech recognizer without modification.
Apartment building
Veselý, Karel ; Průša, David (referee) ; Brukner, Bohuslav (advisor)
The subject of this Bachelor thesis is a project documentation for construction of the building of the apartment house in Humpolec. The building is designed for housing, it has five overground storeys and a basement, with a lift. It contains seventeen dwelling units with access to the balcony and a possibility of own parking right in the building. The basement is largely made up of parking space – one collective garage with nineteen parking spots. The remaining part of the underground floor is made up of corridor, air conditioning engine room, room with electricity meters, room with cellars, utility room and cleaning room. On the other floors there are a total of seventeen housing units with layouts of 1+kk, 2+kk, 3+kk a 4+kk. The apartment building is based on reinforced concrete foundation strips. The vertical load-bearing structures are designed from ceramic blocks, in the basement from monolithic reinforced concrete are insulated with the contact thermal insulation system according to ETICS. The ceiling structures are monolithic reinforced concrete slabs, only above the apartment on the 5th floor, the load-bearing part of the ceiling is solved using wooden beams. Stairway is solved as reinforced concrete precast. The building is covered by flat monolayer roof.
The Use of Artificial Intelligence on Stock Market
Kuna, Martin ; Veselý, Karel (referee) ; Dostál, Petr (advisor)
Diplomová práce se zabývá aplikací vybraných metod umělé inteligence v prostředí kapitálových, potažmo akciových, trhů. Konkrétně se zaměřuje na využití umělých neuronových sítí pro predikci trendu a na možnost aplikace genetických algoritmů k řešení problému optimalizace investičního portfolia. Obsahuje návrh řešení uvedených problémů v praxi. Návrhy jsou koncipovány ve formě modelů zpracovaných ve vývojovém prostředí Matlab.
Semi-Supervised Training of Deep Neural Networks for Speech Recognition
Veselý, Karel ; Ircing, Pavel (referee) ; Lamel, Lori (referee) ; Burget, Lukáš (advisor)
V této dizertační práci nejprve prezentujeme teorii trénování neuronových sítí pro rozpoznávání řeči společně s implementací trénovacího receptu 'nnet1', který je součástí toolkitu s otevřeným kódem Kaldi. Recept se skládá z předtrénování bez učitele pomocí algoritmu RBM, trénování klasifikátoru z řečových rámců s kriteriální funkcí Cross-entropy a ze sekvenčního trénování po větách s kriteriální funkcí sMBR. Následuje hlavní téma práce, kterým je semi-supervised trénování se smíšenými daty s přepisem i bez přepisu. Inspirováni konferenčními články a úvodními experimenty jsme se zaměřili na několik otázek: Nejprve na to, zda je lepší konfidence (t.j. důvěryhodnosti automaticky získaných anotací) počítat po větách, po slovech nebo po řečových rámcích. Dále na to, zda by konfidence měly být použity pro výběr dat nebo váhování dat - oba přístupy jsou kompatibilní s trénováním pomocí metody stochastického nejstrmějšího sestupu, kde jsou gradienty řečových rámců násobeny vahou. Dále jsme se zabývali vylepšováním semi-supervised trénování pomocí kalibrace kofidencí a přístupy, jak model dále vylepšit pomocí dat se správným přepisem. Nakonec jsme navrhli jednoduchý recept, pro který není nutné časově náročné ladění hyper-parametrů trénování, a který je prakticky využitelný pro různé datové sady. Experimenty probíhaly na několika sadách řečových dat: pro rozpoznávač vietnamštiny s 10 přepsaným hodinami (Babel) se chybovost snížila o 2.5%, pro angličtinu se 14 přepsanými hodinami (Switchboard) se chybovost snížila o 3.2%. Zjistili jsme, že je poměrně těžké dále vylepšit přesnost systému pomocí úprav konfidencí, zároveň jsme ale přesvědčení, že naše závěry mají značnou praktickou hodnotu: data bez přepisu je jednoduché nasbírat a naše navrhované řešení přináší dobrá zlepšení úspěšnosti a není těžké je replikovat.

National Repository of Grey Literature : 24 records found   1 - 10nextend  jump to record:
See also: similar author names
1 Veselý, Kamil
6 Veselý, Karel