National Repository of Grey Literature 216 records found  1 - 10nextend  jump to record: Search took 0.00 seconds. 
Automatic Creation of Organ Overtures for Church Songs
Maňák, Ondřej ; Černocký, Jan (referee) ; Fapšo, Michal (advisor)
The focus of this master's thesis is an automatic creation of organ overtures for church songs from both theoretical and practical points of view. Organ overture is a short introduction to a church song. According to the fact that it can be described by a finite set of rules, it is possible to use techniques for solving Constraint Satisfaction Problems. An effective instrument to develop such system can be C++ programming language and Gecode library.
Tone and Chord Recognition as an Android Application
Kucharovič, Oliver ; Černocký, Jan (referee) ; Szőke, Igor (advisor)
The aim of this work is to recognize tones and chords on any musical instrument using the microphone on Android mobile devices. The app scans or records the sounds which are analyzed. It writes to a visual representation which is similar to the musical notation. The work describes the problems of recognition and the solution of the problem using fast Fourier transformation and analysis of the spectrum of volumes. Work describes the theory of music and the training of individual tones. The application was subjected to user tests and recognition accuracy tests. The conclusion includes tests results and statistics from the Google Play publication.
Integration of Voice Technologies on Mobile Platforms
Černičko, Sergij ; Černocký, Jan (referee) ; Schwarz, Petr (advisor)
The goal of the thesis is being familiar with methods a techniques used in speech processing. Describe the current state of research and development of speech technology. Project and implement server speech recognizer that uses BSAPI. Integrate client that will use server for speech recognition to mobile dictionaries of Lingea company.
Improving Robustness of Speaker Recognition using Discriminative Techniques
Novotný, Ondřej ; Ferrer, Luciana (referee) ; Pollák, Petr (referee) ; Černocký, Jan (advisor)
Tato práce pojednává o využití diskriminativních technik v oblasti rozpoznávání  mluvčích za účelem získání větší robustnosti těchto systémů vůči vlivům negativně ovlivňující jejich výkonnost. Mezi tyto vlivy řadíme šum, reverberaci nebo přenosový kanál. Práce je rozdělena do dvou hlavních částí. V první části se věnujeme teoretickému úvodu do problematiky rozpoznávání mluvčích. Popsány jsou  jednotlivé kroky rozpoznávacího systému od extrakce akustických příznaků, extrakce vektorových reprezentací nahrávek, až po tvorbu finálního rozpoznávacího skóre. Zvláštní důraz je věnován technikám extrakce vektorové reprezentace nahrávky, kdy popisujeme dvě rozdílná paradigmata možného přístupu, i-vektory a x-vektory. Druhá část práce se již více věnuje diskriminativním technikám pro zvýšení robustnosti. Techniky jsou organizovány tak, aby odpovídaly postupnému průchodu nahrávky rozpoznávacím systémem.  Nejdříve je věnována pozornost  předzpracování signálu pomocí neuronové sítě pro odšumění a obohacení signálu řeči jako univerzální technice, která je nezávislá na následně použitém rozpoznávacím systému.  Dále se zameřujeme na využití diskriminativního přístupu při extrakci příznaků a extrakci vektorových reprezentací nahrávek. Práce rovněž pokrývá přechod od generativního paradigmatu k plně diskriminativnímu přístupu v systémech pro rozpoznávání mluvčích.  Veškeré techniky jsou následně vždy experimentálně ověřeny a zhodnocen jejich přínos. V práci je navrženo několik přístupů, které se osvědčily jak u generativního přístupu v podobě i-vektorů, tak i u diskriminativních x-vektorů, a díky nim bylo dosaženo významného zlepšení. Pro úplnost jsou, v oblasti problematiky robustnosti, do práce zařazeny i další techniky, jako je normalizace skóre, či více-scénářové trénování systémů. Závěrem se práce zabývá problematikou robustnosti diskriminativních systému z pohledu dat využitých při jejich trénování.
Chatbot Capable of Information Search
Ďurista, Michal ; Beneš, Karel (referee) ; Černocký, Jan (advisor)
Pojem ''chatbot'' je v dnešnej dobe umelej inteligencie veľmi populárny výraz. Chatbotov vidno stále viac a viac v biznis riešeniach dnešných firiem. Hlavným cieľom práce je vytvoriť algoritmus, ktorý je schopný vyťahovať informácie a implementovať ho do chatbota. Tieto informácie možno nájsť na webových stránkach reálneho zákazníka. Práca rovnako poskytuje prehľad súčasnej situácie chatbotov ako aj Microsoft technológií pre ich vývoj. Technické detaily na ktorých tieto technológie pracujú, predovšetkým spracovanie prirodzeného jazyka, sú taktiež zahrnuté. Práca popisuje implementáciu algoritmu ako aj chatbota samotného spolu s procesom testovania v skutočnom priemyselnom prostredí.
Automatic Link Detection in Parts of Audiovisual Documents
Sychra, Marek ; Černocký, Jan (referee) ; Szőke, Igor (advisor)
This paper deals with topic detection. Specifically link detection - finding similarities amongst a group of short documents according to their topic and story segmentation - finding borders between two topically different parts in a large document. The main motivation for research was practical application with the use of presentation materials from lectures at FIT (linking parts of different lectures and courses). The solution of link detection is achieved by text and word analysis, which includes learning the meaning and importance of each word. Story segmentation uses this while searching for the boundaries. Both parts of the problem (link detection, story segmentation) gave great results while testing with a standard dataset (world news reports). During evaluation of lecture processing the success rate was lower, but still good.
Web-Based Demo of Fourier Transform for Signal Processing Courses
Hyrš, Martin ; Plchot, Oldřich (referee) ; Černocký, Jan (advisor)
The aim of this work is to create a program demonstrating the Fourier transform. The introductory section summarizes the theory of Fourier transform and shows the procedure for its numerical approximation. The following chapter describes the existing applets. Subsequently, the concept of the demonstration and its implementation are described. The final part contains tutorial examples of using the application and summary of users' reactions.
Query-by-Example Spoken Term Detection
Fapšo, Michal ; Matoušek, Jindřich (referee) ; Metze, Florian (referee) ; Černocký, Jan (advisor)
Tato práce se zabývá vyhledáváním výrazů v řeči pomocí mluvených příkladů (QbE STD). Výrazy jsou zadávány v mluvené podobě a jsou vyhledány v množině řečových nahrávek, výstupem vyhledávání je seznam detekcí s jejich skóre a časováním. V práci popisujeme, analyzujeme a srovnáváme tři různé přístupy ke QbE STD v jazykově závislých a jazykově nezávislých podmínkách, s jedním a pěti příklady na dotaz. Pro naše experimenty jsme použili česká, maďarská, anglická a arabská (levantská) data, a pro každý z těchto jazyků jsme natrénovali 3-stavový fonémový rozpoznávač. To nám dalo 16 možných kombinací jazyka pro vyhodnocení a jazyka na kterém byl natrénovaný rozpoznávač. Čtyři kombinace byly tedy závislé na jazyce (language-dependent) a 12 bylo jazykově nezávislých (language-independent). Všechny QbE systémy byly vyhodnoceny na stejných datech a stejných fonémových posteriorních příznacích, pomocí metrik: nesdružené Figure-of-Merit (non pooled FOM) a námi navrhnuté nesdružené Figure-of-Merit se simulací normalizace přes promluvy (utterrance-normalized non-pooled Figure-of-Merit). Ty nám poskytly relevantní údaje pro porovnání těchto QbE přístupů a pro získání lepšího vhledu do jejich chování. QbE přístupy použité v této práci jsou: sekvenční statistické modelování (GMM/HMM), srovnávání vzorů v příznacích (DTW) a srovnávání grafů hypotéz (WFST). Abychom porovnali výsledky QbE přístupů s běžnými STD systémy vyhledávajícími textové výrazy, vyhodnotili jsme jazykově závislé konfigurace také s akustickým detektorem klíčových slov (AKWS) a systémem pro vyhledávání fonémových řetězců v grafech hypotéz (WFSTlat). Jádrem této práce je vývoj, analýza a zlepšení systému WFST QbE STD, který po zlepšení dosahuje podobných výsledků jako DTW systém v jazykově závislých podmínkách.
Visualization of User Pronunciations for Electronic Dictionarties
Pešán, Jan ; Chalupníček, Kamil (referee) ; Černocký, Jan (advisor)
The aim of this bachelor's work is to try to find a new way for development in learning capabilities of electronic dictionaries. There is an introduction of the main concept of learning pronunciations with visualization of phonemes in the first part. It is followed by chapter, which does a global review of methods for speech processing used in this project, e.g. HMM or Viterbi algorithm. In the third chapter, there is description of tools that we have used for implementation of the whole system. Next chapter explains more in detail technology of neural networks, used here as probability estimator. There is also a description of problem with compatibility of the used phoneme sets and in addition, it describes used phoneme models. Chapter 5 is whole about implementation of the system. There are also described scripts and tools applied for the preparation of the source data. In the next chapter, there is a user testing with screenshots. Moreover, in the last chapter I wrote a short conclusion and possible future ways for further developing of this system.
System for Recording and Repeating of Events for Sound Systems
Klobása, Jiří ; Černocký, Jan (referee) ; Zemčík, Pavel (advisor)
This thesis deals with the design and implementation of system for recording and repeating of events for audio systems. The introductory part is devoted to the study of sound systems, their user interfaces and communication protocols that are used by audio systems. Hereafter the description of essential features of Mac OS X, as well as the characteristic of its user interface and principles of development on this platform, are given. The core of the thesis consists of the design of system for recording and repeating of events and the concept of events which specifies the reprezentation of events in the system and their subsequent processing. In~the end of the thesis is presented the implementation of the designed system for Mac OS X with respect to possible extensions of the system and its features.

National Repository of Grey Literature : 216 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.