National Repository of Grey Literature 94 records found  beginprevious30 - 39nextend  jump to record: Search took 0.00 seconds. 
Acoustic Scene Classification from Speech
Dobrotka, Matúš ; Glembek, Ondřej (referee) ; Matějka, Pavel (advisor)
The topic of this thesis is an audio recording classification with 15 different acoustic scene classes that represent common scenes and places where people are situated on a regular basis. The thesis describes 2 approaches based on GMM and i-vectors and a fusion of the both approaches. The score of the best GMM system which was evaluated on the evaluation dataset of the DCASE Challenge is 60.4%. The best i-vector system's score is 68.4%. The fusion of the GMM system and the best i-vector system achieves score of 69.3%, which would lead to the 20th place in the all systems ranking of the DCASE 2017 Challenge (among 98 submitted systems from all over the world).
Automatic Creation of Dictionaries from Translations
Svoboda, František ; Matějka, Pavel (referee) ; Smrž, Pavel (advisor)
Goal of this thesis is to implement system, capable of extracting bilingual dictionaries from parallel texts. Reader may find examples of how to obtain such documents and description of steps leading to successfull acquirement of desired information. Mainly statistical machine translation methods were examined and used for this purpose. Besides description of created system, short analysis of problems linked with the subject can be found as well as evaluation of results.
PHONOTACTIC AND ACOUSTIC LANGUAGE RECOGNITION
Matějka, Pavel ; Sigmund, Milan (advisor)
Práce pojednává o fonotaktickém a akustickém přístupu pro automatické rozpoznávání jazyka. První část práce pojednává o fonotaktickém přístupu založeném na výskytu fonémových sekvenci v řeči. Nejdříve je prezentován popis vývoje fonémového rozpoznávače jako techniky pro přepis řeči do sekvence smysluplných symbolů. Hlavní důraz je kladen na dobré natrénování fonémového rozpoznávače a kombinaci výsledků z několika fonémových rozpoznávačů trénovaných na různých jazycích (Paralelní fonémové rozpoznávání následované jazykovými modely (PPRLM)). Práce také pojednává o nové technice anti-modely v PPRLM a studuje použití fonémových grafů místo nejlepšího přepisu. Na závěr práce jsou porovnány dva přístupy modelování výstupu fonémového rozpoznávače -- standardní n-gramové jazykové modely a binární rozhodovací stromy. Hlavní přínos v akustickém přístupu je diskriminativní modelování cílových modelů jazyků a první experimenty s kombinací diskriminativního trénování a na příznacích, kde byl odstraněn vliv kanálu. Práce dále zkoumá různé druhy technik fúzi akustického a fonotaktického přístupu. Všechny experimenty jsou provedeny na standardních datech z NIST evaluaci konané v letech 2003, 2005 a 2007, takže jsou přímo porovnatelné s výsledky ostatních skupin zabývajících se automatickým rozpoznáváním jazyka. S fúzí uvedených technik jsme posunuli state-of-the-art výsledky a dosáhli vynikajících výsledků ve dvou NIST evaluacích.
Detection of Pre-Recorded Messages in Speech
Boboš, Dominik ; Matějka, Pavel (referee) ; Černocký, Jan (advisor)
Rozpoznání před-nahraných zpráv v řeči (tzv. plechové huby) je užitečné pro jakékoliv následující dolování informací v řečových datech. Tato práce shrnuje teorii hledání podobných promluv v řeči a efektivní přístupy k porovnání dvou sekvencí. Ke zkoumání identifikace opakujících se informací v audiu je nutné mít velké množství dat s přesně se opakujícími úseky. Takovou datovou sadu jsme vygenerovali smícháním předem nahraných zpráv s telefonními hovory se změnami rychlosti, hlasitosti a opakování. Náš systém řeší scénáře "známých zpráv a "neznámých zpráv pomocí shlukování nebo detekce v blocích. Porovnali jsme techniky dynamického borcení času (DTW), přibližné shody řetězců a rekurentní kvantifikační analýzy, a nakonec jsme všechny uvedené techniky zkombinovali a získali tak přesný a efektivně pracující systém.
Customer Satisfaction Analysis of Company KomTeSa, spol. s r.o. and Recomentadions for its Improvement
Menšíková, Marie ; Matějka, Pavel (referee) ; Světlík, Jaroslav (advisor)
The diploma thesis deals with the analyzing of customers' satisfaction with products and service in general, afterwards focusing on the following application on KomTeSa, Ltd. The goal of the diploma thesis is to explain the basis and importance of this field, to analyze concrete companies' level of their own customers' satisfaction and, in consequence, to define a possible solution that can help each company both eliminate its weaknesses and satisfy the clients better.
Emotion Detection from Speech
Popková, Anna ; Fér, Radek (referee) ; Matějka, Pavel (advisor)
This Bachelor Thesis deals with research in the field of emotion recognition mainly from speech and marginally from other modalities (video and physiological data). It closely describes the topology of the systems built specifically for the subject of this work. Moreover, it describes experiments leading to optimized pre-processing, regressor training and post-processing. Data used for these research origins from evaluation AV+EC 2015. Results of fusion systems producing the most precise prediction were sent to this evaluation. The Bottle-Neck features are newly tested and combined favorably with commonly used eGeMAPS features for the recognition of arousal. For valence, two kinds of video features are used. Muli-task system (recognizing both valence and arousal) using Bottle-Neck features produces competitive results and is only 13 % relatively behind the mentioned fusion system. This is especially appealing for applications where only audio is available.
Voice Activity Detection
Ent, Petr ; Karafiát, Martin (referee) ; Matějka, Pavel (advisor)
Práce pojednává o využití support vector machines v detekci řečové aktivity. V první části jsou zkoumány různé druhy příznaků, jejich extrakce a zpracování a je nalezena jejich optimální kombinace, která podává nejlepší výsledky. Druhá část představuje samotný systém pro detekci řečové aktivity a ladění jeho parametrů. Nakonec jsou výsledky porovnány s dvěma dalšími systémy, založenými na odlišných principech. Pro testování a ladění byla použita ERT broadcast news databáze. Porovnání mezi systémy bylo pak provedeno na databázi z NIST06 Rich Test Evaluations.
Multilingual Phoneme Recognizer
Vobr, Vojtěch ; Matějka, Pavel (referee) ; Szőke, Igor (advisor)
Aim, of this master thesis is training of phoneme recognizer with phoneme set, which have been made by merging of several phoneme sets, which are containted in SpeechDat-E database and find out if this kind of recognizer will have better results than recognizers which were trained on one language. This work also deals with phoneme sets, principles of phoneme recognition using recognizers based on artifical neural networks, language identification and merging of given phoneme sets. Also is described process of training phoneme recognizer and phoneme recognition.
Compensation for damage and non-material damage claimed as a result of tax proceedings
Matějka, Pavel ; Marková, Hana (advisor) ; Martiník, Pavel (referee)
Compensation for damage and non-material damage claimed as a result of tax proceedings Abstract The diploma thesis is devoted to the issue of compensation for damage and non-material damage caused by an illegal decision or incorrect official procedure in the exercise of public authority by the bodies of the Financial Administration of the Czech Republic. Damage or non- material damage may arise as a result of tax proceedings, when a specific natural or legal person, with whom the proceedings were conducted, was in the procedural position of a tax subject. The field of tax proceedings is not simple in itself and in relation to the aforementioned compensation for damage or non-material damage, it is a relatively complex issue, not clarified in detail, and not understandable for everyone at first glance. Any natural or legal person who, from the position of a tax subject, incurs a tax obligation may encounter an illegal decision or an incorrect official procedure of the Financial Administration of the Czech Republic within the framework of life situations. The goal of this diploma thesis is therefore to clearly and comprehensibly approach the problem. This is mainly done by defining key concepts from the field of tax administration, which are relevant for understanding all contexts. This is followed by an...
High Level Analysis of the Psychotherapy Sessions
Polok, Alexander ; Karafiát, Martin (referee) ; Matějka, Pavel (advisor)
This work focuses on analyzing psychotherapy sessions within the DeePsy research project. This work aims to design and develop features that model the session dynamics, which can reveal seemingly subtle nuances. The mentioned features are automatically extracted from the source recording using neural networks. They are further processed, compared across sessions, and displayed graphically, creating a document that acts as a feedback document about the session for the therapist. Furthermore, this assistive tool can help therapists to professionally grow and to provide better psychotherapy in the future. A relative improvement in voice activity detection of 37.82% was achieved. The VBx diarization system was generalized to converge to two speakers with a minimum relative error rate degradation of 0.66%. An automatic speech recognition system has been trained with a 17.06% relative improvement over the best available hybrid model. Models for sentiment classification, type of therapeutic interventions, and overlapping speech detection were also trained.

National Repository of Grey Literature : 94 records found   beginprevious30 - 39nextend  jump to record:
See also: similar author names
10 MATĚJKA, Petr
10 Matějka, Petr
Interested in being notified about new results for this query?
Subscribe to the RSS feed.