National Repository of Grey Literature 59 records found  1 - 10nextend  jump to record: Search took 0.00 seconds. 
Framework for event modeling a prediction in football.
Geffert, Maroš ; Beneš, Karel (referee) ; Szőke, Igor (advisor)
This thesis investigates current methods of predicting football events such as the number of goals in a match, the outcome of a match, or whether both teams will score. The models analyzed were neural network, RandomForest and XGBoost. Extensive historical data on matches and players were collected as part of the work. The main objectives were to determine whether detailed statistics significantly affect prediction, to evaluate the effectiveness of using betting odds as features, to investigate the impact of historical data on the quality of predictions, and to determine whether success can be achieved in the betting market with such models. The results showed that detailed statistics improve the accuracy of the predictions, but the use of odds as features generally degrades the predictions. The results regarding the use of historical data for predictions were inconclusive. RandomForest and neural network models achieved promising results with ROI of 32.38% and 29.04%, respectively.
Aligning pre-trained models for spoken language translation
Sedláček, Šimon ; Beneš, Karel (referee) ; Kesiraju, Santosh (advisor)
Tato práce zkoumá nový end-to-end přístup k překladu mluveného jazyka (ST) využívající předtrénovaných modelů pro přepis řeči (ASR) a strojový překlad (MT), propojené malým spojovacím modulem (Q-Former, STE). Ten má za úkol překlenout mezeru mezi modalitami řeči a textu mapováním embedding reprezentací ASR enkodéru do latentního prostoru reprezentací MT modelu. Během trénování jsou zvolené ASR a MT model zmrazeny, laděny jsou pouze parametry spojovacího modulu. Trénování a evaluace jsou prováděny na datasetu How2, obsahujícím ST data z Angličtiny do Portugalštiny. V našich experimentech zjišťujeme, že většina sladěných systémů překonává referenční kaskádový ST systém, přičemž využívají stejné základní modely. Navíc, při zachování konstantní a ve srovnání malé (10M parametrů) velikosti spojovacího modulu, větší a silnější ASR a MT modely univerzálně zlepšují výsledky překladu. Zjišťujeme, že spojovací moduly mohou také sloužit jako doménové adaptéry pro zvolené základní systémy, kdy významně zlepšují výsledky překladu ve sladěném ST prostředí, a to i oproti holému MT výkonu daného MT modelu. Nakonec navrhujeme proceduru pro předtrénování spojovacího modulu s potenciálem snížit množství ST dat potřebných pro trénink obdobných sladěných systémů.
Large Language Models in Speech Recognition
Tomašovič, Martin ; Polok, Alexander (referee) ; Beneš, Karel (advisor)
Táto práca má za cieľ preskúmať, v akých podmienkach veľké jazykové modely vylepšujú prepisy automatického rozpoznávania reči. Konkrétne sa zameriava na preskórovanie n-najlepších hypotéz pomocou maskovaných aj autoregresívnych jazykových modelov. Pomocou nich sa každej hypotéze priradí skóre, ktoré sa následne interpoluje so skórami získanými zo systému prepisu reči. Tento postup som testoval naprieč datasetmi a rôznymi systémami pre prepis reči s rôznym nastavením. Výsledky vykazujú, že preskórovanie znižuje mieru chybovosti hypotéz získaných z modelov Wav2Vec 2.0 a Jasper. Dotrénovanie modelov sa overilo byť veľmi prospešné pri danej úlohe. Menšie dotrénované modely prekonali väčšie nedotrénované pri preskórovaní. Výsledky tejto práce prispievajú k lepšiemu porozumeniu, v akých podmienkach použiť jazykový model (autoregresívny, maskovaný) pri preskórovaní prepisov reči. Táto práca skúma vplyv dotrénovania, normalizácie a rozdelenia skóre z CTC dekodéra, na zníženie miery chybovosti slov.
Segmentation of logical units in text
Kostelník, Martin ; Kišš, Martin (referee) ; Beneš, Karel (advisor)
Cílem projektu bylo vytvořit systém pro automatickou segmentaci textu do logických celků. Práce staví na systému PERO-OCR a cílí na zlepšení zpracovávání českých historických dokumentů a jejich vyhledávačů používaných knihovníky a vědci. Práce zahrnovala vytvoření a anotace vlastní datové sady složené celkem z 4044 stránek z knih, slovníků a novin. K problému segmentaci textu je přistoupeno inovativních přístupem, kdy je brán jako shlukovací problém jednotlivých řádků textu. Metoda je dvoufázová: nejprve probíhá detekce regionů textu pomocí modelu YOLOv8 a následuje jejich spojení grafovou neuronovou sítí. Vyhodnocení je provedeno pomocí shlukovací metriky V-measure a na testovacím datasetu dosahuje hodnot 77.93 % pro knihy, 95.79 % pro slovníky a 90.23 % pro noviny.
Text to Audio Alignment
Šikula, Vojtěch ; Beneš, Karel (referee) ; Szőke, Igor (advisor)
This bachelors thesis is dealing with text to audio alignment. I present here works which are dealing with same problem. For evaluation have been used data from MGB Challenge 2015. Technique used here is using phoneme transcription and its alignment with transcript. Alignment was done with different models. The best results have been achieved by intersection of two alignments from models from good records.
Comparison of Two Audio Examples as an Android Application
Zhantemirov, Sultan ; Beneš, Karel (referee) ; Szőke, Igor (advisor)
This bachelor thesis deals with an implementation of an Android application for comparison of two audio examples by using special technics. The goal of the fnal program is a simple demonstration of comparison algorithm and it’s acceleration. The frst part of this thesis is concerned with theoretical analysis and suggestion for the comparison, while following parts review implementation, acceleration and testing of the algorithm in scope of final demo application.
Chatbot Based on Artificial Neural Networks
Čechák, Jiří ; Beneš, Karel (referee) ; Szőke, Igor (advisor)
The thesis describes an implementation and the way generative chatbot operates. The chatbot was implemented in Python using artificial neural networks and is based on a sequence-to-sequence principle. The final chatbot contains three models, which can be trained and used for conversations in a created GUI. After training of all three models, the chatbot was then tested by using BLEU metric. It was also tested by some users who compared the quality of its generated answers with the quality of answers created by already an existing chatbot Cleverbot. For a better understanding of the given problematics, there is a simple description of the basic terms, such as artificial intelligence, artificial neural networks, the difference between closed and open domain, word embedding and a basic description of the chatbots and their types, including their advantages, disadvantages and usage.
Chatbot Capable of Information Search
Ďurista, Michal ; Beneš, Karel (referee) ; Černocký, Jan (advisor)
Pojem ''chatbot'' je v dnešnej dobe umelej inteligencie veľmi populárny výraz. Chatbotov vidno stále viac a viac v biznis riešeniach dnešných firiem. Hlavným cieľom práce je vytvoriť algoritmus, ktorý je schopný vyťahovať informácie a implementovať ho do chatbota. Tieto informácie možno nájsť na webových stránkach reálneho zákazníka. Práca rovnako poskytuje prehľad súčasnej situácie chatbotov ako aj Microsoft technológií pre ich vývoj. Technické detaily na ktorých tieto technológie pracujú, predovšetkým spracovanie prirodzeného jazyka, sú taktiež zahrnuté. Práca popisuje implementáciu algoritmu ako aj chatbota samotného spolu s procesom testovania v skutočnom priemyselnom prostredí.
Artificial Poet
Bančák, Michal ; Szőke, Igor (referee) ; Beneš, Karel (advisor)
The paper presents a work on automatic poetry generation using the Long Short-TermMemory recurrent neural network. The aim of this work is to create an application thatimitates the writing of poems. This is a character-level language modeling in the Slovaklanguage. The neural network model used in the work consists of three layers of LSTM,with 400 hidden units. A collection of poems in the Slovak language with a size of 900k characters was also created for this work. . The final model is generating text that has poemelements. Achieved accuracy of generation is 41.85%.
Finite State Grammars and Language Models for Automatic Speech Recognition
Beneš, Karel ; Glembek, Ondřej (referee) ; Hannemann, Mirko (advisor)
Tato práce se zabývá transformací bezkontextových gramatik na váhované konečně stavové převodníky. Je vybrána podmnožina bezkontextových gramatik, kterou lze tranformovat přesně. Je představen test, zda daná gramatika naleží do této podmnožiny, i algoritmus převodu. Dále je popsán vlastní nástroj, který tyto postupy implementuje, včetně způsobu zpracování vstupu a výstupu. S použitím toho nástroje byl vytvořen systém rozpoznání řeči pro kokpit letadla. Jsou představeny výsledky ukazující, že systém založený na takto získaném modelu jazyka podává výrazně lepší výkon, než je dosažen při použití obecného modelu.

National Repository of Grey Literature : 59 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.