Národní úložiště šedé literatury Nalezeno 13 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Generování kódu z textového popisu funkcionality
Kačur, Ján ; Ondřej, Karel (oponent) ; Smrž, Pavel (vedoucí práce)
Cieľom tejto práce bolo navrhnúť a implementovať systém na generovanie kódu z textového popisu funkcionality. Boli vypracované celkovo 2 systémy, prvý z nich slúžil ako kontrolný prototyp, a druhý ako reálny výstup práce. Zameral som sa na použitie nepredtrénovaných modelov s menšími rozmermi. Obidva systémy používali ako jadro model typu Transformer. Druhý systém využil na rozdiel od prvého syntaktický rozklad kódu aj textových popisov. Dáta pre obidva systémy pochádzali z projektu CodeSearchNet, cieľový jazyk pre generovanie bol jazyk Python. Druhý systém dosiahol lepšie číselné výsledky, ako prvý, s presnosťou predpovede slov 85%, zatiaľ čo prvý len 60%. Systém dokázal doplniť správny kód na dokončenie funkcie, s väčšou časovou odozvou. V tejto práci sa venujem takmer výlučne druhému systému.
Automatické hodnocení humoru
Katrňák, Josef ; Ondřej, Karel (oponent) ; Dočekal, Martin (vedoucí práce)
Cílem této práce je vytvoření systému pro automatické hodnocení humoru. Systém umožňuje predikovat vtipnost a kategorii pro vstup zadaný v angličtině. Hlavní podstatou je vytvoření klasifikátoru a trénování modelu na vytvořených datových sadách pro získání co nejlepších výsledků. Architektura klasifikátoru je založena na neuronových sítích. Systém zároveň obsahuje webové uživatelské rozhraní pro komunikaci s uživatelem. Výsledek je webová aplikace propojená s klasifikátorem umožňující hodnocení uživatelského vstupu a poskytování zpětné vazby od uživatelů.
Visual Question Answering
Kocurek, Pavel ; Ondřej, Karel (oponent) ; Fajčík, Martin (vedoucí práce)
Visual Question Answering (VQA) is a system where an image and a question are used as input and the output is an answer. Despite many research advances, unlike image captioning, VQA is rarely used in practice. This work aims to narrow the gap between research and practice. To examine the possibility of using VQA by blind and visually impaired people, this thesis proposes a demonstrative VQA application and then, a smartphone application. The study with 20 participants from the community was conducted. Firstly, the participants received an application for two weeks. Then, each of them was asked to fill out the questionnaire. 80 % of respondents rated the accuracy of VQA application as sufficient or better and most of them would appreciate it if their image captioning application also supported VQA. Following this discovery, this work tries to establish the link between image captioning and VQA. In particular, the work studies the informativeness provided by both systems in different scenarios. It collects a novel dataset of 111 images with manually annotated captions and diverse scenes. An experiment comparing obtained knowledge showed a success rate of 69.9 % and 46.2 % for VQA and image captioning, respectively. In another experiment 70.9 % of the time, participants were able to select the correct caption based on VQA. The results suggest that VQA outperforms image captioning regarding image details, therefore should be used in practice more often.
Klasifikace vztahů mezi pojmenovanými entitami v textu
Ondřej, Karel ; Doležal, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Tato diplomová práce se zabývá extrakcí vztahů mezi pojmenovanými entitami v textu. V teoretické části práce je rozebrána problematika reprezentace přirozeného jazyka pro strojové zpracování. Následně jsou definovány dvě dílčí úlohy extrakce vztahů, a to rozpoznávání pojmenovaných entit a klasifikace vztahu mezi nimi, včetně shrnutí dnešních nejmodernějších řešení. V praktické části práce je navržen systém pro automatickou extrakci vztahů mezi pojmenovanými entitami ze stažených webových stránek. Model pro klasifikaci vztahů mezi entitami je založen na předtrénovaném modelu sítě typu transfomers. V práci jsou porovnány čtyři předtrénované modely, a to BERT, XLNet, RoBERTa a ALBERT.
Inkrementální stahování webu pomocí systému Bubing
Ondřej, Karel ; Fajčík, Martin (oponent) ; Škoda, Petr (vedoucí práce)
Tato bakalářská práce se zabývá úpravou systému BUbiNG pro takzvané inkrementální stahování. V práci jsou dále popsány hlavní problémy spojené s inkrementálním stahováním internetu a využití dalších open-source systémů pro inkrementální stahování. Upravený systém podporuje opětovné navštěvování stránek pomocí dvou běžně používaných strategií. První ze strategií opětovně navštěvuje stránku vždy po stejném intervalu. Druhá strategie přizpůsobuje interval mezi návštěvami podle frekvence změn stránky.
Automated Truth Discovery
Kočí, Jan ; Ondřej, Karel (oponent) ; Fajčík, Martin (vedoucí práce)
This thesis aims to (i) better understand the biases and cues exploited by content-based methods in the text of fake news articles and (ii) evaluate their performance in predicting the reliability of articles and media sources. Two different models are implemented. The baseline model uses TF-IDF and Multinomial Naive Bayes (MNB) classifier. The second model uses the BERT transformer. To study the cues exploited in the text a method of interpretability is implemented. While MNB is interpretable by design, the BERT model is analyzed through the Integrated gradients explainability method. Both classifiers were trained on a modified version of the NELA-GT-2021 dataset. This thesis suggests application of preprocessing to this dataset which could lead to creating a more robust classifier, e.g., removing keywords that provide simple cues. This thesis also presents a novel FNI dataset consisting of 46 manually selected articles. The FNI dataset enables topic-wise analysis (on topics such as covid, football, science, politics, etc.). The analysis revealed several biases of the classifiers. The baseline model was not able to identify unreliable articles about football (0\% recall on the FNI dataset), reliable scientific articles (0\% recall on the FNI dataset), etc. Both classifiers were more successful in identifying unreliable articles with the BERT classifier having a recall of 91\% on unreliable and only 78\% on reliable articles in the FNI dataset. The methods of interpretability also performed better on unreliable articles and were able to identify the sensationalism and shocking headlines used in fake news. The classifiers are also used to predict the credibility of sources. The results are compared with a state-of-the-art method that employs a different approach of using mutual citations of sources to predict their credibility. One of the outcomes of this thesis is also a new challenge set, containing articles from the NELA dataset on which the classifiers failed. This challenge set can be used for future research in this area.
Rozhraní pro zobrazování radarových dat a propojení se simulátorem řízení leteckého provozu
Buchníčková, Tereza ; Ondřej, Karel (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je vytvořit aplikaci pro výuku začínajících pracovníků řízení letového provozu. Systém je implementován jako webová aplikace v jazyce JavaScript s použitím knihoven JQuery a Leaflet. Serverová část je napsána v jazyce Python a využívá knihovnu BlueSky pro simulaci letového provozu. Práce obsahuje teoretickou část, návrh řešení a popis implementace. Výsledkem je aplikace, která nabízí zobrazení aktuálního letového provozu nebo v ní uživatel v roli řídícího letového provozu může na simulovaném letovém provozu trénovat komunikaci s pilotem. Aplikace umožňuje nahrávání hlasové komunikace a pomocí propojení se systémem rozpoznání řeči tuto komunikaci převádí do textu, který se zobrazuje na obrazovce. Kromě podpory výuky pracovníků letového provozu tato aplikace také slouží jako demonstrace výsledků výzkumných skupin KnoT a Speech z Fakulty informačních technologií VUT v Brně.
Relation Extraction from Text
Královič, Kristián ; Ondřej, Karel (oponent) ; Smrž, Pavel (vedoucí práce)
This bachelor thesis focuses on the extraction of semantic relations between named entities in natural text using learning with a small number of supporting examples. The theoretical part of the thesis introduces methods for natural language representation using dense vectors and named entity recognition. Next, deep learning based approaches for semantic relation extraction are described. The theoretical part also includes a description of learning with a small number of training examples in the context of semantic relation extraction In the implementation part, a system for extracting semantic relations from text has been proposed. The system uses pairwise classifiers based on pre-trained language models like transformers to classify the relations. For the purpose of this work, the ELECTRA-PAIR, RoBERTa-PAIR and BERT-PAIR models were trained. In the experimental part of the thesis, these models are evaluated over different datasets. The experimental part also includes experiments aimed at classifying more complex semantic relations.
Generování kódu z textového popisu funkcionality
Kačur, Ján ; Ondřej, Karel (oponent) ; Smrž, Pavel (vedoucí práce)
Cieľom tejto práce bolo navrhnúť a implementovať systém na generovanie kódu z textového popisu funkcionality. Boli vypracované celkovo 2 systémy, prvý z nich slúžil ako kontrolný prototyp, a druhý ako reálny výstup práce. Zameral som sa na použitie nepredtrénovaných modelov s menšími rozmermi. Obidva systémy používali ako jadro model typu Transformer. Druhý systém využil na rozdiel od prvého syntaktický rozklad kódu aj textových popisov. Dáta pre obidva systémy pochádzali z projektu CodeSearchNet, cieľový jazyk pre generovanie bol jazyk Python. Druhý systém dosiahol lepšie číselné výsledky, ako prvý, s presnosťou predpovede slov 85%, zatiaľ čo prvý len 60%. Systém dokázal doplniť správny kód na dokončenie funkcie, s väčšou časovou odozvou. V tejto práci sa venujem takmer výlučne druhému systému.
Automatické hodnocení humoru
Katrňák, Josef ; Ondřej, Karel (oponent) ; Dočekal, Martin (vedoucí práce)
Cílem této práce je vytvoření systému pro automatické hodnocení humoru. Systém umožňuje predikovat vtipnost a kategorii pro vstup zadaný v angličtině. Hlavní podstatou je vytvoření klasifikátoru a trénování modelu na vytvořených datových sadách pro získání co nejlepších výsledků. Architektura klasifikátoru je založena na neuronových sítích. Systém zároveň obsahuje webové uživatelské rozhraní pro komunikaci s uživatelem. Výsledek je webová aplikace propojená s klasifikátorem umožňující hodnocení uživatelského vstupu a poskytování zpětné vazby od uživatelů.

Národní úložiště šedé literatury : Nalezeno 13 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.