Národní úložiště šedé literatury Nalezeno 54 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Podpora hry Krycí jména na mobilním telefonu s OS Android
Grossmann, Jan ; Fajčík, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
Tato bakalářská práce se zabývá tvorbou aplikace pro podporu hraní společenské hry Krycí jména pro zařízení s operačním systémem Android. Aplikace pomáhá uživateli se strategií a usnadňuje rozhodování při podávání nápovědy. V práci nejprve probírám stávající řešení a jejich nedostatky. Na základě těchto poznatků rozebírám navržené řešení a poté i samotnou implementaci pomocí programovacího jazyka Java, do které patří uložení dat pomocí databázového systému nebo také rozpoznávání obrazu. Závěrem provádím a detailně popisuji uživatelské testování a důležité poznatky z něho vyplývající.
Inkrementální stahování webu pomocí systému Bubing
Ondřej, Karel ; Fajčík, Martin (oponent) ; Škoda, Petr (vedoucí práce)
Tato bakalářská práce se zabývá úpravou systému BUbiNG pro takzvané inkrementální stahování. V práci jsou dále popsány hlavní problémy spojené s inkrementálním stahováním internetu a využití dalších open-source systémů pro inkrementální stahování. Upravený systém podporuje opětovné navštěvování stránek pomocí dvou běžně používaných strategií. První ze strategií opětovně navštěvuje stránku vždy po stejném intervalu. Druhá strategie přizpůsobuje interval mezi návštěvami podle frekvence změn stránky.
Recommender System for Web Articles
Kočí, Jan ; Kesiraju, Santosh (oponent) ; Fajčík, Martin (vedoucí práce)
Recommender systems for web articles are the main interest of this thesis. It explains the most popular approaches used to build these systems, proposes a neural-network-based architecture applying the Skip-gram inspired negative sampling method to the recommendation problem, implements this architecture together with several other models, using Singular value decomposition, collaborative filtering with Alternating Least Squares (ALS) algorithm and a content-based approach using the Doc2Vec algorithm to create document vectors from the obtained articles. Finally, it implements three evaluation metrics - namely the RANK metric, Recall at k and Precision at k - and compares the models with state-of-the-art. Apart from that it also gives a brief discussion on the role and purpose of these systems together with the motivation of using them.
Odhad emocí z textu
Dufková, Aneta ; Fajčík, Martin (oponent) ; Szőke, Igor (vedoucí práce)
Tato práce popisuje proces odhadování emocí z textu, při němž je využíváno strojové učení. Proces začíná průzkumem používaných metod, pokračuje výběrem vhodné metody a experimentováním. Využívá několik datových sad, kombinuje je a zkouší různé techniky předzpracování textu. Závěrem je webové rozhraní, které využívá předtrénovaný model a umožňuje detekovat emoce z příspěvků z Twitteru.
Stylized Natural Language Generation in Dialogue Systems
Bolshakova, Ksenia ; Kesiraju, Santosh (oponent) ; Fajčík, Martin (vedoucí práce)
This thesis explores approaches of generating natural language in various styles. In addition, it also explores the model's ability to control the strength of style manifestation in a generated sequence. The model for natural language generation was implemented with several aspects of style manifestation, namely poetry, humor, sentiment and specificity. Beam search and Nucleus sampling were used as decoding strategies of language models. The proposed experiments are based on weighted decoding. In particular, the probability mass function computed via language model that generates response is modified via two approaches. The first approach uses manually crafted features, such as NIDF. The second one uses neural probabilistic language models trained on stylistic datasets. The architecture of the model is presented in two versions. The first one is a LSTM-based baseline and the second one uses state-of-the-art pre-trained models BART and GPT-2 for text generation. The experiments have revealed the problem that even current state-of-the-art models suffer from poor trade-off estimation between the style and the context. In other words, the more the style is manifested in the generated sequence, the less it relates to the topic discussed in the dialogue.
Generating Code from Textual Description of Functionality
Šamánek, Jan ; Fajčík, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
As machine learning and neural network models continue to grow, there is an increasing demand for GPU-accelerated resources and algorithms to support them. Large language models have the potential to assist with this task, as they are already used as coding assistants for popular programming languages. If these models could also learn less commonly used paradigms like CUDA, they could help develop and maintain the necessary systems. This thesis aims to explore the capabilities of modern language models for learning CUDA as a programming paradigm and creating a training corpus specifically for this purpose.
Automated Truth Discovery
Kočí, Jan ; Ondřej, Karel (oponent) ; Fajčík, Martin (vedoucí práce)
This thesis aims to (i) better understand the biases and cues exploited by content-based methods in the text of fake news articles and (ii) evaluate their performance in predicting the reliability of articles and media sources. Two different models are implemented. The baseline model uses TF-IDF and Multinomial Naive Bayes (MNB) classifier. The second model uses the BERT transformer. To study the cues exploited in the text a method of interpretability is implemented. While MNB is interpretable by design, the BERT model is analyzed through the Integrated gradients explainability method. Both classifiers were trained on a modified version of the NELA-GT-2021 dataset. This thesis suggests application of preprocessing to this dataset which could lead to creating a more robust classifier, e.g., removing keywords that provide simple cues. This thesis also presents a novel FNI dataset consisting of 46 manually selected articles. The FNI dataset enables topic-wise analysis (on topics such as covid, football, science, politics, etc.). The analysis revealed several biases of the classifiers. The baseline model was not able to identify unreliable articles about football (0\% recall on the FNI dataset), reliable scientific articles (0\% recall on the FNI dataset), etc. Both classifiers were more successful in identifying unreliable articles with the BERT classifier having a recall of 91\% on unreliable and only 78\% on reliable articles in the FNI dataset. The methods of interpretability also performed better on unreliable articles and were able to identify the sensationalism and shocking headlines used in fake news. The classifiers are also used to predict the credibility of sources. The results are compared with a state-of-the-art method that employs a different approach of using mutual citations of sources to predict their credibility. One of the outcomes of this thesis is also a new challenge set, containing articles from the NELA dataset on which the classifiers failed. This challenge set can be used for future research in this area.
Cross Lingual News Article Classification and Automatic Topic Discovery Using Multilingual Language Models
Dufková, Aneta ; Fajčík, Martin (oponent) ; Kesiraju, Santosh (vedoucí práce)
The goal of this thesis is to perform cross-lingual classification and automatic topic discovery of news articles using pre-trained multilingual language models. For this task, no large multilingual dataset is available, so the first contribution of this thesis is to create one. The other aim of this thesis is to benchmark multilingual embedding models LaBSE and LASER2 in a classification task. This is done through various experiments, such as training on a limited number of articles and naturally zero-shot learning. Then, a topic discovery is performed so that an article can be represented not only by categories but also by the most representative words. Lastly, the results of classification and topic discovery are visualized in a simple web application.
Designing a Multilingual Fact-Checking Dataset from Existing Question-Answering Data
Kamenický, Daniel ; Aparovich, Maksim (oponent) ; Fajčík, Martin (vedoucí práce)
This thesis adresses the lack of multilingual fact-Checking datasets, which contain annotated evidence grounding the supporting or refuting verdict for a fact. Therefore, this work explores the conversion into the fact-checking dataset from an already existing question-answering dataset. In this work, two approaches for converting question-answer pairs into claims are studied. The first approach is to create a dataset based on a monolingual pre-trained seq-2-seq model T5. The model is trained on an English dataset and the inputs and outputs are translated into the desired languages. The second approach is to use the multilingual mT5 model, which can take input and generate output in the desired language. For multilingual model, training datasets need to be translated. The main problem of this work is the machine translation, which achieved around 30 % success rate in a low-resource languages. The experiments showed better results for claims generated from monolingual model using machine translation. On the other hand, the claims generated from multilingual model achieved a success rate of 73 % compared to monolingual model with a success rate of 88 %. Finally, to analyze possible biases label specific claim biases, a logistic-regression based TF-IDF classifier is trained. The classifier, that computes the probability of the claim's veracity just from itself achieves accuracy close to 0.5 for both converted datasets. Thus the converted datasets can be challenging for fact-checking models.
Komunikační agent pro informace o Brně
Křištof, Jiří ; Fajčík, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je implementace komunikačního agenta poskytující informace o Brně. Komunikační agent využívá třívrstvé architektury. Pro vlastní odpovídání na otázky jsou použity techniky strojového učení a neuronových sítí. Na základě provedeného testu bylo se systémem spokojeno 58 % respondentů, s přesností odpovědí poté 84 % uživatelů. Přínosem této práce je usnadnění získávání informací o Brně jeho obyvatelům i návštěvníkům.

Národní úložiště šedé literatury : Nalezeno 54 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.