Národní úložiště šedé literatury Nalezeno 13 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Generating Documentation to Source Code in Python
Novosád, Juraj ; Nosko, Svetozár (oponent) ; Smrž, Pavel (vedoucí práce)
The aim of this work is to adapt selected language models on domain data and to develop a system that would allow their use on commonly available hardware. The models have been adapted to generate documentation for undocumented source code in the Python progra- mming language to follow the Google Style convention. A prerequisite of model adaptation was to obtain domain data and process it appropriately for the purpose of model fine-tuning. This work focuses on fine-tuning models with fewer than one billion parameters, for the sake of enabling inference even on commonly available hardware. Part of the work was to objectively evaluate the quality of the adapted models. For this reason, I developed a tool that evaluates the quality of the generated documentation on a selected corpus of models. The evaluation of the adapted models showed that they achieve comparable performance to multiply larger models for general tasks, such as gpt-3.5-turbo-0125. The result of this work is a server capable of horizontal scaling that integrates the capabilities of more than just the adapted models through an easy-to-use API.
Statistický strojový překlad mezi češtinou a slovenštinou
Astaloš, Lukáš ; Kouřil, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem téhle práce je navrhnout, implementovat a vyhodnotit úspěšnost vytvořeného systému pro překlad českých textů do slovenštiny. Popisuje teoretické základy statistického strojového překladu a pak samotnou fázi návrhu a vývoje systému. Zvolenou strategií bylo použít jeden rozsáhlý paralelní korpus v kombinaci s jazykovým modelem poskytovaným místním jazykovědným ústavem pro vytvoření překladového modelu založeném na frázích. Pro tenhle účel byl použit nástroj Moses. Experimentálně byl otestován také slovníkový překlad neznámých slov použitím stemmování. Úspěšnost systému byla vyhodnocena metrikou BLEU, přičemž dosažené výsledky byly porovnatelné s jinými systémy.
Chatbot postavený na umělých neuronových sítích
Richtarik, Lukáš ; Beneš, Karel (oponent) ; Szőke, Igor (vedoucí práce)
Táto práca sa zaoberá problematikou chatbotov postavených na umelých neurónových sieťach a generatívnych modeloch. Popisuje postup a možnosti pri návrhu takéhoto chatbota a taktiež samotnú implementáciu a testovanie pomocou BLEU metriky. Práca obsahuje experimenty s rôznymi modelmi chatbotov, ich vyhodnotenie a porovnanie, testovanie na užívateľoch a niekoľko návrhov na budúce vylepšenia.
Překladač z češtiny do slovenštiny
Mydliar, Ján ; Kouřil, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Tato diplomová práce se věnuje tvorbě překladového systému pro překlad z češtiny do slovenštiny. První kapitola pojednává o motivaci k tvorbě práce, druhá o strojovém překladu a jeho různých typech. Třetí kapitola obsahuje přehled metod pro hodnocení kvality strojového překladu. Čtvrtá kapitola se věnuje návrhu a realizaci překladového systému, zejména přípravě paralelních korpusů. Pátá kapitola pojednává o testovaní a vyhodnocení vytvořeného systému.
Strojový překlad pomocí umělých neuronových sítí
Holcner, Jonáš ; Beneš, Karel (oponent) ; Szőke, Igor (vedoucí práce)
Cílem této práce je popsat a vytvořit systém pro strojový překlad textu postavený na rekurentních neuronových sítích. K tomu je použita architektura enkodér-dekodér umožňující překlad po celých větách. Výsledkem je knihovna nmt, určená k provádění experimentů s různými parametry modelu. Jejich výsledky jsou porovnány vůči systému postavenému na nástroji pro statistický překlad Moses.
Czech-English Translation
Petrželka, Jiří ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
This Master's thesis describes the principles of statistical machine translation and demonstrates how to assemble the Moses statistical machine translation system. In the preparation step, a research on freely available bilingual Czech-English corpora is done. An empirical analysis of time requirements of multithreaded word alignment tools demonstrates that MGIZA++ can achieve a five-fold speed-up, while PGIZA++ can reach an eight-fold speed-up (compared to GIZA++).Three scenarios of morphological pre-processing of Czech training data are tested, using simple unfactored models. While pure lemmatization can aggravate the BLEU, more sophisticated approaches usually raise BLEU. The positive effect of morphological pre-processing diminishes as corpus size rises. The relation between other corpora characteristics (size, genre, extra data) and the resulting BLEU are empirically gauged. A final system is trained on the CzEng 0.9 corpus and evaluated on the testing set from WMT 2010 workshop.
Sumarizace českých textů z více zdrojů
Brus, Tomáš ; Bojar, Ondřej (vedoucí práce) ; Mareček, David (oponent)
Diplomová práce se zabývá problémem sumarizace sady článků na dané téma. Rozebírá několik možných způsobů sestavování sumarizace a způsoby vyhodnocení jejich výsledků. Součástí práce je implementace popsaných algoritmů a jejich aplikace na vybrané texty. Ty pocházejí z~českých zpravodajských webových serverů a jsou reprezentovány formálně pomocí hloubkové syntaxe (tektogramatická rovina).
Chatbot postavený na umělých neuronových sítích
Richtarik, Lukáš ; Beneš, Karel (oponent) ; Szőke, Igor (vedoucí práce)
Táto práca sa zaoberá problematikou chatbotov postavených na umelých neurónových sieťach a generatívnych modeloch. Popisuje postup a možnosti pri návrhu takéhoto chatbota a taktiež samotnú implementáciu a testovanie pomocou BLEU metriky. Práca obsahuje experimenty s rôznymi modelmi chatbotov, ich vyhodnotenie a porovnanie, testovanie na užívateľoch a niekoľko návrhov na budúce vylepšenia.
Strojový překlad pomocí umělých neuronových sítí
Holcner, Jonáš ; Beneš, Karel (oponent) ; Szőke, Igor (vedoucí práce)
Cílem této práce je popsat a vytvořit systém pro strojový překlad textu postavený na rekurentních neuronových sítích. K tomu je použita architektura enkodér-dekodér umožňující překlad po celých větách. Výsledkem je knihovna nmt, určená k provádění experimentů s různými parametry modelu. Jejich výsledky jsou porovnány vůči systému postavenému na nástroji pro statistický překlad Moses.
Sumarizace českých textů z více zdrojů
Brus, Tomáš ; Bojar, Ondřej (vedoucí práce) ; Mareček, David (oponent)
Diplomová práce se zabývá problémem sumarizace sady článků na dané téma. Rozebírá několik možných způsobů sestavování sumarizace a způsoby vyhodnocení jejich výsledků. Součástí práce je implementace popsaných algoritmů a jejich aplikace na vybrané texty. Ty pocházejí z~českých zpravodajských webových serverů a jsou reprezentovány formálně pomocí hloubkové syntaxe (tektogramatická rovina).

Národní úložiště šedé literatury : Nalezeno 13 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.