Národní úložiště šedé literatury Nalezeno 35 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Object layout in a 2D room based on text description
Pavelka, Jan ; Rosa, Rudolf (vedoucí práce) ; Kasner, Zdeněk (oponent)
Tato práce řeší úlohu generování strukturovaného popisu 2D plánu místnosti z ptačí perspektivy na základě textového popisu v češtině. Zaměřuje se na identifikaci fyzick- ých objektů a jejich vzájemných relativních poloh ve vstupním popisu. Dále popisuje lingvistické jevy související s touto úlohou a jejich využití v implementaci. Ukazuje, jak lze při řešení úlohy využít syntaktické parsování. Pomocí genetického algoritmu hledá použitelné rozmístění extrahovaných objektů s ohledem na prostorové omezující pod- mínky zkonstruované z extrahovaných informací. 1
Automatic inflection in Czech language
Sourada, Tomáš ; Rosa, Rudolf (vedoucí práce) ; Vidra, Jonáš (oponent)
Tato bakalářská práce se zaměřuje na automatické skloňování českých podstatných jmen, zejména slov, která nejsou zahrnuta ve slovníku (tzv. out- of-vocabulary, OOV) - skloňovánípředem neviděných slov. Automaticky jsme extrahovali rozsáhlý dataset vhodný pro trénování a vyhodnocení za OOV podmínek. Dále jsme manuálně vytvořili dataset vyskloňovaných reálných OOV slov - neologismů. Vyvinuli jsme tři různé systémy: retrográdní model založený na algoritmu k-nejbližších sousedů (kNN) a dva modely sequence- to-sequence (seq2seq) založené na LSTM a Transformeru. V porovnání se stávajícím skloňovacím systémem sklonuj.cz a standardními baseline systémy ze SIGMORPHON shared tasks jsme za OOV podmínek s naším seq2seq mo- delem dosáhli nejlepších výsledků. Dále jsme dosáhli state-of-the-art výsledků pro 6 ze 16 vývojových (development) jazyků zahrnutých v datech SIGMOR- PHON 2022 shared task, při vyhodnocení za OOV podmínek (feature over- lap condition) a při trénování na větším datasetu (large data condition). Na datasetu reálných OOV slov byly všechny neuronové modely překonány retrográdním modelem, který dosahuje výsledků srovnatelných s neneuro- novým SIGMORPHON baseline systémem. Představujeme a zveřejňujeme...
Vývoj mobilní aplikace a generátoru otázek pro hru Desítka
Tomiška, Tadeáš ; Mareček, David (vedoucí práce) ; Rosa, Rudolf (oponent)
Tato bakalářská práce se zaměřuje na vytvoření mobilní aplikace pro Android. Apli- kace umožní hrát online verzi hry Desítka od společnosti Mindok. Součástí práce je i vy- tvoření otázek pro hru. Ty budou generovány pomocí webových stránek z Wikipedie. Pro získání potřebných dat bude použita technika parsování stránek. Aplikace bude napsána v jazyce Java a bude určena pro Android verze 10 a vyšší. Pro komunikaci mezi zaříze- ními bude použita client-server architektura. Komunikačním prostředkem bude techno- logie wifi. Aplikace bude mít stejná pravidla jako hra Desítka a bude podporovat 2 herní režimy. Půjde hrát v režimu online s ostatními hráči nebo v režimu friend s přáteli. 1
Tackling Hallucinations in Chart Summarization
Obaid ul Islam, Saad ; Dušek, Ondřej (vedoucí práce) ; Rosa, Rudolf (oponent)
Thesis Abstract Saad Obaid ul Islam Charles University, Saarland University Title Tackling Hallucinations in Chart Summarization Abstract Information visualizations like bar charts, line charts, and pie charts are a common way of communicating quantitative data. They are used to get important insights and make well informed decisions. Automatic Chart Summarization is the task to explain and summarize the key takeaways from the chart. Like other natural language generation (NLG) systems, chart summarization systems suffer from a phenomenon called halluci- nations. Hallucinations occur when the system generates text that is not grounded in the input. In this research work, we try to tackle the problem of hallucinations in chart summarization. Our analysis shows that a lot of additional information is present in the training data that leads to hallucinations during inference. We also found out that reducing long distance dependencies and addition of chart related information like title and legends improve the overall performance of the system. Furthermore, we propose a natural language inference (NLI) based method to clean the training data and show that our method produces faithful summaries. 1
Automatic extraction of the main characters from books and their interactions
Brezinová, Viktória ; Mareček, David (vedoucí práce) ; Rosa, Rudolf (oponent)
Cieľom tejto práce bolo automaticky nájsť pomenované postavy v knihách, nájsť všetky ich výskyty a určiť všetky miesta v texte, na ktorých spolu interagovali dve alebo viacero postáv. Jedným z výstupov tejto práce je nástroj na zobrazovanie interaktívnych grafov, na ktorom môžeme vidieť výskyty a interakcie postáv v knihe. Pomocou tohto nástroja môžeme hľadať a analyzovať miesta v texte, na ktorých je výskyt alebo inte- rakcia postáv, keďže grafy sú prepojené s textom knihy. Tiež sme vyhodnotili použité metódy na dátach, ktoré sme predtým nevideli, analyzovali sme chyby a navrhli sme možné vylepšenia, ktoré by mohli byť v budúcnosti preskúmané. 1
Automatic generation of medical reports from chest X-rays in Czech
Chaloupský, Lukáš ; Rosa, Rudolf (vedoucí práce) ; Libovický, Jindřich (oponent)
Tato práce se zabývá problémem automatického generovaní lékařských zpráv v českém jazyce na základě vstupních rentgenových snímků hrudníku pomocí hlubokých neurono- vých sítí. První část se zabývá analýzou problému samotného včetně porovnání existují- cích řešení z několika společných úhlů pohledu. Za účelem interpretace lékařských snímků v českém jazyce představujeme natrénovaný český GPT-2 model specializovaný na lékař- ské texty, který vychází z původního předtrénovaného anglického GPT-2 modelu, spolu s jeho vyhodnocením. Ve druhé části je vytvořené české GPT-2 použito pro trénování modelu neuronové sítě pro generování lékařských zpráv. Trénování bylo provedeno na volně dostupných datech spolu s předzpracováním dat a jejich úpravou pro český jazyk. Dále jsou výsledky modelu diskutovány a vyhodnoceny pomocí standardních metrik pro zpracování přirozeného jazyka za účelem určení výkonnosti. 1
Analysis and visualization of the GPT-2 language model
Šipoš, Daniel ; Mareček, David (vedoucí práce) ; Rosa, Rudolf (oponent)
Vizualizácia komplexných modelov neurónových sietí s architektúrou typu Transfor- mer je vo všeobecnosti veľmi náročná úloha, ktorá sa väčšinou rieši vizualizáciou blokov Attention a sledovaním, na ktoré slová sa tento blok zameriava. Modely Transformer ale majú veľké množstvo vrstiev, na každej vrstve majú veľké množstvo hláv Attention a každá hlava môže sledovať rôzne lingvistické znaky. My sme sa preto v tejto práci za- merali na vytvorenie programu, ktorý je určený na prehľadnejšiu vizualizáciu správania jazykového modelu GPT-2. Prišli sme so štyrmi metódami vizualizácie, ktoré skúmajú závislosti generovaných slov od prechádzajúcich slov v texte. Tieto závislosti sledujeme tak, že skúsime prvé slovo v texte vynechať alebo zameniť za podobné slovo a pozorujeme zmenu v pravdepodobnosti generovaného slova. Metódy sme vyskúšali na modele GPT- 2 Medium a demonštrujeme, aké výsledky dané metódy vytvorili. Zároveň vyslovujeme hypotézy, ktoré sa pokúšajú objasniť, prečo tieto výsledky vyšli práve tak. 1
Automatic post-editing of phrase-based machine translation outputs
Rosa, Rudolf ; Mareček, David (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
Představujeme Depfix, systém pro samočinnou post-edititaci výstupů frázových strojových překladů z angličtiny do češtiny, založený na jazykovědných znalostech. Nejprve jsme rozebrali druhy chyb, kterých se dopouští typický strojový překladač. Poté jsme vytvořili sadu pravidel a statistickou komponentu, které opravují takové chyby, které jsou běžné nebo závažné a může přicházet v úvahu jejich oprava pomocí našeho přístupu. Používáme řadu nástrojů pro zpracování přirozeného jazyka, které nám poskytují rozbor vstupních vět. Navíc jsme reimplementovali závislostní analyzátor a několika způsoby jej upravili pro provádění rozboru výstupů statistických strojových překladačů. Provedli jsme automatická i ruční vyhodnocení, která potvrdila, že kvalita překladů se zpracováním v našem systému zlepšuje.
Webové rozhraní pro platformu Treex
Sedlák, Michal ; Popel, Martin (vedoucí práce) ; Rosa, Rudolf (oponent)
Tato práce pojednává o webové aplikaci Treex::Web, která slouží jako webo- vé rozhraní k platformě pro zpracování úloh přirozeného jazyka Treex. Práce poukazuje na několik nedostatků Treexu (především absenci grafického uži- vatelského rozhraní a komplikovanou instalaci) a nabízí Treex::Web jako je- jich možné řešení. V úvodu práce je nejprve představena samotná platforma Treex. Následuje kapitola 3 popisující uživatelské rozhraní Treex::Webu a kapitola 4 zabývající se vlastní implementací webové aplikace. V závěru práce je provedeno srovnání s podobnými platformami jako Treex a jejich webovými rozhraními. 1
Generování výsledků tenisových dvouher
Prokop, Dominik ; Rosa, Rudolf (vedoucí práce) ; Kasner, Zdeněk (oponent)
Tato práce se zabývá generováním krátkých článků o proběhlých tenisových dvouhrách ze strukturovaných dat. Články jsou generovány na základě šablon heuristicky získaných z původních novinových článků. Výsledkem práce je databáze šablon a grafická aplikace, která za pomocí těchto šablon pro zadaný vstup generuje odpovídající krátké články. Součástí práce je zhodnocení výstupů aplikace, které ukazuje, že 64 % vygenerovaných textů je korektních. 1

Národní úložiště šedé literatury : Nalezeno 35 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.