Národní úložiště šedé literatury Nalezeno 35 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Computational analysis and synthesis of song lyrics
Březinová, Patrícia ; Popel, Martin (vedoucí práce) ; Rosa, Rudolf (oponent)
V této práci zkoumáme datovou sadu téměř půl milionu anglických textů písní třemi způsoby - automatickým vyhodnocováním, vizualizací a generováním. Vytváříme vlastní detektor rýmů pomocí EM algoritmu s několika vylepšeními a nastavitelnými parametry. Tento algoritmus může v některých případech nahradit lidské hodnotitele, které nelze použít k vyhodnocení zlepšení generátoru textů po každé jeho modifikaci. Vytvořením vizualizace výsledků na webové stránce s maticovým vyznačením rýmů zpřístupníme naše hodnocení veřejnosti. Diskutujeme o zajímavých rozdílech mezi hudebními žánry, které odhalilo automatické vyhodnocení celého souboru dat naším evaluátorem. Nakonec zkoumáme generování textů pomocí state-of-the-art algoritmu GPT-2.
Automatic generation of crosswords
Jurášová, Daniela ; Rosa, Rudolf (vedoucí práce) ; Novák, Michal (oponent)
Cieľom tejto práce je predstavenie programu pre automatické generovanie tematických hrebeňoviek. Hrebeňovka je typ krížovky, v ktorej niekoľko slov umiestnených v stĺpcoch bezprostredne vedľa seba, vytvorí v určenom riadku tajničku. Výsledný program má formu počítačovej aplikácie s jednoduchým grafickým prostre- dím. Užívateľ si na začiatok zvolí tému krížovky z dostupného zoznamu. Program následne použitím voľne prístupnej databázy WordNet vygeneruje krížovku obsahujúcu slová tý- kajúce sa danej témy. Zároveň vytvorí legendu pre riešenie krížovky. Súčasný návrh je oproti pôvodnému zadaniu rozšírený o možnosť definovať si vlastnú tému. Databáza slov je rozšírená o slovenský WordNet, takže užívateľ si môže vybrať medzi dvomi jazykmi slov dopĺňaných do krížovky. 1
End-to-end dialogue systems with pretrained language models
Kulhánek, Jonáš ; Dušek, Ondřej (vedoucí práce) ; Rosa, Rudolf (oponent)
Současné dialogové systémy se obvykle skládají ze samostatných komponent, které jsou z velké části vytvořeny ručně a vyžadují rozsáhlé anotace dat. Existují end-to- end trénovatelné systémy, které jsou ale méně spolehlivé a produkují méně kvalitní výs- tupy. Současné předtrénované jazykové modely založené na transformer architektuře, jako je GPT-2, přinesly do modelování jazyka značný pokrok, ale současně vyžadují velké množství textových dat, která nejsou pro běžné dialogové domény k dispozici. Proto je při trénování těchto modelů vysoké nebezpečí přeučení. Abychom tyto překážky překonali, navrhujeme nový end-to-end dialogový systém nazvaný AuGPT. Abychom efektivněji využili trénovací data, rozšiřujeme architekturu o pomocné moduly, a aby- chom zvýšili množství a rozmanitost dat, využíváme rozsáhlé augmentace dat pomocí zpětného překladu a předtrénování na více datových sadách. Náš systém vyhodnocujeme pomocí automatických metod (korpusové metriky, simulace uživatele), lidského vyhodno- cení v rámci soutěže DSTC 9 shared task challenge (kde se náš systém umístil na třetím místě z 10) a také rozsáhlé manuální analýzy chyb. Naše metoda podstatně překonává baseline na benchmarku MultiWOZ a vykazuje výsledky konkurenceschopné s nejmod- ernějšími end-to-end dialogovými systémy. 1
Generating text from structured data
Trebuňa, František ; Rosa, Rudolf (vedoucí práce) ; Kasner, Zdeněk (oponent)
V tejto bakalárskej práci skúmame možnosti generovania textu v prirodzenom ja- zyku podmieneného štruktúrovanými vstupnými dátami. Konkrétne trénujeme hlboké neurónové siete na datasete RotoWire, ktorý obsahuje štatistické údaje o basketbalovom zápase spárované s ich súhrnmi. Najprv analyzujeme dataset a navrhneme niekoľko me- tód preprocessingu (napríklad Byte Pair Encoding). Následne trénujeme základný model založený na architektúre Encoder-Decoder na pripravenom datasete. Popíšeme niekoľko problémov základného modelu a skúmame niekoľko pokročilých neurónových architektúr, ktoré majú tieto problémy riešiť (Copy Attention, Content Selection, Content Planning). Naša analýza naznačuje, že modely nedokážu pochopiť štruktúru vstupných dát. Navr- hujeme preto metódu na zjednodušenie jej zložitosti. Náš najlepší model vytrénovaný na zjednodušených dátach prekonáva základný model o viac ako 5 bodov BLEU. 1
Quote Attribution and Character Networks in Novels
Urbanová, Zuzana ; Rosa, Rudolf (vedoucí práce) ; Kyjánek, Lukáš (oponent)
Tato práce se zaměřuje na extrakci informací z literárních děl, s použitím nástrojů pro jazykovou analýzu. Naším cílem je automaticky extrahovat síť konverzací mezi postavami v knize. Práci jsme rozdělili do tří podproblémů, které řešíme samostatně: extrakce postav, přiřazování mluvčích a tvorba sítě. Výsledkem je end-to-end nástroj, který z anglického textu knihy na vstupu vytvoří vizuální reprezentaci sítě mezi postavami. Naše práce je založena na existující literatuře. Pro každou ze tří částí prezentuje nové myšlenky a porovnává přesnost různých metod. 1
Biblické parafrázování
Michálek, Ondřej ; Rosa, Rudolf (vedoucí práce) ; Barančíková, Petra (oponent)
V této bakalářské práci se zabývám parafrázováním textu na úrovni slov, konkrétně parafrázováním biblických textů v češtině. Součástí parafráze by měla být i modernizace textu, aby se stal srozumitelnějším pro běžného čtenáře. Pro tyto účely jsem vyvinul desktopovou uživatelskou aplikaci, ve které využívám nástroje pro analýzu a generování jazyka: Word2vec a MorphoDiTu. Ve své práci porovnávám výsledky jednotlivých přístupů v parafrázování. Vyhodnocení výsledků sleduje několik kritérií a porovnávám účinnost použitých metod na verších z Bible kralické a Českého ekumenického překladu.
Generátor popisků počítačových sestav a notebooků
Matějka, Jan ; Rosa, Rudolf (vedoucí práce) ; Dušek, Ondřej (oponent)
Tato práce se zabývá problémem generování souvislých dobře formovaných vět ze strukturovaných dat. Cílem práce je vytvořit nástroj, který by mohl usnadnit vytváření stručných popisků elektroniky na základě parametrů ve formě strukturovaných dat, vhodný například pro internetové obchody. První část práce seznamuje čtenáře s možnými postupy řešení. Dále práce popisuje potřebná data k řešení tohoto problému včetně způsobů získávání těchto dat a jejich struktury. Práce následně popisuje dvě vybraná řešení a jejich implementaci. Rozebírá výhody i nevýhody těchto řešení a zhodnotí texty, které nástroj generuje.
Generování textového popisu trasy v mapě
Svobodová, Zuzana ; Rosa, Rudolf (vedoucí práce) ; Mareček, David (oponent)
Výsledkem práce je program, který pro pěší trasu v mapě vytvoří textovou navigaci, která má být snadno srozumitelná člověku. Soudobé aplikace pro textový popis trasy (které jsou součástí například mapy.cz či google.maps.com) uživatele informují hlavně o vzdálenostech a směrech, podle čehož není vždy snadné se orientovat. Když trasu popisuje člověk, většinou při popisu používá význačné objekty v krajině a také spojuje jednotlivé informace do složitějších. V našem programu se tedy snažíme o tento více lidský popis, který by chodci umožnil následovat trasu jen s pokyny programem vygenerovanými.
Eye-tracking features in syntactic parsing
Agrawal, Abhishek ; Rosa, Rudolf (vedoucí práce) ; Straková, Jana (oponent)
In this thesis, we explore the potential benefits of leveraging eye-tracking information for dependency parsing on the English part of the Dundee corpus. To achieve this, we cast dependency parsing as a sequence labelling task and then augment the neural model for sequence labelling with eye-tracking features. We also augment a graph-based parser with eye-tracking features and parse the Dundee Corpus to corroborate our findings from the sequence labelling parser. We then experiment with a variety of parser setups ranging from parsing with all features to a delexicalized parser. Our experiments show that for a parser with all features, although the improvements are positive for the LAS score they are not significant whereas our delexicalized parser significantly outperforms the baseline we established. We also analyze the contribution of various eye-tracking features towards the different parser setups and find that eye-tracking features contain information which is complementary in nature, thus implying that augmenting the parser with various gaze features grouped together provides better performance than any individual gaze feature. 1

Národní úložiště šedé literatury : Nalezeno 35 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.