Národní úložiště šedé literatury Nalezeno 40 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Hybrid Deep Question Answering
Aghaebrahimian, Ahmad ; Holub, Martin (vedoucí práce) ; Kordik, Pavel (oponent) ; Pecina, Pavel (oponent)
Název práce: Hybridní hluboké metody pro automatické odpovídání na otázky Autor: Ahmad Aghaebrahimian Ústav: Ústav Formální a Aplikované Lingvistiky Vedoucí disertační práce: RNDr. Martin Holub, Ph.D., Ústav Formální a Ap- likované Lingvistiky Abstrakt: Automatické odpovídání na otázky jakožto jedna z nejstarších úloh z oblasti zpracování přirozeného jazyka je jednou z nejzajímavějších a nejná- ročnějších oblastí výzkumu s množstvím vědeckých a komerčních uplatnění. Od- povídání na otázky jakožto disciplína se ve spojení s informatikou, statistikou, lingvistikou a kognitivní vědou zabývá tvorbou systémů, které automaticky vy- hledávají odpovědi na otázky kladené lidmi v přirozeném jazyce. Tato doktorská disertační práce představuje autorův výzkum uskutečněný v uvedené oblasti. Au- tor předkládá především své studie a výzkum zaměřený na hybridní systémy pro odpovídání na otázky zahrnující vyhledávací stroje pracující jak se struktu- rovanými, tak s nestrukturovanými daty. Jádrem strukturovaného vyhledávacího stroje je state-of-the-art systém založený na znalostních grafech. Nestrukturovaný vyhledávací stroj je tvořen state-of-the-art systémem pro odpovídání na otázky na větné úrovni a systémem pro odpovídání na otázky na úrovni slov s výsledky, které se blíží tomu, čeho dosahují lidé. Tato práce představuje...
Deep contextualized word embeddings from character language models for neural sequence labeling
Lief, Eric ; Pecina, Pavel (vedoucí práce) ; Kocmi, Tom (oponent)
Rodina úkolů pro zpracování přirozeného jazyka (NLP), jako je označování po částech řeči (PoS), identifikace pojmenované entity (NER) a identifikace více slov (MWE), zahrnují přiřazení štítků sekvencím slov v textu označování). Většina moderních přístupů strojového učení k sekvenčnímu označování využívá vkládání slov, naučené reprezentace textu, ve kterých mají slova s podobnými významy podobné reprezentace. Docela nedávno, kontextualizované slovní embeddings získaly hodně pozornosti, protože na rozdíl od předem vyškolených kontextově necitlivých embeddings, jako je word2vec, jsou schopni zachytit význam slova v kontextu. V této diplomové práci hodnotím výkonnost různých nastavení vkládání (kontextu citlivé, kontextově necitlivé slovo, stejně jako slovo specifické pro danou práci, charakter, lemma a PoS) na třech výše uvedených úlohách označování sekvence pomocí hlubokého modelu učení ( BiLSTM) a portugalských datových sad.
Grounding Natural Language Inference on Images
Vu Trong, Hoa ; Pecina, Pavel (vedoucí práce) ; Libovický, Jindřich (oponent)
Grounding Natural Language Inference on Images Hoa Trong VU July 20, 2018 Abstract Despite the surge of research interest in problems involving linguistic and vi- sual information, exploring multimodal data for Natural Language Inference remains unexplored. Natural Language Inference, regarded as the basic step towards Natural Language Understanding, is extremely challenging due to the natural complexity of human languages. However, we believe this issue can be alleviated by using multimodal data. Given an image and its description, our proposed task is to determined whether a natural language hypothesis contra- dicts, entails or is neutral with regards to the image and its description. To address this problem, we develop a multimodal framework based on the Bilat- eral Multi-perspective Matching framework. Data is collected by mapping the SNLI dataset with the image dataset Flickr30k. The result dataset, made pub- licly available, has more than 565k instances. Experiments on this dataset show that the multimodal model outperforms the state-of-the-art textual model. References 1
Information retrieval and navigation in audio-visual archives
Galuščáková, Petra ; Pecina, Pavel (vedoucí práce) ; Jones, Gareth (oponent) ; Ircing, Pavel (oponent)
Práca poskytuje prehľad metód pre interaktívne vyhľadávanie relevantných segmentov vo zvukových nahrávkach a vo videách. Práca najprv popisuje metódy pre vyhľadávanie v audio- vizuálnych archívoch založené na textovej informácii, ktoré využívajú automatické prepisy, titulky a metadáta. Kvalita vyhľadávania je skúmaná v závislosti na metódach segmentácie videa. Ďalej sú skúmané metódy pre navigáciu v multimédiách založené na multimodálnych hyperlinkoch a metódy pre automatický výber informatívnych segmentov videa, na ktoré je ďalej hyperlinking aplikovaný. Popísané metódy textového vyhľadávania, hyperlinkigu a výberu zaujímavých segmentov sú nakoniec použité v grafickom používateľskom rozhraní.
Splitting word compounds
Oberländer, Jonathan ; Pecina, Pavel (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Jazyky, jako je němčina, holandština, skandinávské jazyky nebo řečtina, na rozdíl od angličtiny netvoří kompozita jako víceslovné výrazy, ale spojením jednotlivých částí do nového slova bez ortografického oddělení. To představuje problém pro řadu úloh zpracování přirozeného jazyka, jako je například statistický strojový překlad či vyhledávání informací. Většina předešlých prací na téma rozkladu složenin na jejich částí se zaměřovala na němčinu. V této práci jsme vyvinuli nový jednoduchý systém založený na nařízeném strojovém učení pro automatický rozklad složenin pro tři reprezentativní kompozitní jazyky: němčina, švédština a maďarština. Součástí práce je vytvoření multilinguální evaluační datové sady z lékařské domény anotováním složenin získaných z korpusu EMEA a vyhodnocení několika variant našeho systému a srovnání s předchozími přístupy. Powered by TCPDF (www.tcpdf.org)
English grammar checker and corrector: the determiners
Auersperger, Michal ; Pecina, Pavel (vedoucí práce) ; Straňák, Pavel (oponent)
Předkládaná práce přistupuje ke kontrole členů v anglickém textu jako ke klasi- fikační úloze řešené metodami strojového učení s učitelem. Každé jmenné frázi v textu je přiřazena jedna ze tří tříd reprezentující určitý, neurčitý nebo nulový člen. V rámci úvodní rešerše byl definován článek dosahující na takto pojaté úloze ne- jlepších výsledků. Daný experiment byl pak zreplikován a překonán. Pomocí jiných signálů a volbou rozdílného učícího algoritmu došlo k poklesu chyby klasifikace o cca. 34%. Výsledný model byl pak porovnán s výkonem expertů na dané úloze. Přes problémy srovnání způsobené rozdílností dat se zdá, že je-li model použit na typu dat, na kterém byl trénován, je jeho úspěšnost srovnatelná s lidskou silou. Použití modelu na jiných datech se ale neosvědčilo. Stejně tak se neosvědčila ani náhrada klasifikátoru za jazykový model, který by předpovídal potenciální člen pro každou pozici ve větě. 1
Text simplification in Czech
Burešová, Karolína ; Pecina, Pavel (vedoucí práce) ; Bejček, Eduard (oponent)
Práce se zabývá zjednodušováním textu v češtině, zejména lexikálním zjednodušováním, tedy na- hrazováním složitých slov za jednodušší. V práci je implementováno a vyhodnoceno několik různých způsobů určování složitých slov, generování náhrad a hodnocení náhrad. Generování náhrad je testováno jak za pomoci slovníků, tak za pomoci slovních embeddingů. Práce dále představuje několik pokusů s lidmi. Tyto pokusy mají za cíl pomoci získat náhled do problematiky vnímané složitosti a faktorů, které ji ovlivňují. Provedené a vyhodnocené experimenty zahrnují porovnávání dvojic vět a ruční zjednodu- šování textu. V práci je uvedeno jak vyhodnocení jednotlivých způsobů řešení problému, tak výstupy provedených experimentů s lidmi; a jsou doporučeny i navazující směry práce. 1
Query expansion for medical information retrieval
Bibyna, Feraena ; Pecina, Pavel (vedoucí práce) ; Holub, Martin (oponent)
Jedním z problémů ve vyhledávání medicínských informací je terminologická "propast" mezi jazykem dokumentů (které jsou obvykle psané odborníky používajícími odbornou terminologii) a jazykem vyhledávacích dotazů (které jsou častěji tvořeny neodborníky používajícími především laické výrazy). V této diplomové práci zkoumáme možnosti řešení tohoto problému pomocí rozšiřování dotazů s využitím doménově specifických datových zdrojů. K tomuto používáme Unified Medical Language System (UMLS) obsahující sdružené biomedicínské názvosloví z několika zdrojů. Konkrétně používáme jeho metatezaurus a sémantickou síť. V experimentech používáme sadu dotazů z evaluační kampaně CLEF eHealth z let 2014 a 2015, které reprezentují dvě různé vyhledávací úlohy. Použité metody zahrnují rozšiřování dotazů pomocí synonymních i nesynonymních vztahů, metodu blind relevance feedback, vážení termů a také kombinování různých systémů pomocí lineární interpolace. Powered by TCPDF (www.tcpdf.org)
Semantic relation extraction from unstructured data in the business domain
Rampula, Ilana ; Pecina, Pavel (vedoucí práce) ; Kuboň, Vladislav (oponent)
V posledních letech se využití textové analytiky v komerční sféřě postupně stává významým tématem pro vědecké a praktické aplikace. Zaměřili jsme se na určování vztahů mezi entitami z dat dodaných partnerskou společností. Analýza textu z této sféry ale vyžaduje jiný přístup: počítání s nepřesnostma a specifickými atributy. V této práci jsme se rozhodli ukázat využití dvou metod pro určování vztahů: tzv. Snowball systém a Metodu vzdáleného dohledu (z angl. Distant Supervision), které jsme přizpůsobili pro dodaná data. Dané metody byli implementovány pro využití strukturovaných a nestrukturovaných dat z firemní databáze. Klíčová slova: Získavání informací, Určování vztahů mezi entitami, Textová analytika, Distant Supervision, Snowball
Towards concept visualization through image generation
Nguyen, Tien Dat ; Pecina, Pavel (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
Název: Vizualizace konceptů pomocí generování obrazu Autor: Tien Dat Nguyen Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: RNDr. Pavel Pecina, Ph.D., Ústav formální a aplikované lingvistiky MFF UK a Angeliki Lazaridou, Ra_aella Bernardi, Marco Baroni (University of Trento), Počítačová lingvistika a počítačové vidění mají společný způsob, jak zachytit sémantiku lingvistických/vizuálních jednotek pomocí vektorové reprezentace. Navíc kvalitní sémantická reprezentace může být efektivně sestrojena pomocí nedávných pokroků v metodách neuronových sítí. Avšak jejich pochopení zůstává omezené a je nutné je posuzovat intuitivně. Mezimodální mapování je mapování mezi vektorovou sémantikou zabudovanou do slov a vizuálních reprezentací odpovídajících objektů v obrazu. Invertování obrazové reprezentace zahrnuje učení inverze obrazu vizuálních vektorů (SIFT, HOG a CNN rysy) pro rekonstrukci původní informace. Cílem této práce je vybudování úplné pipeline, ve které jsou slovní reprezentace transformovány do obrazových vektorů pomocí mezimodálního mapování a tyto vektory jsou promítnuty do pixelového prostoru použitím inverze. Ukazuje se, že tento způsob může být průlomovým prostředkem, jakým lze zkontrolovat a vyhodnotit sémantiku zakódovanou v reprezentaci slov generováním obrázků, které jej reprezentují.

Národní úložiště šedé literatury : Nalezeno 40 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
2 Pecina, Petr
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.