Národní úložiště šedé literatury Nalezeno 78 záznamů.  začátekpředchozí31 - 40dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Analytical tools for Gregorian chant
Szabová, Kristína ; Hajič, Jan (vedoucí práce) ; Pecina, Pavel (oponent)
Jedným z najzaujímavejších problémov týkajúcich sa gregoriánskeho chorálu je jeho vývoj naprieč storočiami. Objavovanie príbuzných a, naopak, nepríbuzných spevov je nevyhnutným krokom pri riešení tohto problému, po odbornom výbere súboru spevov na porovnanie. Pri tomto kroku môžu pomôcť výpočetné metódy, keďže si vyžaduje zarov- nanie veľkého množstva spevov. Hoci existujú rozsiahle databázy digitalizovaných spevov, v digitálnej muzikológii chýba softvér potrebný na vykonanie tohto kroku. Výsledkom tejto práce je softvérový nástroj, ktorý môže pomôcť pri objavovaní príbuzných spevov pomocou algoritmov pre viacnásobné zarovnanie sekvencií (MSA), čo sú metódy pre- vzaté z bioinformatiky. Umožňuje výskumníkom zarovnať ľubovoľné súbory príbuzných (a nepríbuzných) spevov, a tak odhaliť zhluky príbuzných melódií. Okrem toho uľahčuje objavovanie kontrafaktov a transpozícií. Napriek tomu má nástroj určité obmedzenia: spúšťa sa lokálne a niektoré jeho interaktívne funkcie sa pri spracovaní stoviek údajov stávajú pomalými. Ďalší vývoj je plánovaný v rámci prebiehajúcej spolupráce s výskum- níkmi v oblasti digitálnej muzikológie z Akadémie vied Českej republiky a Filozofickej fakulty Univerzity Karlovej. 1
Lexical Association Measures Collocation Extraction
Pecina, Pavel ; Hajič, Jan (vedoucí práce)
Lexical Association Measures:Collocation Extraction Pavel Pecina Abstract of Doctoral Thesis This thesis is devoted to an empirical study of lexical association measures and their application for collocation extraction. We focus on two-word (bigram) collocations only. We compiled a comprehensive inventory of 82 lexical association measures and present their empirical evaluation on four reference data sets: dependency bigrams from the manually annotated Prague Dependency Treebank, surface bigrams from the same source, instances of the previous from the Czech National Corpus provided with automatically assigned lemmas and part~of-speech tags, and distance verb-noun bigrams from the automatically part-of-speech tagged Swedish Parole Corpus. Collocation candidates in the reference data sets were manually annotated and identified as collocations and non-collocations. The evaluation scheme is based on measuring the quality of ranking collocation candidates according to their chance to form collocations. The methods are compared by precision-recall curves and mean average precision scores adopted from the field of information retrieval. Tests of statistical significance were also performed. Further, we study the possibility of combining lexical association measures and present empirical results of several...
Cross-Lingual Information Retrieval in the Medical Domain
Saleh, Shadi ; Pecina, Pavel (vedoucí práce) ; Hanbury, Allan (oponent) ; Kliegr, Tomáš (oponent)
Vícejazyčné vyhledávání informací v oblasti medicíny Shadi Saleh V posledních letech došlo k exponenciálnímu růstu objemu digitálního ob- sahu dostupného na internetu, což koreluje s rostoucím počtem neanglicky mluvících uživatelů internetu v důsledku celosvětového rozšíření internetu. To zvyšuje význam zpřístupnění informací pro ty, kteří si chtějí vyhledat informace bez omezení na jazyky, jimž rozumějí, zejména pro ty, kteří chtějí využít internet k vyhledání lékařského obsahu týkajícího se jejich zdravotního stavu. Získávání informací napříč jazyky (Cross-Lingual Information Retrieval, CLIR) překonává jazykové bariéry tím, že vyhledává dokumenty napsané v jiném jazyce, než je jazyk dotazu. Tato disertační práce se zabývá úlohou CLIR v lékařské doméně v sedmi evropských jazycích. Vyvinuli jsme systémy pro statistický strojový překlad (Statistical Machine Translation, SMT) adaptované na oblast lékařství, které jsou doladěny pro metodu překladu dotazů (Query Translation, QT) a pro metodu překladu dokumentů (Document Translation, DT). Na empirických datech dokládáme, že oproti tomu, co se předpokládalo od konce 90. let., v úloze CLIR v lékařské doméně metoda DT nepředčí metodu QT pro...
Optical Music Recognition using Deep Neural Networks
Mayer, Jiří ; Pecina, Pavel (vedoucí práce) ; Hajič, Jan (oponent)
Automatický přepis notových zápisů (Optical Music Recognition) je zajímavá úloha, v mnoha ohledech podobná automatickému přepisu textu (Optical Character Recognition). Přináší s sebou ovšem mnoho problémů, které způsobují potíže klasickým metodám počí- tačového vidění. Hluboké neuronové sítě umožnily řešit automatický přepis textu tzv. end-to-end přístupem, kdy se celá úloha řeší najednou. Zkusili jsme použít tuto metodu na problém rozpoznávání notových zápisů, ale zaměřili jsme se pouze na ručně psané zápisy. Pro vyřešení nedostatku trénovacích dat jsme vyvinuli sázecí systém s názvem Mashcima. Tento systém úspěšně napodobuje vzhled datasetu CVC-MUSCIMA. Provedli jsme vyhodnocení našeho přístupu na části datasetu CVC-MUSCIMA s velmi nadějnými výsledky, což naznačuje, že použité řešení je funkční a další práce v tomto směru by mohla vést ještě k dalšímu zlepšení. 1
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce) ; Harašta, Jakub (oponent) ; Pecina, Pavel (oponent)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Expert classification and retrieval
Nascimento Vianna, Felipe ; Pecina, Pavel (vedoucí práce) ; Vomlelová, Marta (oponent)
Hledání expertů je běžné téma, zvláště v prostředí organizace. Základní úkon, kterým je získávání expertů, zařazuje osoby do různých oborů a dále může být použítý k je- jich klasifikaci. V současné době je většina postupů používaných k řešení tohoto úkonu založena na tradičním vyhledávání pomocí dostupných dokumentů a nezvažuje použití informací, které jsou dostupné z předchozích klasifikací. Tato práce představuje postup, při němž se osoby zařazují do oborů trénováním vícetřídního klasifikátoru na základě dostupných dat o osobách. Vstupy, kterými jsou dokumenty související s odbornou čin- ností autorů a cílová data, jako informace z profilu kandidáta na experta v daném oboru, byly připraveny prostřednictvím učení bez učitele a jsou použity k trénování neuronové sítě. Dále jsou hodnoceny efekty uspořádní podle fíčur a konvoluční vrstvy. Experimenty ukazují, že klasifikace expertů není vhodná pouze pro doporučovací systémy, ale také představuje jednu z cest pro efektivní hledání expertů, jelikož dosahuje srovnatelných výsledků v moderních benchmark testech, jako je TREC Enterprise. 1
Multimodality in Machine Translation
Libovický, Jindřich ; Pecina, Pavel (vedoucí práce) ; Specia, Lucia (oponent) ; Čech, Jan (oponent)
Multimodalita ve strojovém překladu Jindřich Libovický Tradičně se většina úloh zpracování přirozeného jazyka řeší výhradně uvnitř jazyka, kdy modely spoléhají na distribuční vlastnosti slov. Hluboké učení se svojí schopností učit se vhodné reprezentace vstupních dat umožňuje využití více informací tím, že trénovací signál nepochází pouze z jazyka, ale o i z obrazové modality. Jednou z úloh, které se pokoušejí využít vizuální informace, je multimodální strojový překlad: překlad popisků obrázků, kdy je stále k dispozici původní obrázek, který lze využít jako vstup pro překladač. Tato práce shrnuje metody společného zpracovávání jazykových dat a fotografií s využitím hlubokého učení. Uvádíme přehled metod, které se využívají k řešení multimodálního strojového překladu a popisujeme náš původní příspěvek k řešení této úlohy. Představujeme metody kombinování více vstupů z potenciálně různých modalit v modelech sekvenčního učení založených na rekurentních neuronových sítích a neuronových sítí s mechanismem sebepozornosti. Uvádíme výsledky, kterých jsme dosáhli při řešení multimodálního strojového překladu a dalších úloh souvisejících se strojovým překladem. Na závěr analyzujeme, jak multimodalita ovlivňuje sémantické vlastnosti větných reprezentací, které v sítích vznikají, a jak sémantické vlastnosti...
Optical Recognition of Handwritten Music Notation
Hajič, Jan ; Pecina, Pavel (vedoucí práce) ; Fujinaga, Ichiro (oponent) ; Černocký, Jan (oponent)
Rozpoznávání notopisu (Optical Music Recognition, OMR) je obor studující jak automaticky číst hudební notaci. Tato disertace prezentuje formou souboru publikovaných prací příspěvky k teorii, infrastruktuře a metodám OMR především pro ručně psanou notaci. Hlavními přínosy jsou (1) formální popis hudební notace pomocí notačního grafu (Music Notation Graph, MuNG), orientovaného grafu, ze kterého lze jednoznačně odvodit v notaci zakódovanou hudební sémantiku, (2) datová sada MUSCIMA++ hudebních rukopisů, které jsou anotovány pomocí MuNG, a lze ji tak využít pro trénování a evaluování libovolných systémů a podsystémů OMR, včetně extrakce hudební sémantiky a (3) systém rozpoznávání notopisu extrahující hudební sémantické informace z rukopisů, který používá strojové učení jak pro detekci notačních objektů, tak pro jejich usouvstažňování, a na základě takto automaticky vytvořené reprezentace pomocí MuNG deterministicky dopočítává sémantiku. Ačkoliv tento OMR systém stále dělá množství chyb, jedná se o první systém, který hudební rukopisy rozpoznává tak, že lze jeho výsledky využít na některé z úloh motivujících práci na OMR, a zpracovává libovolně komplikovanou notaci.
Hybrid Deep Question Answering
Aghaebrahimian, Ahmad ; Holub, Martin (vedoucí práce) ; Kordik, Pavel (oponent) ; Pecina, Pavel (oponent)
Název práce: Hybridní hluboké metody pro automatické odpovídání na otázky Autor: Ahmad Aghaebrahimian Ústav: Ústav Formální a Aplikované Lingvistiky Vedoucí disertační práce: RNDr. Martin Holub, Ph.D., Ústav Formální a Ap- likované Lingvistiky Abstrakt: Automatické odpovídání na otázky jakožto jedna z nejstarších úloh z oblasti zpracování přirozeného jazyka je jednou z nejzajímavějších a nejná- ročnějších oblastí výzkumu s množstvím vědeckých a komerčních uplatnění. Od- povídání na otázky jakožto disciplína se ve spojení s informatikou, statistikou, lingvistikou a kognitivní vědou zabývá tvorbou systémů, které automaticky vy- hledávají odpovědi na otázky kladené lidmi v přirozeném jazyce. Tato doktorská disertační práce představuje autorův výzkum uskutečněný v uvedené oblasti. Au- tor předkládá především své studie a výzkum zaměřený na hybridní systémy pro odpovídání na otázky zahrnující vyhledávací stroje pracující jak se struktu- rovanými, tak s nestrukturovanými daty. Jádrem strukturovaného vyhledávacího stroje je state-of-the-art systém založený na znalostních grafech. Nestrukturovaný vyhledávací stroj je tvořen state-of-the-art systémem pro odpovídání na otázky na větné úrovni a systémem pro odpovídání na otázky na úrovni slov s výsledky, které se blíží tomu, čeho dosahují lidé. Tato práce představuje...
Deep contextualized word embeddings from character language models for neural sequence labeling
Lief, Eric ; Pecina, Pavel (vedoucí práce) ; Kocmi, Tom (oponent)
Rodina úkolů pro zpracování přirozeného jazyka (NLP), jako je označování po částech řeči (PoS), identifikace pojmenované entity (NER) a identifikace více slov (MWE), zahrnují přiřazení štítků sekvencím slov v textu označování). Většina moderních přístupů strojového učení k sekvenčnímu označování využívá vkládání slov, naučené reprezentace textu, ve kterých mají slova s podobnými významy podobné reprezentace. Docela nedávno, kontextualizované slovní embeddings získaly hodně pozornosti, protože na rozdíl od předem vyškolených kontextově necitlivých embeddings, jako je word2vec, jsou schopni zachytit význam slova v kontextu. V této diplomové práci hodnotím výkonnost různých nastavení vkládání (kontextu citlivé, kontextově necitlivé slovo, stejně jako slovo specifické pro danou práci, charakter, lemma a PoS) na třech výše uvedených úlohách označování sekvence pomocí hlubokého modelu učení ( BiLSTM) a portugalských datových sad.

Národní úložiště šedé literatury : Nalezeno 78 záznamů.   začátekpředchozí31 - 40dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.