Národní úložiště šedé literatury Nalezeno 64 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Unsupervised and Semi-Supervised Multilingual Learning for Resource-Poor Languages
Tran, Manh-Ke ; Zeman, Daniel (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Pra ce se zaměřuje na neř zenou morfologickou segmentaci, jednu ze za kladn ch u loh poč tačov eho zpracov an přirozen eho jazyka. V t eto u loze je c lem rozložit slova na morf emy. Popisuji a reim- plementuji model navrženy v Lee et al. (2011) a vyhodnocuji ho na 4 jazyc ch. Nav c navrhuji generativn model, ktery dok aže využ t reprezentaci slov jako př davn e rysy. Slovn reprezentace jsou rovněž z sk ava ny neř zeny m zp usobem pomoc strojov eho učen a neuronov eho jazykov eho modelu. Pokusy ukazuj , že s využit m těchto př davny ch rys u celkova u spěšnost neř zen eho modelu vzr usta .
Vektorová reprezentace výzkumných projektů
Mikuláš, Pavel ; Vidová Hladká, Barbora (vedoucí práce) ; Víta, Martin (oponent)
V této práci se zabýváme počítačovým zpracováním dat o výzkumných projektech financovaných ze státního rozpočtu. Porovnáme různé metody převedení nestrukturova- ných textových dat do vektorových reprezentací a pokusíme se v datech nalézt různé struktury. Velký důraz bude kladen na měření podobnosti a shlukování projektů. Práce je experimentální a měla by sloužit jako ukázka postupu zpracování velkého množství objektů reálného světa pomocí metod statistiky a strojového učení. 1
Text classification with limited training data
Laitoch, Petr ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Cı́lem této diplomové práce je minimalizovat manuálnı́činnost nutnou k vytvářenı́ trénovacı́ch dat pro klasifikaci textu. Různé oblasti výzkumu, včetně slabého dohledu, interaktivnı́ho učenı́ a transfer learningu, zkoumajı́, jak toto úsilı́ mini- malizovat. Propojenı́m vı́ce takových myšlenek z dostupné literatury jsme dospěli k návrhu interaktivnı́ho klasifikačnı́ho nástroje na bázi klı́čových slov. Nástroj se opı́rá o metodu klasifikace pomocı́ klı́čových slov namı́sto zdlouhavého an- otovánı́trénovacı́ch textů. Metoda klasifikace pomocı́klı́čových slov hledá klı́čová slova, jejichž výskyt v textu pomáhá určit klasifikačnı́ třı́du. Hledánı́ těchto klı́čových slov je pro člověka náročný proces. Proto předkládáme nový interak- tivnı́klı́čovoslovnı́identifikátor, který má za cı́l tento proces značně ulehčit. Mimo jiné je v něm použit model podobnosti slov pro samovolné doporučovánı́ nových klı́čových slov uživateli. Vytvořili jsme prototyp navrženého interaktivnı́ho identi- fikátoru a použili jsme ho k provedenı́ uživatelské studie na problému vı́cetřı́dové klasifikace recenzı́ restauracı́, abychom potvrdili schůdnost tohoto přı́stupu.
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce) ; Harašta, Jakub (oponent) ; Pecina, Pavel (oponent)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Comparison of approaches to text classification
Knížek, Jan ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
The focus of this thesis is short text classification. Short text is the prevailing form of text on e-commerce and review platforms, such as Yelp, Tripadvisor or Heureka. As the popularity of the online communication is increasing, it is becoming infeasible for users to filter information manually. It is therefore becoming more and more important to recog- nise the relevant information in text. Classification of reviews is especially challenging, because they have limited structure, use informal language, contain a high number of errors and rely heavily on context and common knowledge. One of the possible appli- cations of machine learning is to automatically filter data and show users only relevant pieces of information. We work with restaurant reviews from Yelp and aim to predict their usefulness. Most restaurants have relatively many reviews, yet only few are truly useful. Our objective is to compare machine learning methods for predicting usefulness. 1
Detecting semantic relations in texts and their integration with external data resources
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce)
Tato dizertační práce se zabývá automatickou extrakcí sémantických vztahů z textů. Jsou zkoumány jak metody strojového učení tak i pravidlový přístup. Pro každý přístup se experimentálně ověřuje vliv různých nástrojů pro zpracování přirozeného jazyka na úspěšnost systému. V práci implementujeme systém RExtractor, a vylepšujeme několik nástrojů pro zpracování přirozeného jazyka: od větné segmentace a tokenizace až ke automatickým syntaktickým parserům. Kromě toho, představujeme Český korpus právních textů s několika vrstvami anotací. Korpus byl použit na trénování a testování všech komponent systému RExtractor. Výsledky a nástroje v předkládané práci byli publikovány jako nové zdroje v projektu Sémantického webu.
Prediction of sports results using neural networks
Šipoš, Daniel ; Kuboň, David (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Práca sa zameriava na vytvorenie modelov dvoch odlišných druhov neurónových sietí slúžiacich na predpovedanie výsledkov vybraných futbalových a tenisových zápasov a porovnanie týchto modelov z hľadiska percentuálnej úspešnosti a po- tenciálneho zisku, ak by sme na dané zápasy uzatvárali stávku v priemernej medzinárodnej stávkovej kancelárii. Porovnávané druhy neurónových sietí sú do- predná neurónová sieť a rekurentná neurónová sieť. Predikované futbalové zápasy sú tvorené ligovými zápasmi z troch európskych líg. Špecifikom je sledovanie úspešnosti na zápasoch, v ktorých ani jeden z tímov nie je jasným favoritom podľa stávkových kancelárií. 1
Předpovídání trendů akciového trhu z novinových článků
Serebryannikova, Anastasia ; Kuboň, Vladislav (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
In this work we made an attempt to predict the upwards/downwards movement of the S&P 500 index from the news articles published by Bloomberg and Reuters. We employed the SVM classifier and conducted multiple experiments aiming at understanding the shape of the data and the specifics of the task better. As a result, we established the common evaluation settings for all our subsequent experiments. After that we tried incorporating various features into the model and also replicated several approaches previously suggested in the literature. We were able to identify some non-trivial dependencies in the data which helped us achieve a high accuracy on the development set. However, none of the models that we built showed comparable performance on the test set. We have come to the conclusion that whereas some trends or patterns can be identified in a particular dataset, such findings are usually barely transferable to other data. The experiments that we conducted support the idea that the stock market is changing at random and a high quality of prediction may only be achieved on particular sets of data and under very special settings, but not for the task of stock market prediction in general. 1
Zkoumání úlohy univerzálního sémantického značkování pomocí neuronových sítí, řešením jiných úloh a vícejazyčným učením
Abdou, Mostafa ; Vidová Hladká, Barbora (vedoucí práce) ; Libovický, Jindřich (oponent)
July 19, 2018 V diplomové práci prezentujeme výzkum paralelního a přenosového učení s využitím nedávno představené úlohy sémantického značkování. Zaprvé vybrané úlohy počítačového zpracování přirozeného jazyka používáme jako podpůrné úlohy pro sémantické značkování. Zadruhé se vydáváme opačným směrem, a sice sémantické značkování používáme jako podpůrnou úlohu pro tři různé úlohy počí- tačového zpracování přirozeného jazyka: tvaroslovné značkování, parsing na platformě Univer- sal Dependencies a odvozování v přirozeném jazyce. Porovnáváme úplné a částečné sdílení neu- ronových sítí spolu s učením s méně pravděpodobným nastavením negativního přenosu mezi úlo- hami. Na závěr zkoumáme vícejazyčné učení v paralelním učení. V experimentech demonstrujeme různé kombinace paralelního učení a přenosového učení. Výsledky jsou pozitivní. 1 References 2

Národní úložiště šedé literatury : Nalezeno 64 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.