| |
| |
|
Inteligentní systém pro účast v soutěži SSCAI
Horázný, Václav ; Škoda, Petr (oponent) ; Smrž, Pavel (vedoucí práce)
V této práci se zabývám vytvořením umělé inteligence tak, aby splňovala podmínky pro uvedení do soutěže SSCAI Tournament. Obsahuje charakteristiku a herní mechaniky hry Starcraft: Brood War, popis pravidel zmíněné soutěže a běžně hrané druhy strategií se zaměřením na civilizaci Zerg a to konkrétně strategie Pool Rush. V soutěži jsem se umístil na sdíleném 10. a 11. místě ze 42zúčastněných. Umělou inteligenci jsem vytvořil pro hru Starcraft: Brood War (1.16.1). Práce obsahuje implementaci dvou agentů ScoutManager a DefenseManager. K těmto agentům jsou připojení již vytvoření agenti z projektu BWSAL. K vytvoření jsem využil vývojového prostředí Microsoft Visual Studio 2008 (9.0). Pro spuštění umělé inteligence je nutné využít programu Chaoslauncher a využít knihoven BWAPI a BWTA. Práce obsahuje porovnání mnou vytvořeného programu s ostatními zúčastněnými, jak z pohledu způsobu implementace, tak i podle konkrétně volených strategií.
|
| |
|
Using Explicit Semantic Analysis to Link in Multi-Lingual Document Collections
Žilka, Lukáš ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Keeping links in quickly growing document collections up-to-date is problematic, which is exacerbated by their multi-linguality. We utilize Explicit Semantic Analysis to help identify relevant documents and links across languages without machine translation. We designed and implemented several approaches as a part of our link discovery system. Evaluation was conducted on Chinese, Czech, English and Spanish Wikipedia. Also, we discuss the evaluation methodology for such systems and assess the agreement between links on different versions of Wikipedia. In addition, we evaluate properties of Explicit Semantic Analysis which are important for its practical use.
|
|
Czech-English Translation
Petrželka, Jiří ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
This Master's thesis describes the principles of statistical machine translation and demonstrates how to assemble the Moses statistical machine translation system. In the preparation step, a research on freely available bilingual Czech-English corpora is done. An empirical analysis of time requirements of multithreaded word alignment tools demonstrates that MGIZA++ can achieve a five-fold speed-up, while PGIZA++ can reach an eight-fold speed-up (compared to GIZA++).Three scenarios of morphological pre-processing of Czech training data are tested, using simple unfactored models. While pure lemmatization can aggravate the BLEU, more sophisticated approaches usually raise BLEU. The positive effect of morphological pre-processing diminishes as corpus size rises. The relation between other corpora characteristics (size, genre, extra data) and the resulting BLEU are empirically gauged. A final system is trained on the CzEng 0.9 corpus and evaluated on the testing set from WMT 2010 workshop.
|
|
Průvodce konferencí
Viktorin, Petr ; Beran, Vítězslav (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je seznámení se s~metodami získávání sémantických informací z textu. Je popsána ad hoc metoda pro zpracování programů konferencí a dvě metody odhadu podobnosti krátkých textů založené na formálním popisu. Tyto metody jsou aplikovány na problém doporučení individuálního programu vědecké konference.
|
| |
|
Struktury trie pro zpracování rozsáhlých textových dat
Rajčok, Andrej ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Táto práca rozoberá spracovanie prirodzeného jazyka so zameraním sa na morfologickú analýzu a spoznávanie pomenovaných entít. Rozoberá efektívne vyhľadávanie v slovníkoch a v ňom používaných špecializovaných stručných štruktúr a ich praktické implementácie. Popisuje návrh a implementáciu systému pre spoznávanie pomenovaných entít a morfologického analyzátora za využitia stručných štruktúr a nakoniec porovnáva a testuje ich efektivitu a rýchlosť.
|
|
Adaptivní RSS čtečka
Luža, Jindřich ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Práce se zabývá možností obohacením běžné RSS čtečky o~rozšíření umožnující uživateli jednodušeji filtrovat RSS záznamy na základě jejich zařazení do skupin podle obsahu jejich textu. Jsou zde probrány problémy které vznikají při obecné klasifikaci a při klasifikaci textů. Dále je zde poukázáno na nutné teoretické aspekty formátu RSS, které je potřeba zvažovat při implementaci modulu RSS čtečky a možná podoba návrhnu modulu. Jako poslední je zde uvedeno testování vhodnosti použité klasifikátoru.
|