Název:
Klasifikace zveřejněného obsahu
Překlad názvu:
A Classification of a Syndicated Content
Autoři:
Matušov, Izidor ; Očenášek, Pavel (oponent) ; Smrčka, Aleš (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2011
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Tato práce pojednává o klasifikaci zveřejněného obsahu jako o způsobu jeho organizace. Klasifikace využívá algoritmy pro zpracování přirozeného jazyka, speciálně pro angličtinu. Hlavním přínosem práce je aplikace algoritmu pro odstraňování nejednoznačnosti významů slov z textu. Pro zpříjemnění práce s výslednou aplikací je snaha o eliminaci fáze učení a možnost organizace obsahu na základě stylu, kterým je napsán. Aplikace je implementována jako rozšiřitelný server-klient model. V rámci práce byli vytvořeni dva klienti: webová čtečka zpráv a export článků prostředníctvím RSS formátu. V závěru práce se pojednává o možném pokračování v budoucnu.
This work deals with a classification of a syndicated content as the possible way of organizing the content. The classification uses algorithms for natural language processing. The main contribution is applying word sense disambiguation algorithm for enhancing the classification, eliminating the learning stage, and using a readability test for improving user experience. The application is implemented as an extensible server-client model. The future work is discussed in the end.
Klíčová slova:
anglický jazyk; klasifikace textu; NLP; RSS; zveřejněný obsah; English language; NLP; RSS; syndicated content; text classification
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/52977