Original title:
Ontology Enrichment Based on Unstructured Text Data
Translated title:
Ontology Enrichment Based on Unstructured Text Data
Authors:
Lukšová, Ivana ; Nečaský, Martin (advisor) ; Kozák, Jakub (referee) Document type: Master’s theses
Year:
2013
Language:
eng Abstract:
[eng][cze] Title: Ontology Enrichment Based on Unstructured Text Data Author: Ivana Lukšová Department: Department of Software Engineering Supervisor: Mgr. Martin Nečaský, Ph.D., Department of Software Engi- neering Abstract: Semantic annotation, attaching semantic information to text data, is a fundamental task in the knowledge extraction. Several ontology-based semantic annotation platforms have been proposed in recent years. However, the process of automated ontology engineering is still a challenging problem. In this paper, a new semi-automatic method for ontology enrichment based on unstructured text is presented to facilitate this process. NLP and ma- chined learning methods are employed to extract new ontological elements, such as concepts and relations, from text. Our method achieves F-measure up to 71% for concepts extraction and up to 68% for relations extraction. Keywords: ontology, machine learning, knowledge extraction 1Název práce: Rozširovaní ontologie z nestrukturovaného textu Autor: Ivana Lukšová Katedra: Katedra softwarového inženýrství Vedoucí diplomové práce: Mgr. Martin Nečaský, Ph.D., Katedra soft- warového inženýrství Abstrakt: Sémantická anotace - přirazení sémantických informací k textu - je základní úloha v oblasti získávaní znalostí. V posledních letech byly navrženy víceré platformy pro sémantickou anotaci, avšak automatické vytváření ontologií z textu je stále náročný problém. V této práci je představena nová metoda pro polo-automatické rozšiřovaní ontologie z nestrukturovaného textu, která by měla tento proces usnadnit. Nové elementy ontologie, jako koncepty a relace, jsou extrahovány z textu - zapojením metod zpracovaní přirozeného jazyka a strojového učení. Naše metoda dosahuje F-skóre až 71% pro ex- trakci konceptů a až 68% pro extrakci relací. Klíčová slova: ontologie, strojové učení, získavaní znalostí 1
Keywords:
knowledge extraction; machine learning; ontology; knowledge extraction; machine learning; ontology
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/55298