Název:
Sémantická blízkost pro vědecké články
Překlad názvu:
Semantic Relatedness of Scientific Articles
Autoři:
Dresto, Erik ; Schmidt, Marek (oponent) ; Otrusina, Lubomír (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2011
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Hlavním cílem této práce je prozkoumat základní metody používající se k hledání sémantické blízkosti pro vědecké články. Jednotlivé metody budou podrobně vysvětleny, porovnány a ve výsledku ohodnoceny podle úspěšnosti. Na základě získaných znalostí bude navržena nová metoda pro výpočet podobnosti vědeckých článků, která by měla předčit ostatní dostupné metody tím, že spojí to nejlepší v dostupných algoritmech a přidá důležitý faktor pro podobnost, a to citace. Citace je důležitá z důvodu, že se jedná o statickou vazbu mezi články. Závěrem bude vytvořený algoritmus otestován na reálných testovacích datech a výsledky budou vyhodnoceny v porovnání s dostupnými metodami.
The main goal of the thesis is to explore basic methods which can be used to find semantically related scientific articles. All the methods are explained in detail, compared and in the end evaluated by the standard metrics. Based on the evaluation, a new method for computing semantic similarity of scientific articles is proposed. The proposed method is based on the current state-of-the-art methods and adds the another important factor for computing similarity - citations. Using citations is important, since they represent a static bond between the articles. Finally, the proposed method is evaluated on the real data and compared with other described methods.
Klíčová slova:
citace; klíčová slova; LSA; průnik termínů; random indexing; sémantická blízkost; vědecké články; citation; keywords; LSA; random indexing; scientific articles; semantic similarity; term intersection
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/54063