Název:
Explorace v nestrukturovaných datech podle obsahu
Překlad názvu:
Content-based exploration of unstructured data
Autoři:
Čech, Přemysl ; Lokoč, Jakub (vedoucí práce) ; Barthel, Kai Uwe (oponent) ; Gudmundsson, Gylfi Thor (oponent) Typ dokumentu: Disertační práce
Rok:
2020
Jazyk:
eng
Abstrakt: [eng][cze] Effective analysis, searching and browsing throughout arbitrary multimedia collections is still a challenging task. To perform a search among multimedia objects, first, a similarity model has to be defined. Such a model establishes methods describing how the content of individual objects is processed and how key features and descriptors, that are used for modeling similarity between objects, are formed. This task is not trivial since there can be many ways of determining how to comprehend the content of multimedia data. Furthermore, with the growing size of contemporary database collections, multimedia retrieval and exploration are extremely computationally intensive. Hence, researchers investigate support indexing structures that can evaluate similarity queries and can respond to user's queries in almost real-time even on datasets counting billions of objects. Another very important aspect of a retrieval system is the user interface for defining queries as well as presenting retrieved results. A multimedia system should offer various inputs for formulating user's queries, especially for situations in which a user cannot provide an ideal query example. Finally, a well- arranged and easy to read interface for visualization of retrieved results is essential for the success of a multimedia exploration and...Efektivní analýza, vyhledávání a procházení libovolných multimediálních kolekcí je stále náročný úkol. Pro potřeby porovnání multimediálních objektů musí být nejprve definován model podobnosti. Ten popisuje, jak zpracovat obsah jednotlivých objektů a jak z něj následně vytěžit klíčové vlastnosti, které lze použít pro porovnání dat. Tento úkol není snadný, protože existuje mnoho způsobů, jak porozumět obsahu multimediálních objektů. S rostoucí velikostí dat je navíc průzkum a analýza současných multimédiální databází mimořádně výpočetně náročná. Vědci proto zkoumají podpůrné indexační struktury, které mohou efektivně vyhodnotit podobnostní dotazy a dokážou reagovat na požadavky uživatelů téměř v reálném čase, a to dokonce i na datových sadách obsahujících až miliardy objektů. Dalším velmi důležitým aspektem jakéhokoliv vyhledávacího systému je uživatelské rozhraní pro definování dotazů a prezentaci získaných výsledků. Multimediální systém by měl nabízet různé možnosti pro formulaci uživatelských dotazů. Ty se hodí zejména v situacích, kdy uživatel nedokáže specifikovat ideální dotaz nebo příklad pro vyhledávání. V neposlední řadě je pro úspěch jakéhokoliv vyhledávacího sytému nezbytné přehledné a snadno čitelné rozhraní pro zobrazování získaných dat. V této disertační práci představujeme mnoho aspektů...
Klíčová slova:
explorace; nestrukturovaná data; podobnostní vyhledávání; Vyhledávání dle obsahu; Content-based retrieval; exploration; similarity search; unstructured data