Original title:
Explorace v nestrukturovaných datech podle obsahu
Translated title:
Content-based exploration of unstructured data
Authors:
Čech, Přemysl ; Lokoč, Jakub (advisor) ; Barthel, Kai Uwe (referee) ; Gudmundsson, Gylfi Thor (referee) Document type: Doctoral theses
Year:
2020
Language:
eng Abstract:
[eng][cze] Effective analysis, searching and browsing throughout arbitrary multimedia collections is still a challenging task. To perform a search among multimedia objects, first, a similarity model has to be defined. Such a model establishes methods describing how the content of individual objects is processed and how key features and descriptors, that are used for modeling similarity between objects, are formed. This task is not trivial since there can be many ways of determining how to comprehend the content of multimedia data. Furthermore, with the growing size of contemporary database collections, multimedia retrieval and exploration are extremely computationally intensive. Hence, researchers investigate support indexing structures that can evaluate similarity queries and can respond to user's queries in almost real-time even on datasets counting billions of objects. Another very important aspect of a retrieval system is the user interface for defining queries as well as presenting retrieved results. A multimedia system should offer various inputs for formulating user's queries, especially for situations in which a user cannot provide an ideal query example. Finally, a well- arranged and easy to read interface for visualization of retrieved results is essential for the success of a multimedia exploration and...Efektivní analýza, vyhledávání a procházení libovolných multimediálních kolekcí je stále náročný úkol. Pro potřeby porovnání multimediálních objektů musí být nejprve definován model podobnosti. Ten popisuje, jak zpracovat obsah jednotlivých objektů a jak z něj následně vytěžit klíčové vlastnosti, které lze použít pro porovnání dat. Tento úkol není snadný, protože existuje mnoho způsobů, jak porozumět obsahu multimediálních objektů. S rostoucí velikostí dat je navíc průzkum a analýza současných multimédiální databází mimořádně výpočetně náročná. Vědci proto zkoumají podpůrné indexační struktury, které mohou efektivně vyhodnotit podobnostní dotazy a dokážou reagovat na požadavky uživatelů téměř v reálném čase, a to dokonce i na datových sadách obsahujících až miliardy objektů. Dalším velmi důležitým aspektem jakéhokoliv vyhledávacího systému je uživatelské rozhraní pro definování dotazů a prezentaci získaných výsledků. Multimediální systém by měl nabízet různé možnosti pro formulaci uživatelských dotazů. Ty se hodí zejména v situacích, kdy uživatel nedokáže specifikovat ideální dotaz nebo příklad pro vyhledávání. V neposlední řadě je pro úspěch jakéhokoliv vyhledávacího sytému nezbytné přehledné a snadno čitelné rozhraní pro zobrazování získaných dat. V této disertační práci představujeme mnoho aspektů...
Keywords:
Content-based retrieval; exploration; similarity search; unstructured data; explorace; nestrukturovaná data; podobnostní vyhledávání; Vyhledávání dle obsahu
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/117069