Název:
Sémantická analýza částečně stukturovaných zdrojů
Překlad názvu:
Semantics Detection in Partially Structured Sources
Autoři:
Suchan, Martin ; Zavoral, Filip (vedoucí práce) ; Dědek, Jan (oponent) Typ dokumentu: Diplomové práce
Rok:
2010
Jazyk:
eng
Abstrakt: [eng][cze] The goal of this thesis is the comparison of methods for analysis of structured data sources, such as emails or HTML pages. The work focuses on practical assessment of common characteristics of these documents, which can be used for analysis, data extraction and cataloging for subsequent use. The work also includes a sample implementation of a program for cataloging data from emails and tracing changes in online sources.Obsahem této práce je porovnání možností analýzy strukturovaných zdrojů dat, jako jsou emaily či HTML stránky. Práce se zaměřuje na praktické zhodnocení společných znaků těchto dokumentů, které lze využít k analýze, extrakci dat a katalogizaci pro následné využití. Práce také obsahuje ukázkovou implementaci programu pro katalogizaci dat z emailů a dohledávání změn ve zdrojích dostupných online.