Název:
Hodnocení datových zdrojů pomocí reputačního systému
Překlad názvu:
Ranking Data Sources by Reputation System
Autoři:
Řimnáč, Martin ; Špánek, Roman Typ dokumentu: Příspěvky z konference Konference/Akce: DATAKON 2009, Srní (CZ), 2009-10-10 / 2009-10-13
Rok:
2009
Jazyk:
cze
Abstrakt: [cze][eng] Hodnocení kvality obsahu webových stránek je jeden ze stěžejních problémů řešených již od počátku používání webových technologií. Zatímco samotné pojetí kvality může být značně subjektivní, různé vyhledávací techniky používají nepřímé míry pro ohodnocení webových stránek, např. PageRank odvozuje kvalitu od počtu dokumentů odkazujících na stránku. Příspěvek navrhuje nový přístup založený na analýze relevantní části obsahu webových stránek; prezentovaná data jsou porovnávána mezi různými zdroji a na základě těchto porovnání jsou vypočteny míry odrážející kvalitu dat. Použití takových měr je ilustrováno na reálných webových zdrojích prezentujících výsledky tenisových zápasů.The paper proposes a criterion enabling analysis of novelty of data provided by web sources. Such a criterion may help an end user to find an actual web source, always presenting high quality data. Alternatively, the criterion can be used as a component allowing a reputation system to manage meta-data about web sources. The source reputation has a significant role in source quality evaluation as well as in solving inconsistencies caused by integration of several web sources. The proposed criterion has been experimentally verified on real data presenting actual states of a tennis game.
Klíčová slova:
aktuálnost dat; reputace; získávání dat Číslo projektu: CEZ:AV0Z10300504 (CEP), 1M0554 (CEP) Poskytovatel projektu: GA MŠk Zdrojový dokument: Datakon 2009, ISBN 978-80-245-1568-7
Instituce: Ústav informatiky AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0174536