Original title:
Hodnocení datových zdrojů pomocí reputačního systému
Translated title:
Ranking Data Sources by Reputation System
Authors:
Řimnáč, Martin ; Špánek, Roman Document type: Papers Conference/Event: DATAKON 2009, Srní (CZ), 2009-10-10 / 2009-10-13
Year:
2009
Language:
cze Abstract:
[cze][eng] Hodnocení kvality obsahu webových stránek je jeden ze stěžejních problémů řešených již od počátku používání webových technologií. Zatímco samotné pojetí kvality může být značně subjektivní, různé vyhledávací techniky používají nepřímé míry pro ohodnocení webových stránek, např. PageRank odvozuje kvalitu od počtu dokumentů odkazujících na stránku. Příspěvek navrhuje nový přístup založený na analýze relevantní části obsahu webových stránek; prezentovaná data jsou porovnávána mezi různými zdroji a na základě těchto porovnání jsou vypočteny míry odrážející kvalitu dat. Použití takových měr je ilustrováno na reálných webových zdrojích prezentujících výsledky tenisových zápasů.The paper proposes a criterion enabling analysis of novelty of data provided by web sources. Such a criterion may help an end user to find an actual web source, always presenting high quality data. Alternatively, the criterion can be used as a component allowing a reputation system to manage meta-data about web sources. The source reputation has a significant role in source quality evaluation as well as in solving inconsistencies caused by integration of several web sources. The proposed criterion has been experimentally verified on real data presenting actual states of a tennis game.
Keywords:
aktuálnost dat; reputace; získávání dat Project no.: CEZ:AV0Z10300504 (CEP), 1M0554 (CEP) Funding provider: GA MŠk Host item entry: Datakon 2009, ISBN 978-80-245-1568-7
Institution: Institute of Computer Science AS ČR
(web)
Document availability information: Fulltext is available at the institute of the Academy of Sciences. Original record: http://hdl.handle.net/11104/0174536