Original title:
Porovnávání dokumentů na základě vizuálních rysů
Translated title:
Document Comparison Based on Visual Features
Authors:
Milička, Martin ; Bartík, Vladimír (referee) ; Burget, Radek (advisor) Document type: Master’s theses
Year:
2011
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[eng][cze]
Obsahem této práce je návrh metody porovnání webových stránek na základě vizuálních rysů. Na začátku jsou popsány možné přístupy k porovnávání dokumentů s ohledem na jejich použití. Dále jsou prezentovány přístupy porovnávání zaměřené na vizuální vzhled dokumentů. Zde jsou nejdříve popsány metody pro porovnávání z vyrendrovaného obrázku dokumentu a pak přístup pomocí zdrojového kódu. Tato práce je dále detailně zaměřena na získání vizuální rysů ze zdrojového kódu dokumentu. Je zde popsán návrh nové metody pro porovnávání dokumentů na základě vizuálních rysů, která využívá strukturální popis dokumentu. Součástí je taky popis implementace aplikace a dosažené výsledky. V závěru jsou informace o možném rozšíření navržené metody a dalším pokračování.
The content of this thesis presents a design of the Web page comparison method that is based on visual features. At the beginning, the possible ways of the document comparison with regard to their use are described. The approaches concerning visual document comparison are presented in the next chapter. At first, the description is focused on the rendered image of page and then to a source code approach. This document is also focused on obtaining visual features from the source code. As a part of this thesis is a proposal of new approach for a document comparison based on visual features that uses structural document description. The proposal method is implemented in the application. One chapter also shows the results. The conclusion contains information for a future work.
Keywords:
analýza webového dokumentu; komprese webového dokumentu; porovnání webových dokumentů.; Vizuální podobnost; vizuální znaky; visual features; Visual similarity; web document analysis; web document comparison.; web document compression
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/54115