Original title:
Přibližné vyhledávání řetězců
Translated title:
Aproximate String Matching
Authors:
Toth, Róbert ; Košař, Vlastimil (referee) ; Kaštil, Jan (advisor) Document type: Bachelor's theses
Year:
2011
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Tato práce se zabývá problémem přibližného vyhledávání řetězců, označovaným též jako vyhledávání s chybami. Nejprve bude definován problém samotný a demonstrována rozmanitost jeho využití, následována krátkým shrnutím rozdílných přístupů k této problematice. Zbývající část práce bude zaměřena na algoritmy založené na využití deterministických konečných automatů. Budou představeny hlavní algoritmy v této oblasti. Ty budou následně implementovány v programovacím jazyku Python a jejich výkonnost důkladně otestována na sérii experimentů.
This thesis deals with the problem of approximate string matching, ie. string matching allowing errors. Initially, we will define the problem itself and demonstrate variety of it's applications, followed by short survey of different approaches to cope with this problem. The remaining part of the work is focused on algorithms based on the use of deterministic finite automatons. Main algorithms in this area will be presented. Those will be implemented in Python programming language and thoroughly compared in series of experiments.
Keywords:
approximate string matching; finite automata; fuzzy searching; inexact searching; searching with errors; konečné automaty; nepřesné vyhledávání; přibližné vyhledávání řetězců; vyhledávání s chybami
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/55855