Název:
Sofistikované metody pro kontrolu elektronických textů
Překlad názvu:
Sophisticated methods for electronic text checking
Autoři:
Flégl, Jan ; Malý, Jan (oponent) ; Pfeifer, Václav (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tato práce se zabývá problematikou plagiátorství zdrojových kódů a textových dokumentů. Naším cíle je popsat známé metody, seznámit se s komerčními programy a vytvořit vlastní program na odhalování plagiátů. V úvodu teoretické části definujeme pojem plagiát a plagiátor. Dozvíme se také stručnou historii plagiátorství a jeho současný stav v České republice. Dále se budeme zabývat rozdělením nástrojů pro detekci plagiátů, syntaktickou analýzou a způsoby, jak plagiát odhalit. Funkci jednotlivých metrik si ukážeme na jednoduchých příkladech. Objasníme si také funkci grafické metody s porovnáváním řádků. U všech metod definujeme výhody a nevýhody jejich použití. V závěru teoretické části se budeme zabývat komerčními programy. V praktické části vytvoříme vlastní program, který porovnává dva zdrojové kódy s použitím statistických přístupových metod. Jeho funkci a schopnost odhalit plagiát ověříme na námi vytvořeném korpusu zdrojových kódů.
The work is about plagiarism of source codes and text documents. We’d like to describe common known methods, learn something about commercial programs and make our own plagiarism detection software. At the beginning of introduction to the theoretical part we will define the plagiarism. We will also learn something about the history of plagiarsm and its situation in the Czech Republic. We will find out something about syntactic analysis, tools we can use to detect plagiarisms and how to discover it. We will see the function of the metrics on easy exercises. We will clear up the function of graphic method with line comparing. We will define advantages and disadvantages of all methods. At the end of the theoretical part we will find out something about commercial programs. In practical part we will make our own program which compares two source codes by using statistical access methods. We will check its function and ability to detect plagiarism by corpus of source codes which we will create.
Klíčová slova:
autorská práva; korpus; metrika; plagiát; plagiátorství; zdrojový kód; copyright; corpus; metric; plagiarism; source code
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/12213