Original title:
Sofistikované metody pro kontrolu elektronických textů
Translated title:
Sophisticated methods for electronic text checking
Authors:
Flégl, Jan ; Malý, Jan (referee) ; Pfeifer, Václav (advisor) Document type: Bachelor's theses
Year:
2009
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tato práce se zabývá problematikou plagiátorství zdrojových kódů a textových dokumentů. Naším cíle je popsat známé metody, seznámit se s komerčními programy a vytvořit vlastní program na odhalování plagiátů. V úvodu teoretické části definujeme pojem plagiát a plagiátor. Dozvíme se také stručnou historii plagiátorství a jeho současný stav v České republice. Dále se budeme zabývat rozdělením nástrojů pro detekci plagiátů, syntaktickou analýzou a způsoby, jak plagiát odhalit. Funkci jednotlivých metrik si ukážeme na jednoduchých příkladech. Objasníme si také funkci grafické metody s porovnáváním řádků. U všech metod definujeme výhody a nevýhody jejich použití. V závěru teoretické části se budeme zabývat komerčními programy. V praktické části vytvoříme vlastní program, který porovnává dva zdrojové kódy s použitím statistických přístupových metod. Jeho funkci a schopnost odhalit plagiát ověříme na námi vytvořeném korpusu zdrojových kódů.
The work is about plagiarism of source codes and text documents. We’d like to describe common known methods, learn something about commercial programs and make our own plagiarism detection software. At the beginning of introduction to the theoretical part we will define the plagiarism. We will also learn something about the history of plagiarsm and its situation in the Czech Republic. We will find out something about syntactic analysis, tools we can use to detect plagiarisms and how to discover it. We will see the function of the metrics on easy exercises. We will clear up the function of graphic method with line comparing. We will define advantages and disadvantages of all methods. At the end of the theoretical part we will find out something about commercial programs. In practical part we will make our own program which compares two source codes by using statistical access methods. We will check its function and ability to detect plagiarism by corpus of source codes which we will create.
Keywords:
copyright; corpus; metric; plagiarism; source code; autorská práva; korpus; metrika; plagiát; plagiátorství; zdrojový kód
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/12213