Original title:
Detekce plagiátů textových dokumentů
Translated title:
Plagiarism detection of text documents
Authors:
Lízal, Radek ; Vítek, Martin (referee) ; Smital, Lukáš (advisor) Document type: Master’s theses
Year:
2016
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[cze][eng]
Tato diplomová práce se zabývá seznámením s definicí plagiátu, rozlišuje, jaké typy plagiátorství se v praxi často objevují a jak se texty podezřelé na plagiátorství vyhledávají. Způsoby detekce jsou při tomto vyhledávání zcela zásadní, tudíž se jim věnuje celá kapitola. V práci se rovněž objevují ukázky programů, které jsou v praxi již používány. Následující kapitola seznamuje s vybranými typy příznaků, které byly implementovány v prostředí Matlab k vytvoření detektoru plagiátů v textovém dokumentu. Vytvořený program je popsán v osmé kapitole. Použité příznaky a chování detektoru jsou otestovány v kapitole nazvané testování příznaků. Testováním byla zjištěna kvalita těchto příznaků. V závěru jsou pak diskutovány výsledky, zároveň s výhodami a nevýhodami detektoru.
This diploma thesis introduces the definition of plagiarism, distinguishes the types of plagiaries which often take place in praxis and the ways of determining the suspected texts. The means of detection are essential; therefore a whole chapter is dedicated to those. For the detection purposes, it is vital to pre-process the data to reduce the demand factor of the program. There is a preview of some programs which are already being used for the detection of plagiarism. The following chapter introduces some selected indications which have been implemented in the Matlab environment to create a detector of plagiaries in text documents. The created program is described in chapter eight. The applied indications and the detector response are described in a chapter called Indications testing. The testing proved the quality of these indications. The results together with pros and cons of the particular methods are discussed in the conclusion.
Keywords:
corpus; database; detection; indication; Plagiarism; databáze; detekce; korpus; Plagiátorství; příznak.
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/38892