Original title:
Dolování znalostí z vícejazyčných textových dat
Authors:
Svozil, Luděk Document type: Bachelor's theses
Year:
2017
Language:
cze Abstract:
[cze][eng] Práce se zaměřuje na využití strojového překladu při řešení problémů klasifikace a organizace vícejazyčných textových dat. Pomocí experimentů na datech z reálného světa jsou prezentovány pozitivní i negativní dopady překladu. Bylo potvrzeno, že díky překladu je možno použít anglickou trénovací množinu i pro jiné jazyky.This paper focuses on the use of machine translation in solving the problems of classification and organization of multilingual text data. Both positive and negative effects of the translation are demonstrated on experiments using real world data. It was confirmed that thanks to the translation the English training set can be used for other languages.
Keywords:
C5; dolování znalostí z textu; klasifikace; strojové učení; strojový překlad; SVM