Název:
Dolování znalostí z vícejazyčných textových dat
Autoři:
Svozil, Luděk Typ dokumentu: Bakalářské práce
Rok:
2017
Jazyk:
cze
Abstrakt: [cze][eng] Práce se zaměřuje na využití strojového překladu při řešení problémů klasifikace a organizace vícejazyčných textových dat. Pomocí experimentů na datech z reálného světa jsou prezentovány pozitivní i negativní dopady překladu. Bylo potvrzeno, že díky překladu je možno použít anglickou trénovací množinu i pro jiné jazyky.This paper focuses on the use of machine translation in solving the problems of classification and organization of multilingual text data. Both positive and negative effects of the translation are demonstrated on experiments using real world data. It was confirmed that thanks to the translation the English training set can be used for other languages.
Klíčová slova:
C5; dolování znalostí z textu; klasifikace; strojové učení; strojový překlad; SVM