Original title:
Aplikace metod předzpracování při dolování znalostí z textových dat
Authors:
Kotíková, Michaela Document type: Master’s theses
Year:
2014
Language:
cze Abstract:
[cze][eng] Diplomová práce se zabývá předzpracováním textu při dolování znalostí z těchto nestrukturovaných textových dat. V rámci práce je navržena a realizována série experimentů zaměřených na text mining. Na základě výstupu těchto experimentů je zhodnocen vliv různých technik předzpracování dat na průběh celého procesu dolování znalostí a na jeho výsledky.The diploma thesis focuses on unstructured textual data preprocessing in relation to text mining. A series of experiments oriented to text mining is designed and carried out. The effect of different techniques of textual data preprocessing to the entire text mining process and its results is evaluated based on output of the experiments.
Keywords:
Cluto; dolování znalostí z textových dat; klasifikace; kontrola a korekce pravopisu; metody předzpracování textových dat; mínění zákazníků; nestrukturovaná data; odstranění stopslov; přirozený jazyk; shlukování