Název:
Výběr atributů při dolování znalostí z textových dat
Autoři:
Balák, Filip Typ dokumentu: Diplomové práce
Rok:
2018
Jazyk:
cze
Abstrakt: [cze][eng] Diplomová práce se zabývá využitím výběru atributů při dolování znalostí z textových dat. V rámci práce je navržena a realizována série experimentů zaměřených na dolovaní znalostí z textových dat. Na základě výstupu těchto experimentů je zhodnocen vliv různých metod výběru atributů na průběh celého procesu dolování znalostí a na jeho výsledky. Součástí experimentů je vyhodnocení vlivu rozdílných jazyků a velikostí datových kolekcí.The diploma thesis focuses on using feature selection in text mining. Series of experiments oriented on text mining are designed and carried out. The effect of different methods of feature selection to the entire text mining process and its results are evaluated based on output of the experiments. As part of evaluation process is also discovering influance of using different languages and sizes of data collections.
Klíčová slova:
dolování znalostí z dat; K-means; Naivní Bayes; Náhodný les; Python; strojové učení; výběr atributů