Název:
Aplikace metod strojového učení na dolování znalosti z dat
Autoři:
Kraus, Jan Typ dokumentu: Diplomové práce
Rok:
2014
Jazyk:
cze
Abstrakt: [cze][eng] Diplomová práce se zabývá problematikou dolování znalostí z rozsáhlých kolekcí textových dat. Konkrétně je práce zaměřena na analýzu sentimentu uživatele na základě subjektivního slovního hodnocení v přirozeném jazyce. Teoretická část diplomové práce seznamuje čtenáře se základními pojmy z oblasti strojového učení a získávání znalostí zejména z rozsáhlých textových kolekcí. Dále jsou v této části popsány metody předzpracování textových dat a principy algoritmů strojového učení. V praktické části práce jsou navrženy samotné experimenty, které jsou ná-sledně realizovány pomocí softwarového nástroje SPSS Modeler. Experimentální část je zaměřena zejména na identifikaci význačných atributů a nalezení vztahů mezi nimi. Důraz je kladen zvláště na důkladnou interpretaci dosažených výsledků.The diploma thesis deals with the area of data mining applied to large collections of textual data. Specifically the thesis is focused on sentiment analysis based on the user's subjective verbal assessment in natural language. The first part of the diploma thesis introduces the reader to basic terms of machine learning and data mining applied particularly to large textual data collections. Following is the description of textual data preprocessing methods and principles of machine learning algorithms. In the practical part of this thesis there are experiments designed and subsequently executed using the SPSS Modeler tool. The experimental part is focused especially on identification of significant attributes and recongnition of relationships between them. The emphasis is put especially on thorough interpretation of the results obtained.
Klíčová slova:
analýza sentimentu; Apriori algoritmus; bayesovská síť; dolování znalostí z dat; dolování znalostí z textu; neuronová síť; pavučinový graf; předzpracování; rozhodovací stromy