Original title:
Text mining se zaměřením na shlukovací a fuzzy shlukovací metody
Translated title:
Text mining focused on clustering and fuzzy clustering methods
Authors:
Zubková, Kateřina ; Karpíšek, Zdeněk (referee) ; Žák, Libor (advisor) Document type: Master’s theses
Year:
2018
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[cze][eng]
Tato práce se zabývá shlukovou analýzou v oblasti text miningu (dolování v textech) a její aplikací na reálná data. Cílem práce je najít vhodné kategorie (shluky) v přepsaných hovorech zaznamenaných v kontaktním centru České pojišťovny a.s., a to převedením těchto textových dokumentů do vektorového prostoru za použití základních metod text miningu a následným využitím implementovaných algoritmů shlukové analýzy. Z formálního hlediska práce obsahuje popis předzpracování a reprezentace textových dat, dále popis několika běžných shlukovacích metod, validace shluků a samotnou aplikaci.
This thesis is focused on cluster analysis in the field of text mining and its application to real data. The aim of the thesis is to find suitable categories (clusters) in the transcribed calls recorded in the contact center of Česká pojišťovna a.s. by transferring these textual documents into the vector space using basic text mining methods and the implemented clustering algorithms. From the formal point of view, the thesis contains a description of preprocessing and representation of textual data, a description of several common clustering methods, cluster validation, and the application itself.
Keywords:
cluster analysis; cluster validation; fuzzy c-means; hierarchical clustering; k-means; text mining; dolování v textech; fuzzy c-means; hierarchické shlukování; k-means; shluková analýza; validace shluků
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/83499