Original title:
Shlukování textových dokumentů a jejich částí
Translated title:
Shlukování textových dokumentů a jejich částí
Authors:
Zápotocký, Radoslav ; Kopecký, Michal (advisor) ; Skopal, Tomáš (referee) Document type: Master’s theses
Year:
2011
Language:
eng Abstract:
[eng][cze] This thesis analyses use of vector-space model and data clustering approaches on parts of single document - on chapters, paragraphs and sentences. A simulation application (SimDIS), written in C# programming language is also part of this thesis. The application implements the adjusted model and provides tools for visualization of vectors and clusters.Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která takto upravený model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.
Keywords:
C#; clustering; text processing; vector-space model; C#; shlukování; vektorový model; zpracování textu
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/32106