Název:
Shlukování textových dokumentů a jejich částí
Překlad názvu:
Shlukování textových dokumentů a jejich částí
Autoři:
Zápotocký, Radoslav ; Kopecký, Michal (vedoucí práce) ; Skopal, Tomáš (oponent) Typ dokumentu: Diplomové práce
Rok:
2011
Jazyk:
eng
Abstrakt: [eng][cze] This thesis analyses use of vector-space model and data clustering approaches on parts of single document - on chapters, paragraphs and sentences. A simulation application (SimDIS), written in C# programming language is also part of this thesis. The application implements the adjusted model and provides tools for visualization of vectors and clusters.Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která takto upravený model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.
Klíčová slova:
C#; shlukování; vektorový model; zpracování textu; C#; clustering; text processing; vector-space model