Original title:
Vektorová reprezentace výzkumných projektů
Translated title:
Vectorization of research projects
Authors:
Mikuláš, Pavel ; Vidová Hladká, Barbora (advisor) ; Víta, Martin (referee) Document type: Bachelor's theses
Year:
2021
Language:
cze Abstract:
[cze][eng] V této práci se zabýváme počítačovým zpracováním dat o výzkumných projektech financovaných ze státního rozpočtu. Porovnáme různé metody převedení nestrukturova- ných textových dat do vektorových reprezentací a pokusíme se v datech nalézt různé struktury. Velký důraz bude kladen na měření podobnosti a shlukování projektů. Práce je experimentální a měla by sloužit jako ukázka postupu zpracování velkého množství objektů reálného světa pomocí metod statistiky a strojového učení. 1The aim of this thesis is to compare different approaches of vectorization of unstructu- red textual data about research projects with government financing. We'll attempt to find some structure in the underlying data with emphasis on meassuring similiarity between projects and their clustering. The thesis is experimental and should serve as an example of processing large number of real world objects using methods of statistics and machine learning. 1
Keywords:
research projects|vectorization|machine learning|similarity|clustering; výzkumné projekty|vektorová reprezentace|strojové učení|podobnost|shlukování
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/127963