Název:
Vektorová reprezentace výzkumných projektů
Překlad názvu:
Vectorization of research projects
Autoři:
Mikuláš, Pavel ; Vidová Hladká, Barbora (vedoucí práce) ; Víta, Martin (oponent) Typ dokumentu: Bakalářské práce
Rok:
2021
Jazyk:
cze
Abstrakt: [cze][eng] V této práci se zabýváme počítačovým zpracováním dat o výzkumných projektech financovaných ze státního rozpočtu. Porovnáme různé metody převedení nestrukturova- ných textových dat do vektorových reprezentací a pokusíme se v datech nalézt různé struktury. Velký důraz bude kladen na měření podobnosti a shlukování projektů. Práce je experimentální a měla by sloužit jako ukázka postupu zpracování velkého množství objektů reálného světa pomocí metod statistiky a strojového učení. 1The aim of this thesis is to compare different approaches of vectorization of unstructu- red textual data about research projects with government financing. We'll attempt to find some structure in the underlying data with emphasis on meassuring similiarity between projects and their clustering. The thesis is experimental and should serve as an example of processing large number of real world objects using methods of statistics and machine learning. 1
Klíčová slova:
výzkumné projekty|vektorová reprezentace|strojové učení|podobnost|shlukování; research projects|vectorization|machine learning|similarity|clustering