Název:
Crowdsourcingová tvorba datové sady pro rozpoznání struktury vyprávění
Překlad názvu:
Creating Dataset for Narrative Structure Recognition by Crowdsourcing
Autoři:
Ignác, Igor ; Dočekal, Martin (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2020
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Cieľom tejto práce je vytvorenie rozsiahlej dátovej sady pre rozpoznanie štruktúry rozprávania metódou crowdsourcingu. Pre tento účel bolo nutné vytvoriť webové rozhranie umožňujúce anotáciu dátovej sady filmov užívateľmi. Anotovanie dát získaných z filmovej databázy IMDb v aplikácii je založené na troch odlišných typoch anotácie. Užívatelia validujú výpočet podobností obsahov filmov modelom Sentence-BERT, extrakciu kľúčových slov z obsahov filmov modelom RAKE a predpočítané podobnosti filmov na základe ich kľúčových slov. Gamifikácia užívateľov je postavená na priradzovaní bodov a s nimi spojenými odznakmi, úspechoch a rebríčku najúspešnejších užívateľov.
Goal of this work is creation of extensive dataset for recognition of narrative structure by crowdsourcing method. For this purpose, it was necessary to create a web interface which offers dataset of films for user annotation. The annotation of data gained from IMDb database is established on three different types of annotation. Users validate similarity of movies based on computation done by Sentence-BERT, extraction of keywords from movie plots done by RAKE and precomputed similarity between movies based on their keywords. User's gamification is based on points assignment, which are related with badges, achievements accomplishment and leader board of most successful users.
Klíčová slova:
Angular; Crowdsourcing; extrakcia kľúčových slov; gamifikácia; podobnosť príbehov; RAKE; Sentence-BERT; webová aplikácia; Angular; Crowdsourcing; gamification; keyword extraction; narrative similarity; RAKE; Sentence-BERT; web application
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/191462