Original title:
Analýza dějových linií na základě shrnutí obsahu knih a uživatelských recenzí
Translated title:
Plot Analysis from Book Summaries and User Reviews
Authors:
Rúček, Peter ; Dočekal, Martin (referee) ; Smrž, Pavel (advisor) Document type: Bachelor's theses
Year:
2022
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Cieľom tejto práce je vytvoriť systém pre analýzu a klasifikáciu kľúčových dejových línií zo zhrnutých dejových zápletiek a užívateľských recenzií v anglickom jazyku. Zvolený problém je riešený pomocou techniky strojového učenia založenej na transformeroch. Vo vytvorenom riešení je implementované aj sťahovanie dát a bol vytvorený dataset užívateľských recenzií a informácií o knihách prevyšujúci 23 miliónov recenzií a takmer 900 tisíc informácií o knihách. Systém dokáže predikovať aké typy dejových zápletiek sa v dátach nachádzajú.
The aim of this work is to create a system for analysis and classification of plot keywords from summarized storylines and user reviews in English. The chosen problem is solved using a transformer-based machine learning technique. The created solution also implements data downloading and a dataset of user reviews and information about books was created, exceeding 23 million reviews and 900 thousand information about books. The system can predict what plot keywords the data contains.
Keywords:
bert; classification; machine learning; multi-label; natural language processing; neural networks; plots; user reviews; webscraping; bert; dejové línie; extrakcia dát z webu; klasifikácia; multi-label; neurónové siete; spracovanie prirodzeného jazyka; strojové učenie; užívateľské recenzie
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/207328