Název: Porovnání přístupů ke klasifikaci textu
Překlad názvu: Comparison of approaches to text classification
Autoři: Knížek, Jan ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Typ dokumentu: Bakalářské práce
Rok: 2019
Jazyk: eng
Abstrakt: The focus of this thesis is short text classification. Short text is the prevailing form of text on e-commerce and review platforms, such as Yelp, Tripadvisor or Heureka. As the popularity of the online communication is increasing, it is becoming infeasible for users to filter information manually. It is therefore becoming more and more important to recog- nise the relevant information in text. Classification of reviews is especially challenging, because they have limited structure, use informal language, contain a high number of errors and rely heavily on context and common knowledge. One of the possible appli- cations of machine learning is to automatically filter data and show users only relevant pieces of information. We work with restaurant reviews from Yelp and aim to predict their usefulness. Most restaurants have relatively many reviews, yet only few are truly useful. Our objective is to compare machine learning methods for predicting usefulness. 1
Klíčová slova: klasifikace recenzí; klasifikace textu; NLP; strojové učení; machine learning; NLP; review classification; text classification

Instituce: Fakulty UK (VŠKP) (web)
Informace o dostupnosti dokumentu: Dostupné v digitálním repozitáři UK.
Původní záznam: http://hdl.handle.net/20.500.11956/117016

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-410996


Záznam je zařazen do těchto sbírek:
Školství > Veřejné vysoké školy > Univerzita Karlova > Fakulty UK (VŠKP)
Vysokoškolské kvalifikační práce > Bakalářské práce
 Záznam vytvořen dne 2020-03-19, naposledy upraven 2022-03-04.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet