Original title:
Analýza textů uživatelských recenzí plaveckých bazénů
Authors:
Dragolovová, Anna Document type: Bachelor's theses
Year:
2020
Language:
cze Abstract:
[cze][eng] Práce se zabývá identifikací nejčastěji diskutovaných témat v uživatelských recenzích plaveckých bazénů. Uživatelské recenze byly automaticky staženy ze stránek recenzí Google, předzpracovány do formy vhodné pro aplikování metod strojového učení, zpracovány přístupy bag of words a word embeddings a podrobeny shlukové analýze a metodám modelování témat. Výsledkem je 22 témat, která se opakovaně vyskytují v recenzích plaveckých bazénů, na jejichž základě lze identifikovat priority, na které by se management plaveckých bazénů měl zaměřit.The work focuses on identification of most frequently commented topics in swimming pools user reviews. User reviews have been scrapped from Google review pages, preprocessed to text mining and machine learning compatible format, vectorized by bag of words and word embeddings approaches and analyzed by topic modelling and cluster analysis. Twenty‐two relevant topics indicating swiming pool management priorities have been found as a result.
Keywords:
analýza dat; K‐means shlukování; lemmatizace; scraping; shluková analýza; text mining; vectorizace; čištění dat