Název:
Analýza textů uživatelských recenzí plaveckých bazénů
Autoři:
Dragolovová, Anna Typ dokumentu: Bakalářské práce
Rok:
2020
Jazyk:
cze
Abstrakt: [cze][eng] Práce se zabývá identifikací nejčastěji diskutovaných témat v uživatelských recenzích plaveckých bazénů. Uživatelské recenze byly automaticky staženy ze stránek recenzí Google, předzpracovány do formy vhodné pro aplikování metod strojového učení, zpracovány přístupy bag of words a word embeddings a podrobeny shlukové analýze a metodám modelování témat. Výsledkem je 22 témat, která se opakovaně vyskytují v recenzích plaveckých bazénů, na jejichž základě lze identifikovat priority, na které by se management plaveckých bazénů měl zaměřit.The work focuses on identification of most frequently commented topics in swimming pools user reviews. User reviews have been scrapped from Google review pages, preprocessed to text mining and machine learning compatible format, vectorized by bag of words and word embeddings approaches and analyzed by topic modelling and cluster analysis. Twenty‐two relevant topics indicating swiming pool management priorities have been found as a result.
Klíčová slova:
analýza dat; K‐means shlukování; lemmatizace; scraping; shluková analýza; text mining; vectorizace; čištění dat