Original title:
Data mining
Translated title:
Data mining
Authors:
Mrázek, Michal ; Sehnalová, Pavla (referee) ; Bednář, Josef (advisor) Document type: Master’s theses
Year:
2019
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta strojního inženýrství Abstract:
[cze][eng]
Tato diplomová práce se zabývá analýzou vícerozměrných dat. Jsou zavedeny tři algoritmy pro snižování dimenze dat. Pomocí metod zpracování přirozeného jazyka je ukázáno, jak manipulovat s textovými dokumenty. V praktické části je cílem zpracovat reálná data z internetového fóra. Nejprve soubor diskuzních příspěvků převedeme na numerickou reprezentaci, provedeme transformaci do dvourozměrného prostoru a vizualizujeme. Dále najdeme tématické okruhy příspěvků. V závěru porovnáme několik vybraných algoritmů na redukci dimenze.
The aim of this master’s thesis is analysis of the multidimensional data. Three dimensionality reduction algorithms are introduced. It is shown how to manipulate with text documents using basic methods of natural language processing. The goal of the practical part of the thesis is to process real-world data from the internet forum. Posted messages are transformed to the numerical representation, then to two-dimensional space and visualized. Later on, topics of the messages are discovered. In the last part, a few selected algorithms are compared.
Keywords:
data mining; dimensionality reduction; natural language processing; NMF; SVD; t-SNE; data mining; NMF; redukce dimenze; SVD; t-SNE; zpracování přirozeného jazyka
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/175349