Název:
Data mining
Překlad názvu:
Data mining
Autoři:
Mrázek, Michal ; Sehnalová, Pavla (oponent) ; Bednář, Josef (vedoucí práce) Typ dokumentu: Diplomové práce
Rok:
2019
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta strojního inženýrství
Abstrakt: [cze][eng]
Tato diplomová práce se zabývá analýzou vícerozměrných dat. Jsou zavedeny tři algoritmy pro snižování dimenze dat. Pomocí metod zpracování přirozeného jazyka je ukázáno, jak manipulovat s textovými dokumenty. V praktické části je cílem zpracovat reálná data z internetového fóra. Nejprve soubor diskuzních příspěvků převedeme na numerickou reprezentaci, provedeme transformaci do dvourozměrného prostoru a vizualizujeme. Dále najdeme tématické okruhy příspěvků. V závěru porovnáme několik vybraných algoritmů na redukci dimenze.
The aim of this master’s thesis is analysis of the multidimensional data. Three dimensionality reduction algorithms are introduced. It is shown how to manipulate with text documents using basic methods of natural language processing. The goal of the practical part of the thesis is to process real-world data from the internet forum. Posted messages are transformed to the numerical representation, then to two-dimensional space and visualized. Later on, topics of the messages are discovered. In the last part, a few selected algorithms are compared.
Klíčová slova:
data mining; NMF; redukce dimenze; SVD; t-SNE; zpracování přirozeného jazyka; data mining; dimensionality reduction; natural language processing; NMF; SVD; t-SNE
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/175349