Název:
Identifikace pohlaví z textu
Překlad názvu:
Gender recognition from the text data
Autoři:
Mačát, Jakub ; Burda, Karel (oponent) ; Červenec, Radek (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2012
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Práce je zaměřena na identifikaci pohlaví z textu výhradně z emailové formy a s tím spojené současné metody získávání dat a textu. Jejich výhody, nevýhody a možnosti použití. Dále byl realizován program na rozpoznávání pohlaví v programovacím jazyku Java. V programu Rapid Miner je ukázáno zpracování pomocí různých algoritmů strojového učení. U obou programů jsou popsány jejich základní vlastnosti, užité metody a použité operátory při realizaci. Programy byly testovány na reálných datech. Dále jsou zde uvedeny metody na rozšíření programů. Nakonec jsou zobrazeny příklady jak programy zpracovávají zadané úlohy.
This bacheor`s work is focused on gender identification from a text just from an e-mail`s form and also contemporary techniques of data mining and text mining. The technique`s advantages and disadvantages and options of use. There was realized a program for recognizing gender in Java. In a program Rapid Miner is demostrated processing various learning methods. By both programs thete are described their basic attributes, used methods and operators used in the implementation. The programs were tested ona real data. Then there are mentioned methods for program`s extends. eventually there are given examples as the programs process stated assignment.
Klíčová slova:
dolování textu; dolování znalostí; hashovací tabulka; neuronové sitě; shluková analýza; strojové učení; tf - idf; tokenizace; clustering analysis; Data mining; hash map; machine learning; neural network; text mining; tf - idf; tokenization
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/9842