Original title:
Inteligentní emailová schránka
Translated title:
Intelligent Mailbox
Authors:
Pohlídal, Antonín ;
Drozd, Michal (referee) ;
Chmelař, Petr (advisor)
Document type: Master’s theses
Year:
2012
Language:
cze
Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract:
[cze] [eng]
Tato diplomová práce se zabývá využitím klasifikace textu při třídění příchozí pošty. Nejdříve je popsána problematika získávání znalostí z databází a je detailně rozebrána klasifikace textu s popisem vybraných metod. Dále je uveden princip emailové komunikace a jsou popsány protokoly SMTP, POP3 a IMAP. Následuje návrh implementace systému, který klasifikuje příchozí poštu a rozbor použitých technologií, tedy Apache James Server, PostgreSQL a RapidMiner. Na závěr je uvedena implementace všech jednotlivých částí výsledného systému a jsou provedeny experimenty s testovací sadou emailů Enron Dataset.
This master's thesis deals with the use of text classification for sorting of incoming emails. First, there is described the Knowledge Discovery in Databases and there is also analyzed in detail the text classification with selected methods. Further, this thesis describes the email communication and SMTP, POP3 and IMAP protocols. The next part contains design of the system that classifies incoming emails and there are also described realated technologie ie Apache James Server, PostgreSQL and RapidMiner. Further, there is described the implementation of all necessary components. The last part contains an experiments with email server using Enron Dataset.
Keywords:
apache james server ;
augmented latent semantic indexing spaces ;
email ;
email classification ;
enron email dataset ;
imap ;
knowledge discovery in databases ;
logit boost ;
naive bayes ;
pop3 ;
postgresql ;
radial basis function networks ;
rapidminer ;
support vector machines ;
text classification ;
apache james server ;
augmented latent semantic indexing spaces ;
email ;
enron email dataset ;
imap ;
klasifikace emailů ;
klasifikace textu ;
logit boost ;
naive bayes ;
pop3 ;
postgresql ;
radial basis function networks ;
rapidminer ;
support vector machines ;
získávání znalostí z databází
Institution: Brno University of Technology
(
web )
Document availability information: Fulltext is available in the Brno University of Technology Digital Library.
Original record: http://hdl.handle.net/11012/53601
Permalink: http://www.nusl.cz/ntk/nusl-236458
The record appears in these collections: Universities and colleges > Public universities > Brno University of Technology Academic theses (ETDs) > Master’s theses