Original title:
Návrh metodiky implementace OLAP jako nástroje pro analýzu metadat emailových zpráv
Translated title:
Methodology of design multidimensional databases in the farm environment
Authors:
Vasilenko, Alexandr ; Klimešová, Dana (advisor) ; Toman, Prokop (referee) Document type: Doctoral theses
Year:
2016
Language:
cze Publisher:
Česká zemědělská univerzita v Praze Abstract:
[cze][eng] Problematika nevyžádaných zpráv je aktuální ve všech odvětvích elektronické
komunikace. Netýká se pouze emailové komunikace, ale také internetových fór,
diskuzních příspěvků, příspěvků na sociálních sítích a dalších. Analyzovat nevyžádané
zprávy je proto základním prvkem prevence zahlcení uživatelských schránek.
Antispamová problematika je souborem procesů, softwarových prostředků a metod. Je
nutné všechny tyto složky sladit do jednoho hladce fungujícího celku. Administrátoři
emailových serverů se snaží mít své servery optimálně konfigurované. Problémem je, že
spammeři se snaží tyto obranné a filtrační mechanismy obcházet. Jejich činnost je velmi
sofistikovaná a tento souboj prozatím nemá jednoznačného vítěze. Po vylepšení technik
jednou či druhou stranou dochází po určitém čase k vyrovnání výhod a nevýhod.
Z těchto důvodů je nezbytné mít nástroj, kterým lze analyzovat nevyžádané zprávy do
hloubky s možností dynamických pohledů na data. Tímto nástrojem může být Online
Analytical Processing (dále OLAP), který je k tomu účelu velmi vhodný.
Představena je metoda extrakce dat a jejich transformace a přípravy pro uložení do
datového skladu DP MEZ (datová pumpa metadata emailových zpráv). Tato metoda je
součástí metodiky ASOLAP (Antispam OLAP).
This dissertation thesis is focused on bulk unsolicited messages which are present in
current time in all sectors of electronic communications. It is not only e-mail
communication, but also in online forums, discussion contributions, social networking
and more. Analyze spam messages is therefore an essential element in preventing
flooding user mailboxes.
Antispam countermeasures is a set of processes, software tools and methods. It is
necessary to harmonize all these components into one cooperating piece of service.
Administrators of email servers are trying to keep their servers optimally configured. The
problem is that spammers trying continuously these defense mechanisms and filter bypass
to enhance spam processes. Their work is very sophisticated and this fight does not yet
have a clear winner. After enhancement techniques either processes takes place after a
certain time to balance the advantages and disadvantages.
For these reasons it is necessary to have a tool which can be analyzed in depth junk
messages with dynamic data views. This tool can be Online Analytical Processing (OLAP
below), which is very suitable for this purpose.
Presented a method of data extraction and transformation and preparation for storage in
a warehouse DT-MEZ (Data Pump - metadata email messages). This method is part of
the methodology ASOLAP (Antispam - OLAP).
Keywords:
metadata emailových zpráv; návrh OLAP; vektorizace emailových zpráv