Original title:
Komprese e-mailu
Translated title:
Compression of e-mails
Alakša, Štefan ; Lánský, Jan (advisor) ; Holubová, Irena (referee) Document type: Bachelor's theses
cze Abstract:
[cze][eng] E-mail je velmi specifická datová struktura upravená příslušnými normami RFC. Běžná komprese pro textová data použitá na emaily nezohledňuje strukturu emailu, nejvíce je patrná nízká účinnost běžných metod u malých souborů, v nichž velikost hlavičky často převažuje nad délkou vlastního těla zprávy, nebo naopak u emailů s velkými zakódovanými přílohami. Tato bakalářská práce se pokouší navrhnout a implementovat vhodný algoritmus na kompresi tohoto typu dat. Rozdělením e-mailu na hlavičky a vlastní obsah, samostatnou kompresí hlaviček vlastním algoritmem založeném na slovníkové kompresi a kompresí těla a příloh dle MIME typu jednotlivých částí vhodnými existujícími programy a algoritmy se pokouší zvýšit účinnost komprese tohoto typu dat.E-mail is a very specific data structure described in appropriate RFC standards. Common text-based compression applied to e-mails does not regard e-mail structure. Low compression ratio of common methods is noticeable on small files where header size often exceeds message body length or on e-mails with big encoded attachments. This bachelor thesis tries to suggest and implement a suitable algorithm for this type of data. By separating an e-mail message into headers and content, compressing headers with own dictionary-based algorithm, body and attachments with suitable existing programs or algorithms according to MIME type of the parts, separately, it tries to increase efficiency of compression of this type of data.
Institution: Charles University Faculties (theses)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/31021