Original title:
Detekce nežádoucích požadavků na webu
Authors:
Slovák, Michal ; Setinský, Jiří (referee) ; Hranický, Radek (advisor) Document type: Bachelor's theses
Year:
2024
Language:
cze Publisher:
Vysoké učení technické v Brně. Fakulta informačních technologií Abstract:
[cze][eng]
Práce se zabývá vývojem klasifikátoru pro detekci nežádoucích požadavků na webový server s využitím metod strojového učení. Tento přístup vyžaduje vznik anotované datové sady a analýzu společných vlastnostní a charakteristik nelegitimních požadavků, které lze využít pro jejich kategorizaci. Dále se práce zabývá výběrem vhodného klasifikačního algoritmu. Výsledný model dosahuje váhovaného skóre F1 99.95 %, je spolehlivý a rychlý, což jej činí vhodným pro praktické nasazení.
This thesis deals with the development of a classifier for detecting unwanted requests to a web server using machine learning methods. This approach requires the creation of an annotated dataset and the analysis of common features and characteristics of illegitimate requests that can be used to categorize them. Furthermore, the paper deals with the selection of an appropriate classification algorithm. The resulting model achieves a weighted F1 score of 99.95 %, is reliable and fast, making it suitable for practical deployment.
Keywords:
anomalous requests; classification; dataset; HTTP protocol; machine learning; n-gram; text data; web application firewall; datová sada; klasifikace; n-gram; nežádoucí požadavky; protokol HTTP; strojové učení; textová data; webový aplikační firewall
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: https://hdl.handle.net/11012/246901