Original title:
Nástroj pro anonymizaci záznamů bezpečnostních událostí pro aplikování technik umělé inteligence
Translated title:
Security log anonymization tool focusing on artificial intelligence techniques
Authors:
Šťastná, Ariela ; Jurek, Michael (referee) ; Safonov, Yehor (advisor) Document type: Bachelor's theses
Year:
2023
Language:
eng Publisher:
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií Abstract:
[eng][cze]
Systémy SIEM zohrávajú v rámci bezpečnostného monitoringu zásadnú úlohu. Zozbierané záznamy agregujú, normalizujú a filtrujú, čo predstavuje základ pre aplikovanie techník dolovania dát. Týmto spôsobom SIEMy prezentujú výborný zdroj veľkých objemov normalizovaných dát. Tieto dáta nesú potenciál pre dosiahnutie pokroku v bezpečnostnom výskume, dolovaní dát a umelej inteligencii, kde môžu viesť k zlepšeniu existujúcich metód prieskumu, sprehľadneniu skenovania siete a odhaleniu sofistikovanejších vektorov útoku. Avšak jedným z hlavných problémov pre využívanie týchto dát je skutočnosť, že dáta v logových záznamoch sú v mnohých prípadoch citlivé a môžu predstavovať riziko z hľadiska bezpečnosti. Z toho dôvodu bol vytvorený nástroj pre anonymizáciu citlivých údajov v logových záznamoch, ktorý zachováva korelácie medzi dátami. Hlavným cieľom bakalárskej práce je zamerať sa na technické a právne aspekty spracovania logov a anonymizáciu pre umelú inteligenciu. V rámci výskumu bola vykonaná analýza najčastejšie sa vyskytujúcich dát v logoch spolu s vyhodnotením ich rizikovosti, výsledkom čoho je vytvorenie kategórií dát vzhľadom na ich citlivosť. V práci je ďalej prezentovaná analýza súčasných SIEM systémov spolu s meta kľúčmi, ktoré využívajú.
SIEM systems play a fundamental role in security monitoring. They aggregate, normalise, and filter the collected event records, which presents core tasks for applying data mining techniques. In this way, SIEMs present a great source of large amounts of normalised data. These data carry potential for achieving progress in security research, data mining, and artificial intelligence, where they could improve existing methods of investigation, make the scanning of network traffic more clear, and detect more sophisticated vectors of attack. However, one of the main problems for the use of these data is the fact that the data contained in log files are in many cases sensitive and could pose a risk to security. Due to this, the processing, as well as sharing of the data, is restricted by legislation. Considering everything that has been mentioned above, a tool for anonymization of sensitive data in log files, which works along with persisting the correlations among data was developed. The main aim of the bachelor thesis is to focus on the technical and legal level of log processing and anonymization for AI. Within the research, the analysis of the most frequently occurring data in the log files and their risk assessment was performed, resulting in the creation of categories of data, based on their sensitivity. In the work, an analysis of the present SIEM systems along with the meta keys they use is performed.
Keywords:
AI; Anonymizácia; Cyberlaw; GDPR; Hlboké učenie; Logové záznamy; NDA; Neurónové siete; NLP; Pseudonymizácia; SIEM; Umelá inteligencia.; AI; Anonymisation; Artificial Intelligence; Cyberlaw; Deep Learning; GDPR; Log Records; Natural Language Processing; NDA; Neural Network; NLP; Pseudonymisation; SIEM.
Institution: Brno University of Technology
(web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library. Original record: http://hdl.handle.net/11012/210381