Název:
Detekce anomálií pomocí generativních adversariálních sítí
Překlad názvu:
Anomaly Detection Using Generative Adversarial Networks
Autoři:
Měkota, Ondřej ; Fink, Jiří (vedoucí práce) ; Pilát, Martin (oponent) Typ dokumentu: Bakalářské práce
Rok:
2019
Jazyk:
eng
Abstrakt: [eng][cze] Generative adversarial networks (GANs) are able to capture distribution of its inputs. They are thus used to learn the distribution of normal data and then to detect anoma- lies, even if they are very rare; e.g. Schlegl et al. (2017) proposed an anomaly detection method called AnoGAN. However, a major disadvantage of GANs is instability during training. Therefore, Arjovsky et al. (2017) proposed a new version, called Wasserstein GAN (WGAN). The goal of this work is to propose a model, utilizing WGANs, to detect fraudulent credit card transactions. We develop a new method called AnoWGAN+e, partially based on AnoGAN, and compare it with One Class Support Vector Machines (OC-SVM) (Schöl- kopf et al. (2001)), k-Means ensemble (Porwal et al. (2018)) and other methods. Perfor- mance of studied methods is measured by area under precision-recall curve (AUPRC), and precision at different recall levels on credit card fraud dataset (Pozzolo (2015)). AnoW- GAN+e achieved the highest AUPRC and it is 12% better than the next best method OC-SVM. Furthermore, our model has 20% precision at 80% recall, compared to 8% precision of OC-SVM, and 89% precision at 10% recall as opposed to 79% of k-Means ensemble. 1Generativní adversariální sítě (GAN) jsou schopny naučit se distribuci svých vstupů. Používají se pro naučení se distribuce normálních dat a pak je lze využít pro detekci i velmi vzácných anomálií, např. Schlegl a spol. (2017) navrhl metodu pro detekci anomálií - AnoGAN. Problémem metody GAN je ovšem nestabilita během tréninku. Proto Arjovsky a spol. (2017) navrhl novou verzi nazvanou Wasserstein GAN (WGAN). Cílem této práce je navrhnout model používající WGAN pro detekci podvodných transakcí kreditními kartami. Vyvinuli jsme novou metodu, nazvanou AnoWGAN+e, částečně založenou na AnoGANu a porovnáváme ji s One Class Support Vector Machi- nes (OC-SVM) (Schölkopf a spol. (2001)), k-Means ensemble (Porwal a spol. (2018)) a dalšími metodami. Kvalita studovaných metod je měřena pomocí plochy pod křivkou přesnosti a výtežnosti (AUPRC) a pomocí přesnosti v různých úrovních výtěžnosti na kolekci dat obsahující transakce kreditních karet (Pozzolo (2015)). AnoWGAN+e dosáhl nejvyšší hodnoty AUPRC, o 12% více než druhá nejlepší metoda OC-SVM. Náš model má přesnost 20% při 80 % výtěžnosti ve srovnání s 8% u OC-SVM; a 89% přesnost při 10 % výtěžnosti, oproti 79% u k-Means ensemblu. 1
Klíčová slova:
Anomaly detection; deep learning; generative adversarial networks; neural network; Anomaly detection; deep learning; generative adversarial networks; neural network