Biometric fingerprint liveness detection
Rišian, Lukáš ; Vítek, Martin
This work addresses the problem of biometric recognition of fingerprint liveness to identify and differentiate between real fingerprints and their artificial replicas. The main objective was to identify the features that are crucial for fingerprint liveness recognition and based on these features to propose an efficient classification algorithm. We worked with the LivDet database from 2009, which contains both real and fake fingerprints. This database has been used in a worldwide competition and the results of all implemented algorithms are publicly available for subsequent comparison of success rates. An important part of this work was the preprocessing of the image data, which was crucial for testing the selected features and implementing the algorithms. We analyzed more than 180 different features from which we selected the most relevant ones. We then used the selected features to develop several fingerprint recognition and classification algorithms. Using the selected features, several possible variations of the algorithms have been proposed. Among all the implemented algorithms, we achieved the best result of almost 90%. Compared to other algorithms that have been implemented for the same purpose and have been used and tested on the same database, this can be considered a satisfactory and reliable result. In conclusion, the main objective of this work was to provide an efficient, secure, and reliable solution in the field of biometric fingerprint spoof detection.
Pokročilé metody DPZ pro monitoring vegetace rašelinišť v Krkonoších
Kulich, Adam ; Kupková, Lucie (vedoucí práce) ; Potůčková, Markéta (oponent)
Pokročilé metody dálkového průzkumu země pro monitoring vegetace rašelinišť v Krkonoších Abstrakt Cílem práce bylo vytvořit mapy vegetačního pokryvu tří rašelinišť v Krkonošském Národním parku (KRNAP) a navrhnout postup pro další efektivní mapování rašelinišť v Krkonoších ve spolupráci s KRNAP. Pro výzkum byla využita obrazová data z UAV a terénní botanická data, zaměřeá GPS. Snímky z UAV byly předzpracovány v softwaru Pix4D Mapper a do výsledných ortofot byly přidány příznaky výšky porostu a texury, odvozené z GLCM. Testování potvrdilo jejich užitečnost pro zlepšení přesnosti klasifikací. Byla provedena analýza separability a byl navžen algoritmus, rozpoznávající chyby v terénních datech. Během analýzy byly porovnávány dvě klasifikační metody - Random Forest a Support vector machine (SVM). Nejpřesnějších výsledků dosáhla metoda SVM na Kyselých koutech, kde bylo dosaženo F-1 skóre 0.957, zatímco F-1 skóre Hraniční louky dosáhlo pouze 0.899 a Pančavské louky 0.832. Analýza překryvů ukázala, že výsledky jednotlivých metod jsou konzistentní a v případě Pančavské louky přineslo spojení klasifikátorů I lepší přesnost, než jednotlivé modely. Metody, které vedly k nejlepší přesnosti, byly doporučeny v navrženém postupu pro další krkonošská rašeliniště. 1
Cirque overdeepening in the High Tatras
Nadžadyová, Alexandra ; Křížek, Marek (vedoucí práce) ; Margold, Martin (oponent)
Prehĺbenie karov vo Vysokých Tatrách Abstrakt: Vysoké Tatry predstavujú v súčasnosti nezaľadnené pohorie s výraznými ľadovcovými a periglaciálnymi tvarmi, keďže počas pleistocénu patrili medzi pohoria s najväčším zaľadnením. Z toho dôvodu bol umožnený v záveroch dolín vznik ľadovcových karov, ktoré v dnešnej dobe slúžia ako ideálne paleoenvironmentálne indikátory. Cieľom práce je preto stanoviť mieru prehĺbenia karov v slovenskej časti Vysokých Tatier a stanoviť vzťah prehĺbenia karov k štandardným morfometrickým, polohovým a environmentálnym charakteristikám karov. Na základe aktuálneho digitálneho modelu reliéfu (DMR) sa vymedzili karové hrany, stupne, úpätia karových stien a stanovili sa hodnoty morfometrických parametrov dôležitých pre konštrukciu pozdĺžnych profilov (k-kriviek, c-kriviek), vďaka ktorým sa určilo prehĺbenie karov. Priemerná hodnota prehĺbenia všetkých karov podľa koeficientu k vyšla 0,85 (v rozmedzí od 0,51 do 1,46) a podľa koeficientu c vyšla -0,97 (v rozmedzí od -0,11 do -2,96). Výslednou inventarizáciou 110 karov sa tak medzi sebou analyzovali vzťahy koeficientov prehĺbenia k vyššie uvedeným charakteristikám. Hodnotami koeficientov prehĺbenia tatranských karov sa potvrdilo výrazné minulé glaciálne pôsobenie. Potvrdilo sa, že koeficient c nemá signifikantné korelácie k iným...
Meta-heuristické algoritmy pro výběr příznaků v klasifikaci srdečních onemocnění
Švestková, Tereza ; Odstrčilík, Jan (oponent) ; Mézl, Martin (vedoucí práce)
Tato práce je věnována postupům při výběru relevantních příznaků pro klasifikační úlohy týkající se srdečních onemocnění. Optimální výběr příznaků je klíčovým faktorem pro správnou funkčnost klasifikačních modelů a v případě medicíny pro zlepšení diagnostiky. Teoretická část pojednává o obecné klasifikační úloze ve strojovém učení. Dále jsou podrobněji popsány některé klasické postupy i novější meta-heuristické algoritmy pro efektivní selekci příznaků. Praktická část se věnuje aplikaci některých popsaných algoritmů na datové soubory související se srdečním onemocněním. Na základě ověření validity výsledku klasifikačního modelu podle vybraných příznaků běžnými postupy i evolučními algoritmy jsou diskutovány výhody a přínosy upřednostnění meta-heuristických algoritmů.
Detekce malware domén pomocí metod strojového učení
Ebert, Tomáš ; Poliakov, Daniel (oponent) ; Hranický, Radek (vedoucí práce)
Tato bakalářská práce se zabývá detekcí malware domén pomocí metod strojového učení na základě různých informací získaných o doméně (DNS záznamy, geolokační údaje atd.). S rychle rozšiřujícími se hrozbami, nejen formou malwaru, jsou často současné přístupy nedostačující ať už jen rychlostí detekce malware domén, nebo celkovým rozeznáním, zda se jedná o nebezpečnou doménu. Výstupem této práce je natrénovaný model klasifikátoru XGBoost, jehož výhodou je rychlá a efektivní detekce v reálném čase oproti detekci pomocí černých listin, které získávají data domén často s týdenním zpožděním. Pro tento model bylo získáno 131 tisíc malware domén, pomocí kterých bylo možné získat model s vysokými hodnotami. Pomocí experimentů bylo dosaženo skóre F1 96.8786 % u klasifikátoru XGBoost s poměrem falešně pozitivních detekcí 0.004887.
Optimization of Classification Models for Malicious Domain Detection
Pouč, Petr ; Jeřábek, Kamil (oponent) ; Hranický, Radek (vedoucí práce)
This thesis focuses on the development of advanced methods for malicious domain name detection using optimization techniques in machine learning. The thesis investigates and evaluates the effectiveness of different optimization strategies for classification. As evaluation tools, I selected classification algorithms that differ in their approach, including deep learning, decision tree techniques, or hyperplane search. These methods are investigated in terms of their ability to effectively classify domain names depending on the implemented optimization techniques. Optimization strategies include the creation of ground-truth datasets, application of data processing methods, advanced feature selection, solving the class imbalance problem, and hyperparameter tuning. The final part of the paper presents a detailed analysis of the benefits of each optimization approach. The experimental part of the study demonstrates exceptional results by combining several methodologies. The top CNN models obtained up to 0.9926 F1 while lowering FPR to 0.3%. The contribution of this study is to provide specific methodologies and tactics for the successful identification of malicious domain names in the cybersecurity area.
Reversibility of Voice Change Methods
Lička, Zbyněk ; Firc, Anton (oponent) ; Malinka, Kamil (vedoucí práce)
State-of-the-art voice-changing methods allow inexperienced users to create convincing voice recordings of famous individuals with just a few seconds of recorded speech. There are two major approaches to voice generation: voice conversion and text-to-speech. Voice conversion methods require the user to input source speech to be converted to the target voice. A trend with voice conversion methods, especially those requiring only mere seconds of reference speech, has been restricting the amount of information about the original speaker in the converted speech. This work focuses on studying the amount of information extractable about the original speaker from artificial speech and potentially reconstructing the original speech. The results of this work shed light on an unstudied property of voice-changing methods.
Analyzing a person’s handwriting for recognizing his/her emotional state
Chudárek, Aleš ; Matoušek, Jiří (oponent) ; Malik, Aamir Saeed (vedoucí práce)
Emotion recognition from handwriting is a challenging and interdisciplinary task that can provide insights into the psychological and emotional aspects of the writer. In this study, we developed and evaluated a machine learning model that can predict the emotional state of a writer from their handwriting samples. We utilized the EMOTHAW dataset, which consists of handwriting and drawing samples from subjects whose emotional states are measured by the DASS test, which gives a score for depression, anxiety, and stress and the CIU Handwritten database for verification and experimentation. We extracted a large number of features that are inspired by the standard graphology work, as well as features that are specific to online data. We used ANOVA to select statistically significant features and normalized the data using Z-Score, MinMax, IQR or Log. We reduced the dimensionality of the features using Principal Component Analysis (PCA) and Linear Discriminant Analysis (LDA). We employed a meta approach Ensemble learning that seeks to reduce the errors of a single model by exploiting the diversity and complementarity of multiple models. The structure of our classifier is dependent on multiple arguments resulting in over 300,000 different configurations. We optimized arguments using argument freezing. We found the best classifiers for binary and trinary classification for each emotion, resulting in six optimal models. We evaluated our models using different metrics, such as accuracy, precision, recall, and F1-score. Our models reached adequate results in all metrics. In addition to finding the classifiers, this thesis explored the importance of each extracted feature, providing a sorted list of the most significant features used for emotion recognition from handwriting. We also enhanced the EMOTHAW database by identifying tasks that are more indicative of specific emotions, thereby reducing the need for a full task battery for emotional analysis.
Detekce a klasifikace nečistot v mikroskopickém obraze prachového filtru
Szkandera, Jaroslav ; Dobrovský, Ladislav (oponent) ; Matoušek, Radomil (vedoucí práce)
Tato práce řeší problém segmentace a klasifikace nečistot prachových filtrů v poskládaném opticky nedokonalém mikroskopické obraze. Zadaný problém byl vyřešen s využitím knihovny OpenCV pomocí klasických segmentačních metod. Vyhodnocení přesnosti segmentace bylo provedeno pomocí knihovny scikit-image. Bylo rovněž vytvořeno grafické uživatelské rozhraní, které usnadňuje proces segmentace a výběr částic pro prvkovou analýzu. Výsledky této práce umožňují efektivní vyhodnocení předmětů zachycených filtrem.
Detection of DGA-based Botnets
Keznikl, Matej ; Setinský, Jiří (oponent) ; Hranický, Radek (vedoucí práce)
Botnets represent significant cybersecurity threats due to their potential to cause extensive damage to computer networks and systems. One primary method by which botnets conceal their existence and communicate with servers is through the use of Domain Generation Algorithms (DGA), which enable the dynamic creation of domain names for controlling the botnet. This thesis focuses on the design and development of a highly efficient and distributed detection system for analyzing communication patterns and behaviors of botnets within DNS network traffic and identifying domain names created based on DGA. Several machine learning techniques were compared, utilizing lexical features of domain names characteristic of DGA, to determine the classifier exhibiting the best results. The LightGBM classifier, achieving a ROC-AUC score of up to 99.18%, was subsequently integrated into the detection system. Unit testing of individual blocks and integration testing were performed to ensure the functionality and reliability of the entire system and the mutual compatibility of its components. The resulting implementation of the detection system achieves high accuracy in the binary classification of domain names created based on DGA, ensuring its readiness for effective deployment in real-world operational environments.

