Název:
Přístupy učení neuronových sítí s nevyrovnaným datasetem
Překlad názvu:
Imbalanced data training approaches in neural network
Autoři:
Vicianová, Veronika ; Ředina, Richard (oponent) ; Jakubíček, Roman (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2023
Jazyk:
slo
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [slo][eng]
Práca sa zaoberá rešeršou a implementáciou metód, ktoré eliminujú vplyv nevyrovnaného datasetu na učenie neurónových sietí. Jednotlivé metódy sú porovnané medzi sebou pre rôzne úrovne nevyrovnanosti. Experimenty realizované v práci sú taktiež porovnané s dostupnou literatúrou a kontrolným experimentom, ktorý bol realizovaný bez metódy eliminácie vplyvu nevyrovnaného datasetu na učenie neurónových sietí. Experimenty sú následne rozšírené na ďalší dataset, kde sú porovnané pre originálnu nevyrovnanosť nachádzajúcu sa v datasete. V teoretickej časti je priblížená téma neurónových sietí a problémy, ktoré sa môžu vyskytnúť pri učení. Následne sú priblížené konvolučné siete a ich optimalizačné algoritmy. Práca ďalej obsahuje bližšie spracovanú problematiku nevyrovnaného datasetu, vrátane používaných metrík a prístupov, ktoré umožňujú elimináciu tohto problému.
This thesis deals with the research and implementation of methods that eliminate the influence of an imbalanced dataset on the learning of neural networks. Individual methods are compared with each other for different levels of imbalance. The experiments carried out in the work are also compared with the available literature and a control experiment, which was carried out without the method of eliminating the influence of an imbalanced dataset. The experiments are extended to another dataset containing the original imbalance and compared. In the theoretical section, the topic of neural networks and the problems that may occur during learning are brought up. Subsequently, convolutional networks and their optimization algorithms are presented. The thesis also contains a more detailed presentation of the issue of an imbalanced dataset, including the metrics used in experiments and approaches used to eliminate this problem.
Klíčová slova:
Data augmentation; Imbalanced dataset; Neural networks; Random weighted oversampling.; SMOTE; Weighted cross entropy loss
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/210845