Original title:
Semisupervizované hluboké učení v označování sekvencí
Translated title:
Semi-supervised deep learning in sequence labeling
Authors:
Páll, Juraj Eduard ; Šabata, Tomáš (advisor) ; Flusser, Martin (referee) Document type: Master’s theses
Year:
2019
Language:
eng Abstract:
[eng][cze] Sequence labeling is a type of machine learning problem that involves as- signing a label to each sequence member. Deep learning has shown good per- formance for this problem. However, one disadvantage of this approach is its requirement of having a large amount of labeled data. Semi-supervised learning mitigates this problem by using cheaper unlabeled data together with labeled data. Currently, usage of semi-supervised deep learning for sequence labeling is limited. Therefore, the focus of this thesis is on the application of semi-super- vised deep learning in sequence labeling. Existing semi-supervised deep learning approaches are examined, and approaches for sequence labeling are proposed. The proposed approaches were implemented and experimentally evaluated on named-entity recognition and part-of-speech tagging tasks.Označování sekvencí ve strojovém učení je typ problému, který zahrnuje při- řazování označení jednotlivým členům sekvence. Pro tento typ problému dosáhlo hluboké učení dobrého výkonu. Jedna z nevýhod tohoto přístupu je jeho zá- vislost na velkém množství označených dat. Semi-supervizované učení zmírňuje tento problém používáním levnějších neoznačených dat spolu s daty označenými. V současnosti je použití semi-supervizovaného hlubokého učení v označování sekvencí limitované. Z tohoto důvodu se tato práce zaměřuje na aplikaci semi- supervizovaného hlubokého učení v označování sekvencí. Práce prozkoumává exis- tující přístupy semi-supervizovaného hlubokého učení a navrhuje vlastní přístupy. Navržené přístupy jsou experimentálně vyhodnocené na úlohách rozpoznávání po- jmenovaných entit a tvaroslovného značkování.
Keywords:
deep learning; machine learning; neural networks; semi-supervised learning; sequence labeling; sequence modeling; hluboké učení; modelovaní sekvencí; neuronové sítě; označování sekvencí; semi-supervizované učení; strojové učení
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/110219