Název: Rozpoznávání pojmenovaných entit v biomedicínské doméně
Překlad názvu: Named entity recognition in the biomedical domain
Autoři: Williams, Shadasha ; Pecina, Pavel (vedoucí práce) ; Straková, Jana (oponent)
Typ dokumentu: Diplomové práce
Rok: 2021
Jazyk: eng
Abstrakt: Thesis Title: Named Entity Recognition in the Biomedical Domain Named entity recognition (NER) is the task of information extraction that attempts to recognize and extract particular entities in a text. One of the issues that stems from NER is that its models are domain specific. The goal of the thesis is to focus on entities strictly from the biomedical domain. The other issue with NER comes the synonymous terms that may be linked to one entity, moreover they lead to issue of disambiguation of the entities. Due to the popularity of neural networks and their success in NLP tasks, the work should use a neural network architecture for the task of named entity disambiguation, which is described in the paper by Eshel et al [1]. One of the subtasks of the thesis is to map the words and entities to a vector space using word embeddings, which attempts to provide textual context similarity, and coherence [2]. The main output of the thesis will be a model that attempts to disambiguate entities of the biomedical domain, using scientific journals (PubMed and Embase) as the documents of our interest.
Klíčová slova: Rozpoznávání pojmenovaných entit|biomedicínská doména|hluboké neuronové sítě; Named entity recognition|biomedical domain|deep neural networks

Instituce: Fakulty UK (VŠKP) (web)
Informace o dostupnosti dokumentu: Dostupné v digitálním repozitáři UK.
Původní záznam: http://hdl.handle.net/20.500.11956/152499

Trvalý odkaz NUŠL: http://www.nusl.cz/ntk/nusl-453779


Záznam je zařazen do těchto sbírek:
Školství > Veřejné vysoké školy > Univerzita Karlova > Fakulty UK (VŠKP)
Vysokoškolské kvalifikační práce > Diplomové práce
 Záznam vytvořen dne 2021-10-31, naposledy upraven 2023-12-17.


Není přiložen dokument
  • Exportovat ve formátu DC, NUŠL, RIS
  • Sdílet