Original title:
Extrakce informací z lékařských textů
Translated title:
Extracting Information from Medical Texts
Authors:
Zvára, Karel ; Svátek, Vojtěch (advisor) ; Veselý, Arnošt (referee) ; Skalská, Hana (referee) Document type: Doctoral theses
Year:
2017
Language:
cze Abstract:
[cze][eng] Cílem mé práce bylo zjistit specifické vlastnosti českých lékařských zpráv z hlediska možnosti extrahovat z nich konkrétní informace. Pro svoji práci jsem měl k dispozici celkem 268 anonymizovaných narativních lékařských zpráv ze dvou ambulantních pracovišť. Studoval jsem standardy pro uchování elektronické zdravotnické dokumentace i pro přenos klinických informací mezi informačními systémy ve zdravotnictví. Věnoval jsem se také implementování elektronického zdravotního záznamu v zubním lékařství. Nejprve jsem se narativní lékařské zprávy snažil zpracovat pomocí nástrojů pro zpracování přirozeného jazyka (Natural Language Processing, NLP). Dospěl jsem k závěru, že narativní lékařské zprávy v českém jazyce jsou typickému českému textu velmi vzdálené zejména pro svoji heslovitost a absenci české větné stavby. Obsahují také velké množství překlepů, zkratek a zkrácených slov. Vzhledem k nedostupnosti hlavních mezinárodních klasifikačních systémů v českém jazyce jsem se rozhodl pokračovat ve výzkumu vývojem metody pro přípravu vstupního textu pro překlad a jeho sémantickou anotaci. Hlavním cílem této části výzkumu bylo navrhnout metodu a podpůrný software pro interaktivní korekci a sémantickou anotaci narativních lékařských zpráv, které by umožnily jejich snadnější použití, s menším množstvím chyb i...The aim of my work was to find out the specific features of Czech medical reports in terms of the possibility of extracting specific information from them. For my work, I had a total of 268 anonymized narrative medical reports from two outpatient departments. I have studied standards for preserving electronic health records and for transferring clinical information between healthcare information systems. I have also participated in the process of implementing electronic medical record in the field of dentistry. First of all, I tried to process narrative medical reports using natural language processing (NLP) tools. I came to the conclusion that narrative medical reports in the Czech language are very different than a typical Czech text, especially because it mostly contains short telegraphic phrases and the texts lack typical Czech sentence structure. It also contains many misspellings, acronyms and abbreviations. Another problem was the absence of existence of the Czech translation of the main international classification systems. Therefore I decided to continue the research by developing the method for pro-processing the input text for translation and its semantic annotation. The main objective of this part of the research was to propose a method and support software for interactive correction...
Keywords:
Clinical reports; electronic health record; information extraction; natural language processing; elektronický zdravotní záznam; extrakce informací; Lékařské zprávy; zpracování přirozeného textu
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/94214