Original title:
Dolování znalostí z rozsáhlých statistických souborů lékařských dat
Authors:
Badelita, Elvyn-George Document type: Master’s theses
Year:
2015
Language:
cze Abstract:
[cze][eng] Závěrečná práce se zabývá problematikou dolování informací z rozsáhlých souborů lékařských dat pomocí metod a algoritmů strojového učení. Předmětem teoretické části je strojové učení a jeho rozdělení, popis základních datových typů v data miningu, nejdůležitější klasifikační a predikční metody, kritéria definující kvalitu predikčních metod, popis data miningové metodiky a nevyužívanějších systémů. Praktická část se zaměřuje na statistický a informatický průzkum poskytnutých lékařských dat, její vhodnou transformaci, následný návrh a uskutečnění experimentů pomocí metod strojového učení s cílem získat znalosti a skryté informace a nakonec interpretace získaných výsledků společně s vyvozením závěrů pro cílové skupiny.Final thesis deals with information-mining from large sets of medical data using methods and machine learning algorithms. The subject of the theoretical part is machine learning and its distribution, description of the basic data types in data mining, most important classifications and predictions methods, criterion defining the quality of prediction methods, description of data mining methodology and frequently used systems. The practical part focuses on statistical and informatics survey of provided medical data, appropriate transformation, subsequent design and implementation of experiments using machine learning methods to acquire new knowledge and hidden information and finally interpretation of the results together with conclusions for target groups.
Keywords:
data mining; lékařské data; metodologie CRISP-DM; metody data miningu; SPSS; strojové učení