Název:
Podobnost proteinových struktur s využitím genetického programování
Překlad názvu:
Protein Structure Similarity Using Genetic Programming
Autoři:
Šiagi, Miroslav ; Hoksza, David (vedoucí práce) ; Mráz, František (oponent) Typ dokumentu: Bakalářské práce
Rok:
2013
Jazyk:
slo
Abstrakt: [eng][cze] The thesis deals with the protein structure similarity problem which is an important aspect of bioinformatics. Due to exponential growth of protein structures in databases, the development of more effective methods is required. Principles of evolutionary computation offer a way to solve the similarity problem. We focus on one of the evolutionary paradigms - genetic programming. The main advantage of genetic programming is a tree representation. We propose new method called ProSSiGen using genetic programming. ProSSiGen is evaluated by automatic protein classification. Obtained results signify that the efficiency of our method is insufficient. Regardless of the inefficiency, there are many reasons to continue to research. One of the reasons is the capability of genetic programming.Dôležitý aspekt bioinformatiky, ktorému sa práca venuje, je porovnávanie proteínových štruktúr. Vzhľadom na exponenciálny nárast databáz proteínových štruktúr za posledné roky bol potrebný vývoj efektívnejších metód. Riešenie daného problému nám ponúkajú evolučné výpočtové techniky. Predstavujú významný princíp, kedy počítač môže vyriešiť daný problém bez toho, aby ho človek preň explicitne naprogramoval. Zameriame sa na jednu paradigmu evolučných výpočtových techník - genetické programovanie. Vďaka stromovej reprezentácii má táto paradigma oproti zvyšným výhodu. Cieľom práce je preskúmanie možností využitia genetického programovania pri porovnávaní proteínových štruktúr. Navrhneme novú metódu - nazvanú ProSSiGen. Jej výsledky preukázali nedostatočnú presnosť klasifikácie a tiež to, že tento evolučný prístup rozhodne netreba zatratiť, len ho ďalej rozširovať a testovať. Tým budeme môcť vyvodiť záver, či je genetické programovanie pre túto úlohu vhodné.
Klíčová slova:
genetické programování; podobnost; proteinová struktura; genetic programming; protein structure; similarity