Original title:
Bioinformatický nástroj pro analýzu genových okolí
Translated title:
Bioinformatics Tool for the Analysis of Gene Neighbourhoods
Authors:
Hřebíček, Ondřej ; Kameník, Zdeněk (advisor) ; Větrovský, Tomáš (referee) Document type: Master’s theses
Year:
2022
Language:
cze Abstract:
[cze][eng] Vyhledávání nových klastrů biosyntetických genů (BGC), zejména v Aktinobakteriích, je klíčové pro vývoj nových antimikrobiálních látek i dalších biologicky aktivních sloučenin odvozených od specializovaných metabolitů bakterií. Softwary pro vyhledávání BGC, které nejsou závislé na databázích publikovaných BGC, jsou v současnosti velmi limitovány. Tento typ softwarů však poskytuje výhody oproti přístupům, které těchto databází využívají. V této práci prezentuji bioinformatický nástroj, který sjednocuje funkce z několika dalších databáze-nevyužívajících bioinformatických nástrojů do jednoho. Tento software poskytuje plně interaktivní grafické rozhraní. Software využívá výstupu NCBI BLASTu k nalezení kódujících sekvencí homologů proteinů, podle kterých lze daný BGC identifikovat. Software následně zobrazuje výsledky v rámci uživatelského rozhraní, které uživateli umožňuje data dále analyzovat. Spolehlivost softwaru byla testována vyhledáváním subklastrů, kódujících biosyntézu 4-alkyl-L-prolinových prekurzorů odvozených od L-tyrosinu nebo L-leucinu. Během testování byl software schopen najít 120 ze 121ti ručně-nalezených subklastrů L-tyrosinové dráhy a 131 předpokládaných subklastrů L-leucinové dráhy, čímž byla potvrzena jeho spolehlivost. Většina z nalezených subklastrů L-leucinové i L- tyrosinové...The discovery of novel biosynthetic gene clusters (BGCs), particularly in Actinobacteria, is key for the development of new antimicrobials and other bioactive compounds derived from bacterial specialized metabolites. BGC database-independent BGC-finding software represents a largely-unexplored avenue of research capable of finding BGCs missed by mainstream software due to its dependence on databases of published BGCs. In this work, a bioinformatics tool is presented, which seeks to unite the fragmented functions of database-independent BGC-finding software into a single comprehensive package and make it accessible to non-expert users through an easy-to-use graphical user interface. The software utilizes the output of NCBI BLAST containing user-selected marker proteins to identify points of co-localization, and then displays the results through a fully- interactive graphical interface which allows users to further analyse the data. The software's capabilities and limitations have been tested on L-tyrosine-derived and L-leucine-derived 4-alkyl-L- proline biosynthetic gene subclusters. The software was able to find 120 out of 121 manually-found biosynthetic gene subclusters, showcasing the reliability of the core algorithm. In addition, a further 131 putative L-leucine-derived 4-alkyl-L-proline...
Institution: Charles University Faculties (theses)
(web)
Document availability information: Available in the Charles University Digital Repository. Original record: http://hdl.handle.net/20.500.11956/176798