|
Rámec pro extrakci informace z WWW
Brychta, Filip ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Prostředí webu se postupně vyvinulo v nejrozsáhlejší zdroj dokumentů v elektronické podobě, takže by bylo velice výhodné, informace v těchto dokumentech zpracovávat automaticky. To však není jednoduchý úkol, protože většina dokumentů je napsána v HTML (Hypertext Markup Language), který neumožňuje definovat sémantiku dat v těchto dokumentech. Cílem této práce je vytvořit modulární systém pro extrakci informací z HTML dokumentů a jejich další zpracování. Dalším zpracováním se myslí ukládání získaných informací například do XML souboru nebo do relační databáze. Modularita systému umožňuje využití různých extrakčních metod a různých metod pro uložení získaných dat. Díky tomu je systém použitelný pro mnoho různých úloh.
|
|
Webová aplikace pro výuku formálních jazyků a překladačů
Brychta, Filip ; Lukáš, Roman (oponent) ; Techet, Jiří (vedoucí práce)
Tato práce se zabývá vývojem webové aplikace vhodné pro výuku formálních jazyků a překladačů. Aplikace je implementována z části jako redakční systém a z části jako datový sklad. Hlavním cílem je usnadnit přístup k materiálům týkajícím se této problematiky ze strany nejširší veřejnosti. Umožňuje snadné šíření informací jak v textové podobě (komentáře, diskuze, aktuality), tak i prostřednictvím uploadu/downloadu dokumentů.
|
|
Webová aplikace pro výuku formálních jazyků a překladačů
Brychta, Filip ; Lukáš, Roman (oponent) ; Techet, Jiří (vedoucí práce)
Tato práce se zabývá vývojem webové aplikace vhodné pro výuku formálních jazyků a překladačů. Aplikace je implementována z části jako redakční systém a z části jako datový sklad. Hlavním cílem je usnadnit přístup k materiálům týkajícím se této problematiky ze strany nejširší veřejnosti. Umožňuje snadné šíření informací jak v textové podobě (komentáře, diskuze, aktuality), tak i prostřednictvím uploadu/downloadu dokumentů.
|
|
Rámec pro extrakci informace z WWW
Brychta, Filip ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Prostředí webu se postupně vyvinulo v nejrozsáhlejší zdroj dokumentů v elektronické podobě, takže by bylo velice výhodné, informace v těchto dokumentech zpracovávat automaticky. To však není jednoduchý úkol, protože většina dokumentů je napsána v HTML (Hypertext Markup Language), který neumožňuje definovat sémantiku dat v těchto dokumentech. Cílem této práce je vytvořit modulární systém pro extrakci informací z HTML dokumentů a jejich další zpracování. Dalším zpracováním se myslí ukládání získaných informací například do XML souboru nebo do relační databáze. Modularita systému umožňuje využití různých extrakčních metod a různých metod pro uložení získaných dat. Díky tomu je systém použitelný pro mnoho různých úloh.
|