Národní úložiště šedé literatury Nalezeno 164 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.02 vteřin. 
Systém pro aktualizaci anotací v korpusech
Vrša, Štěpán ; Smrž, Pavel (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Cílem této práce je vytvoření systému, který umožní uživatelsky přívětivým způsobem zobrazit a aktualizovat anotace velkých korpusových dat ve formátu MG4J. Tato práce analyzuje stávající řešení správy korpusových dat a anotací a stručně popisuje netriviální nástroje SEC  a MG4J, které jsou využity v řešení. Celý systém je založen na distribuci dat a serverové komunikaci. Stěžejním prvkem systému je aktualizace anotací v MG4J a následná aktualizace indexů MG4J. Systém je schopný provést výše zmíněné operace s přijatelnou dobou odezvy. Tato práce se také zabývá aktualizací entit ve znalostní databázi.
Prohledávání sémanticky anotovaných textů
Grešová, Katarína ; Smrž, Pavel (oponent) ; Dytrych, Jaroslav (vedoucí práce)
Táto práca sa zaoberá problematikou sémantického vyhľadávania nad indexami rozsiahlych textových dát. Cieľom práce je navrhnúť a implementovať vyhľadávací systém s webovým užívateľským rozhraním umožňujúci dynamickú konfiguráciu prístupu k indexom a úpravy anotácií v texte. V práci je analyzované súčasné riešenie vyhľadávacieho systému a jeho nedostatky, z čoho sú vyvodené požiadavky na vyhľadávací systém, ktorý je vhodný na bežné používanie a plne využíva potenciál všetkých nástrojov spojených s vyhľadávacím systémom. Ďalej je v práci popísaný návrh, implementácia a testovanie výsledného systému, ktorého súčasťou je aj rozšírenie v podobe globálnych obmedzení, ktoré zvyšujú presnosť popisu požadovaného výsledku vyhľadávania.
Detekce plagiátů textových dokumentů
Lízal, Radek ; Vítek, Martin (oponent) ; Smital, Lukáš (vedoucí práce)
Tato diplomová práce se zabývá seznámením s definicí plagiátu, rozlišuje, jaké typy plagiátorství se v praxi často objevují a jak se texty podezřelé na plagiátorství vyhledávají. Způsoby detekce jsou při tomto vyhledávání zcela zásadní, tudíž se jim věnuje celá kapitola. V práci se rovněž objevují ukázky programů, které jsou v praxi již používány. Následující kapitola seznamuje s vybranými typy příznaků, které byly implementovány v prostředí Matlab k vytvoření detektoru plagiátů v textovém dokumentu. Vytvořený program je popsán v osmé kapitole. Použité příznaky a chování detektoru jsou otestovány v kapitole nazvané testování příznaků. Testováním byla zjištěna kvalita těchto příznaků. V závěru jsou pak diskutovány výsledky, zároveň s výhodami a nevýhodami detektoru.
Syntaktický analyzátor pro český jazyk
Beneš, Vojtěch ; Otrusina, Lubomír (oponent) ; Kouřil, Jan (vedoucí práce)
Diplomová práce popisuje teoretický návrh a vytvoření syntaktického analyzátoru pro český jazyk pracujícího s frázovým přístupem ke stavbě věty. Využívaná frázová syntaxe je založena na slovních druzích, které jsou sdružovány do větších slovních celků - frází. Implementovaný program pracuje s manuálně sestaveným anotovaným vzorkem dat (korpusem češtiny), na základě kterého za běhu vytvoří pravděpodobnostní bezkontextovou gramatiku (strojové učení). Syntaktický analyzátor, jehož jádrem je rozšířený CKY algoritmus, poté pro zadanou českou větu rozhodne, zda-li patří do jazyka generovaného vytvořenou gramatikou, a v kladném případě vrátí nejpravděpodobnější derivační strom této věty. Tento výsledek je následně porovnán s očekávaným řešením, čímž je vyhodnocena úspěšnost syntaktické analýzy.
Systémy pro kontrolu elektronických textů
Zouhar, Petr ; Malý, Jan (oponent) ; Pfeifer, Václav (vedoucí práce)
Práce se zabývá možností kontroly elektronických textů. Ať už se jedná o zdrojové kódy či běžné textové dokumenty. První kapitola je věnována stručnému vysvětlení plagiátu a jeho znaků. V dalších částech textu popisujeme metody a metriky využívané k odhalování plagiátorů. Poté věnujeme pozornost detekování plagiátů ve volném textu a zdrojových kódech. U volného textu popisujeme způsob předzpracování souboru a výběr základních jednotek, které následně dokument zastupují při porovnávání. Zdrojové kódy mají svou přesně danou syntaxi, a proto se v kapitole popisující přístupy k jejich kontrole věnujeme syntaktické a sémantické analýze. Druhá polovina práce je zaměřena na praktickou část, zejména na programy určené ke kontrole zdrojových kódů. Programy rozdělíme na volně dostupné a komerční. Poté následuje jejich stručný popis a v případě, že umožňují bezplatné vyzkoušení, jsou u nich uvedeny výsledky porovnávání. K tomu účelu jsme vytvořili korpus zdrojových kódů. V závěru práce se věnujeme návrhu programu, který porovnává dva zdrojové kódy na základě statistické podobnosti.
Experimentální překladač z češtiny do slovenštiny
Kadlec, Peter ; Kouřil, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této bakalářské práce bylo seznámit se s metodami používanými pro automatický strojový překlad, navrhnout a implementovat systém pro překlad českých textů do slovenštiny a na závěr vyhodnotit úspěšnost vytvořeného systému pomocí standardních metrik.
Rozšíření systému pro získávání, zpracování a analýzu rozsáhlých kolekcí textů z webu
Matějka, Jiří ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem práce je rozšířit stávající systém pro kolekci, stahování, zpracování a analýzu webových stránek. Práce se zabývá automatizací veškeré prováděné činnosti, přináší nové nástroje do stávajícího systému a nabízí nejen nové verze některých nástrojů zapojených do systému zpracování, ale nabízí i nové postupy a myšlenky.
Mining of Textual Data from the Web for Speech Recognition
Kubalík, Jakub ; Plchot, Oldřich (oponent) ; Mikolov, Tomáš (vedoucí práce)
The preliminary goals of this project were to get familiar with language modeling for speech recognition and techniques for acquisition of text data from the Web. Speech recognition techniques are introduced and statistical language modeling is described in detail. The text also covers mining models and techniques, information retrieval especially. Specific problems of Web mining are discussed and Google search is introduced. Special attention was paid to detailed description of implementation of the text mining system. However, the main goal of this work was to determine, whether the data acquired from the Web can provide some improvement into the recognition systems. The text is describing experiments, which use the retrieved Web data to update sample language models.
Sofistikované metody pro kontrolu elektronických textů
Flégl, Jan ; Malý, Jan (oponent) ; Pfeifer, Václav (vedoucí práce)
Tato práce se zabývá problematikou plagiátorství zdrojových kódů a textových dokumentů. Naším cíle je popsat známé metody, seznámit se s komerčními programy a vytvořit vlastní program na odhalování plagiátů. V úvodu teoretické části definujeme pojem plagiát a plagiátor. Dozvíme se také stručnou historii plagiátorství a jeho současný stav v České republice. Dále se budeme zabývat rozdělením nástrojů pro detekci plagiátů, syntaktickou analýzou a způsoby, jak plagiát odhalit. Funkci jednotlivých metrik si ukážeme na jednoduchých příkladech. Objasníme si také funkci grafické metody s porovnáváním řádků. U všech metod definujeme výhody a nevýhody jejich použití. V závěru teoretické části se budeme zabývat komerčními programy. V praktické části vytvoříme vlastní program, který porovnává dva zdrojové kódy s použitím statistických přístupových metod. Jeho funkci a schopnost odhalit plagiát ověříme na námi vytvořeném korpusu zdrojových kódů.
A corpus perspective on engineering terminology in popularization
Volek, Pavel ; Smutný, Milan (oponent) ; Haupt, Jaromír (vedoucí práce)
This work focuses on the corpus-based approach on the study of technical terminology in popularisation. This is achieved by contrasting the popular contexts with the scientific and academic contexts a term appears in. This work also gives a brief introduction to the concept of corpus linguistics.

Národní úložiště šedé literatury : Nalezeno 164 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.