Národní úložiště šedé literatury Nalezeno 27 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Určení základního tvaru slova
Šanda, Pavel ; Burget, Radim (oponent) ; Karásek, Jan (vedoucí práce)
Lemmatizace je důležitou procedurou před dolováním v textu v mnoha aplikacích. Proces lemmatizace je podobný procesu stemmingu, s tím rozdílem, že neurčuje pouze kořen slova, ale snaží se slovo převést pomocí metod Brute Force a Suffix Stripping do jeho základního tvaru. Hlavním cílem této práce je prezentovat metody pro vylepšení algoritmů lemmatizace českého jazyka. Obsahem je vytvoření trénovací množiny dat, kterou lze libovolně použít pro studentské i vědecké práce zabývající se podobnou problematikou.
Systém slovenské morfologie založený na vzorech
Klocok, Andrej ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Cieľom tejto práce je zoznámenie sa s metódami morfologickej analýzy, reprezentáciou dát morfologických slovníkov, vytvorením systému technických vzorov pre flektívnu morfológiu slovenčiny. Z tohto systému je odvodený morfologický analyzátor, ktorý vstupné slová lematizuje, určí ich vzor a morfologickú značku, nástroj pre porovnávanie a vyhodnocovanie stemerov, ktorý hodnotí stemery na základe derivačného slovníka, nástroj na rekonštrukciu diakritiky, ktorý vznikol ako pomocný nástroj. V posledných kapitolách práce sú jednotlivé nástroje zhodnotené, analyzátor je porovnaný s dostupnou alternatívou, pomocou nástroja na hodnotenie stemerov sú porovnané dve implementácie slovenských stemerov a je naznačený ďalší vývoj jednotlivých nástrojov
Rozpoznávání a klasifikace emocí na základě analýzy textových zpráv
Buday, Ondřej ; Burget, Radim (oponent) ; Smékal, Zdeněk (vedoucí práce)
Hlavním cílem této diplomové práce je objasnění informací o lidských emocích a jejich rozpoznávání a klasifikaci na základě obecně známých metod. Mezi obecně známé metody patří klasifikace na základě mimických a pantomimických projevů a na základě tónu hlasu. Tato práce se primárně zabývá rozpoznáváním a klasifikací lidských emocí na základě analýzy textových zpráv. Konkrétně se jedná o emoce radosti a hněvu. Pro tuto metodu byla vytvořena česká databáze ve tvaru lemma obsahující tzv. emoční funkční slova. Ta vznikla na základě překladu databáze anglických emočních funkčních slov a dělí se na emoční klíčová slova, emoční modifikační slova a emoční fráze. Zvláštní databázi pak tvoří tzv. neutrální slova, která jsou při klasifikaci emocí z textového vstupu z porovnávání vyjmuta s výjimkou porovnávání emočních frází. Klíčovým emočním slovům a frázím byly pro obě emoce přiřazeny tzv. váhy a jejich přiřazení bylo provedeno vícero lidmi, čímž byla dosažena větší objektivita databáze. Hodnoty jednotlivých emočních slov a frází mohou ovlivnit tzv. modifikační emoční slova, slova obsahující stupňování, zápor, nebo příslušná interpunkční znaménka. Výstupem diplomové práce je funkční aplikace v jazyce JAVA. Ta po vložení vstupního textu porovná jednotlivá slova se všemi dostupnými databázemi a vypočítá výsledný emoční poměr pro emoci radosti a emoci hněvu. Vyhodnocení se též týká jednotlivých slov, vět a odstavců. Aplikace byla navržena ve vývojovém prostředí NetBeans za pomoci Swing GUI Builderu.
Zarovnávání paralelních textů
Kadlček, Filip ; Grézl, František (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá zarovnáváním paralelních textů. V první části popisuje přístupy k zarovnávání a některé nástroje na zarovnávání. V práci je nejprve jednoduše popsáno statistické zarovnávání, a dále je popsáno zarovnávání s využitím slovníku, jež je hlavním tématem této práce. V další částii práce je uveden princip slovníkového zarovnávání a také ukázka zarovnání dat na vybraném vzorku dat. V závěru práce jsou shrnuty získané výsledky a také návhy na budoucí rozvoj v daném tématu.
Web jako zdroj dat pro automatické vytváření morfologického slovníku
Bulka, Pavol ; Matějka, Pavel (oponent) ; Smrž, Pavel (vedoucí práce)
Tvorba slov v přirozeném jazyce se zakládá na pravidlech, které jsou komplexní, často je nemožné je jednoznačně formálně definovat. Proto se při zpracování přirozeného jazyka využívají morfologické slovníky. Tato práce se zaobírá vytvářením morfologického slovníku z dat sesbíraných z webových stránek slovenské národní domény. Přičemž se zaměřuje nejen na tvorbu slovníku, ale i na získávání dat, jejich zpracování do použitelné podoby pro účely morfologické analýzy, ale i vhodnými datový­mi strukturami pro jejich uložení. Dále objasňuje základní principy a pojmy morfologické analýzy a tvorby slov při zpracování přirozeného jazyka počítačem. Vytvořený systém, který je popsaný v této práci, produkuje ze vstupních dat morfologický slovník, který může být použitý v různých aplikacích, například korektoru pravopisu, strojového překladu textu a podobně.
Slovenská lemmatizace
Lipták, Šimon ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Cieľom tejto bakalárskej práce bolo zoznámiť sa s nástrojmi a metódami pre morfologickú analýzu a lematizáciu slov, navrhnúť a implementovať systém, ktorý dokáže lematizovať slovenské slová, ktoré sa nenachádzajú v slovníku a následne vypísať vyskloňované tvary, spracovať slovenské dáta pre implementáciu stemmingu. Na záver vyhodnotiť úspešnosť na základe testovania a porovnať s dostupnými alternatívami.
Terminology in Visual Arts in a large bilingual dictionary
Kučerová, Daniela ; Vachková, Marie (vedoucí práce) ; Šemelík, Martin (oponent)
Předkládaná diplomová práce se zabývá problematikou terminologie výtvarného umění ve velkém překladovém slovníku a zároveň se zamýšlí nad touto problematikou. Diplomová práce je členěna na teoretickou a praktickou část. V teoretické části jsou definovány pojmy z oblasti výtvarného umění, terminologie a lexikografie. Jsou vymezeny pojmy jako např. odborný jazyk, obecný jazyk, termín, odborná slovní zásoba, synonymie a ekvivalence nebo odborný slovník. Praktická část analyzuje výběr slovníkových hesel výtvarného umění z hlediska lingvistického, terminologického, lexikografického v překladovém slovníku.
On Sense Division in a Bilingual Dictionary
Hagenhoferová, Lucie ; Vachková, Marie (vedoucí práce) ; Šemelík, Martin (oponent)
Tato diplomová práce se zabývá problematikou členění heslové statě na jednotlivé oddíly, tj. členěním na významy, a úzce s tím související problematikou uspořádání těchto oddílů, tj. řazením významů, přičemž v centru zájmu stojí překladový pasivní německo-český slovník. Okrajově je pojednáno rovněž odlišování významů pomocí různých prostředků, tj. lišení významu. S jmenovanými třemi tématy, která představují chronologický sled lexikografických rozhodnutí, koreluje problematika ekvivalence a chápání pojmu významu. V teoretické části jsou představena specifika členění na významy a řazení významů v jednojazyčné a v překladové lexikografii, v praktické části jsou možnosti členění na významy a řazení významů exemplifikovány na deseti vybraných substantivních lemmatech, která byla zpracována pro vznikající Velký německo-český akademický slovník. Pro každé lemma je navržena nejvhodnější forma záznamu do lexikální databáze, která je pak srovnána s příslušným slovníkovým záznamem ve zdrojovém slovníku Duden - Deutsches Universalwörterbuch. Rozdíly mezi formami mikrostruktury ilustrují nutnost revize a případné modifikace převzaté struktury na základě korpusové analýzy za využití různých korpusových nástrojů, internetových rešerší a konzultace mnohých příruček.
Konkurence slovotvorných sufixů při přechylování názvů profesí
Kožuriková, Daniela ; Bozděchová, Ivana (vedoucí práce) ; Mareš, Petr (oponent)
Bakalářská práce Konkurence slovotvorných sufixů při přechylování názvů profesí je rozdělena do dvou částí. V první části jsou shrnuty poznatky, které o této problematice podává odborná literatura. Pojednáno je i o sufixech, jež se při přechylování používají nejčastěji. V druhé části práce jsou uvedeny výsledky praktického výzkumu, při němž byly názvy ženských profesí, nalezené ve slovníku Nová slova v češtině 1 a 2, zadávány ve formě lemmat do korpusů SYN 2000 a SYN 2005 a byla zkoumána jejich četnost. Na konec práce je zařazen praktický slovníček, který vysvětluje význam některých méně známých substantiv pojmenovávajících profese.
Syntax of Adjective Compounds in a Bilingual Dictionary
Schmidtová, Iva ; Vachková, Marie (vedoucí práce) ; Hejhalová, Věra (oponent)
Předložená diplomová práce si klade za cíl přiblížit problematiku zpracovávání syntaxe u slovníkových hesel složených adjektiv pro Velký německo-český akademický slovník. Lze předpokládat, že právě tato slova, která patří ke komplikovanější lexice, činí potíže nerodilému mluvčímu při porozumění i produkci textu. To vyplývá již z podstaty německého jazyka, který na rozdíl od češtiny často vytváří složeniny. Problematický nemusí být pouze význam těchto slov, ale i jejich používání. Diplomová práce je rozdělena do dvou částí. V teoretické části je provedena charakteristika adjektiv jako slovního druhu, a protože každé slovo se vždy vyskytuje v nějakém určitém kontextu, je dále největší pozornost věnována valenci adjektiv. Dříve byla valence adjektiv upozaděna, pojednáváno bylo především o valenci sloves a substantiv. Přestože rodilý mluvčí má syntaktické valenční struktury v podvědomí automatizované, a přestože se v případě cizího jazyka struktury výchozího a cílového jazyka mohou podobat, měly by být ve slovníku důsledně uváděny. Ve výkladovém jednojazyčném i v překladovém dvojjazyčném slovníku by měl uživatel získat co nejobsáhlejší informace o hledaném slovu. V praktické části je na příkladu deseti vybraných složených adjektiv zkoumáno, do jaké míry jsou valenční struktury zohledňovány v již...

Národní úložiště šedé literatury : Nalezeno 27 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.