Národní úložiště šedé literatury Nalezeno 164 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Porovnání analýzy řečového signálu v závislosti na věku a pohlaví mluvčího
Báňa, Josef ; Smékal, Zdeněk (oponent) ; Atassi, Hicham (vedoucí práce)
Obsah této práce je zaměřen na analýzu věku a pohlaví. Dále pak byli zkoumány vhodnosti příznaků a vhodnost jejich použití při klasifikaci mluvčích. Je v ní pojednáno o základní teorii řečového signálu a problematice zobrazení a zpracování řeči. Je zde popsán volně dostupný program Praat, kterým se používá pro řečovou analýzu. Zaměřili jsme se na suprasegmentální příznaky řeči. Dále je zde popsána teorie příznaků které byly pro práci zvoleny. Prvním z kroků v této práci bylo získání dostatečného počtu promluv (nahráváním) od mluvčích různého věku a pohlaví. Řečový korpus je poměrně obsáhlý. Mluvčí byli rozděleni do šesti věkových skupin. Dále byly nahrávky zpracovány v programu Praat. Průměrné hodnoty byly vyneseny do tabulek a sloupcových grafů pro větší přehlednost. Dále bylo vybráno dvanáct nejvhodnějších příznaků podle kritéria kvality. S nimi poté byla provedena analýza zvolených příznaků pro automatické rozpoznávání pohlaví a věku. Příznaky byly při testování po jednom ubírány. Jako klasifikátor pro rozpoznávání byla zvolena neuronová sít. Pro práci se sítí byl zvolen Neural Network Toolbox v programu Matlab. Vytvořené sítě byly použity pro klasifikaci mluvčích na základě věku a pohlaví. Výsledky byly rozebrány v závěru práce.
Automatická tvorba korpusů
Šantavý, Marek ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Obsahem práce je představení způsobu formátování a značkování textových dat korpusu. Nad vhodně reprezentovanými dokumenty vytváří vrstvu pro jejich vzájemné porovnání s cílem určení míry podobnosti mezi nimi. Nástroje, které výpočty podobnosti zajišťují, jsou základem automatizovaného systému pro vytváření a doplňování existujícího korpusu dat. Mezi dvěma základními přístupy je možno volit podle požadavku výpovědní hodnoty výsledku. Prostředkem pro získávání dat nových je nástroj stahování obsahu webu.
Automatická tvorba slovníků z překladových textů
Musil, Jakub ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je vytvoření systému pro získání překladu slov zdrojového jazyka do jazyka cílového pomocí ekvivalentní dvojice vstupních textů. V této práci jsou popsány pojmy a metody používané v oblasti strojového překladu a strojové tvorby překladových slovníků. Práce také obsahuje návrh a popis jednotlivých fází, ze kterých se skládá vytvořený systém, včetně závěrečného testování, vyhodnocení získaných překladů a možnosti rozšíření existujícího překladového slovníku.
Experimentální překladač z češtiny do slovenštiny
Zachar, Lukáš ; Mrnuštík, Michal (oponent) ; Smrž, Pavel (vedoucí práce)
Tahle práce popisuje princip strojového překladu, oboznamuje čtenáře s již existujícimi systémem pro strojový překlad Moses a navrhuje systém, kteří za jeho pomoci je schopen se naučit a posléze překládat text z češtiny do slovenštiny.
Automatická tvorba slovníků z překladových textů
Sumbalová, Lenka ; Kouřil, Jan (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této bakalářské práce bylo vytvořit systém pro automatickou tvorbu slovníků z překladových testů. Je popsána implementace systému, který generuje česko-anglický slovník ze zarovnaného paralelního korpusu a shrnut výsledek práce. Dále je analyzován paralelní korpus CzEng, který byl použit jako zdroj dat pro slovníky a vysvětleny teoretické pojmy související s touto problematikou.
Paralelní korpusový manažer
Kouřil, Jan ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem diplomové práce bylo implementovat paralelní korpusový manažer, který umí zarovnat paralelní cizojazyčné texty a vložit je do korpusu, kde jsou poskytnuty další funkce pro jejich zpracování. Program poskytuje možnosti automatického zarovnání paralelních textů a jejich interaktivní úpravy. Tyto zarovnané texty se následně vkládají do korpusu. Program umí spravovat několik korpusů, paralelní korpus je identifikován vždy dvojicí jazyků. V korpusu je potom možno vyhledávat podle několika kategorií, zobrazovat a editovat jednotlivé výběry, lemmatizovat a morfologicky značkovat dané texty, provádět různá třídění výběrů, importovat a exportovat data, různými způsoby upravovat korpus pro další snadnou navigaci a přidávat další významy do spravovaných slovníků. Jednotlivé kapitoly popisují úvod ke korpusové problematice, teorii zarovnání paralelních textů, morfologické značkování textu a lemmatizaci, externí nástroje v programu použité, nejčastější formáty titulků a implementační řešení jednotlivých problémů.
Zarovnávání paralelních textů
Kadlček, Filip ; Grézl, František (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce se zabývá zarovnáváním paralelních textů. V první části popisuje přístupy k zarovnávání a některé nástroje na zarovnávání. V práci je nejprve jednoduše popsáno statistické zarovnávání, a dále je popsáno zarovnávání s využitím slovníku, jež je hlavním tématem této práce. V další částii práce je uveden princip slovníkového zarovnávání a také ukázka zarovnání dat na vybraném vzorku dat. V závěru práce jsou shrnuty získané výsledky a také návhy na budoucí rozvoj v daném tématu.
Automatická tvorba slovníků z překladových textů
Svoboda, František ; Matějka, Pavel (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem práce je vytvoření systému, který by dokázal generovat z paralelních dvojjazyčných textů překladové slovníky. Jsou popsány příklady, jak lze takové dokumenty získat, a jaké kroky je vhodné nad daty podniknout, aby z nich bylo možné extrahovat požadovanou informaci. Za tímto účelem byly prozkoumány a využity zejména statistické metody strojového překladu. Kromě popisu vytvořeného systému lze v práci nalézt rozbor problémů, které jsou s tématem spojeny, a hodnocení dosažených výsledků.
Kontrola konzistence informací extrahovaných z textu
Stejskal, Jakub ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému.
Collocability of German Adjectives in a Bilingual Dictionary
Budín, Tomáš ; Vachková, Marie (vedoucí práce) ; Šemelík, Martin (oponent)
Tato diplomová práce si klade za cíl zmapovat kolokabilitu německých adjektiv a ze získaných poznatků vyvodit závěry a doporučení pro její zpracování v mikrostruktuře adjektivních hesel v německo-českém překladovém slovníku. Diplomová práce je vedlejším výstupem projektu Velkého německo-českého akademického slovníku, který vzniká od roku 2000 na půdě Ústavu germánských studií Filozofické fakulty Univerzity Karlovy v Praze. Při práci na slovníku i v této diplomové práci byly využívány metody korpusové lingvistiky, zejména kombinace konceptů corpus-based a corpus-driven. Pomocí kookurenční databanky CCDB Institutu pro německý jazyk v Mannheimu byla zjišťována nejčetnější slovní spojení daného adjektiva; konkrétní slovníkové příklady pak byly vyhledávány v korpusu DeReKo IDS Mannheim systémem COSMAS II nebo na internetu pomocí vyhledávače Google. Získaná data byla ukládána do speciálního číselného rastru slovnědruhově strukturované databáze. Práce dochází ke zjištění, že heslovou stať každého adjektiva lze realizovat více způsoby v závislosti na preferovaném kritériu. Jedná se především o hlediska frekvenční, sémantická, syntaktická a didaktická. V praktické části práce bylo analyzováno 15 adjektiv vybraných z 500 hesel, jejichž zpracování předcházelo této diplomové práci. Ke každému adjektivu byly...

Národní úložiště šedé literatury : Nalezeno 164 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.