keywords:"korpus" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"korpus"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Porovnání analýzy řečového signálu v závislosti na věku a pohlaví mluvčího Báňa, Josef ; Smékal, Zdeněk (oponent) ; Atassi, Hicham (vedoucí práce) Obsah této práce je zaměřen na analýzu věku a pohlaví. Dále pak byli zkoumány vhodnosti příznaků a vhodnost jejich použití při klasifikaci mluvčích. Je v ní pojednáno o základní teorii řečového signálu a problematice zobrazení a zpracování řeči. Je zde popsán volně dostupný program Praat, kterým se používá pro řečovou analýzu. Zaměřili jsme se na suprasegmentální příznaky řeči. Dále je zde popsána teorie příznaků které byly pro práci zvoleny. Prvním z kroků v této práci bylo získání dostatečného počtu promluv (nahráváním) od mluvčích různého věku a pohlaví. Řečový korpus je poměrně obsáhlý. Mluvčí byli rozděleni do šesti věkových skupin. Dále byly nahrávky zpracovány v programu Praat. Průměrné hodnoty byly vyneseny do tabulek a sloupcových grafů pro větší přehlednost. Dále bylo vybráno dvanáct nejvhodnějších příznaků podle kritéria kvality. S nimi poté byla provedena analýza zvolených příznaků pro automatické rozpoznávání pohlaví a věku. Příznaky byly při testování po jednom ubírány. Jako klasifikátor pro rozpoznávání byla zvolena neuronová sít. Pro práci se sítí byl zvolen Neural Network Toolbox v programu Matlab. Vytvořené sítě byly použity pro klasifikaci mluvčích na základě věku a pohlaví. Výsledky byly rozebrány v závěru práce. Úplný záznam
	Automatická tvorba korpusů Šantavý, Marek ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce) Obsahem práce je představení způsobu formátování a značkování textových dat korpusu. Nad vhodně reprezentovanými dokumenty vytváří vrstvu pro jejich vzájemné porovnání s cílem určení míry podobnosti mezi nimi. Nástroje, které výpočty podobnosti zajišťují, jsou základem automatizovaného systému pro vytváření a doplňování existujícího korpusu dat. Mezi dvěma základními přístupy je možno volit podle požadavku výpovědní hodnoty výsledku. Prostředkem pro získávání dat nových je nástroj stahování obsahu webu. Úplný záznam
	Automatická tvorba slovníků z překladových textů Musil, Jakub ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce) Cílem této práce je vytvoření systému pro získání překladu slov zdrojového jazyka do jazyka cílového pomocí ekvivalentní dvojice vstupních textů. V této práci jsou popsány pojmy a metody používané v oblasti strojového překladu a strojové tvorby překladových slovníků. Práce také obsahuje návrh a popis jednotlivých fází, ze kterých se skládá vytvořený systém, včetně závěrečného testování, vyhodnocení získaných překladů a možnosti rozšíření existujícího překladového slovníku. Úplný záznam
	Experimentální překladač z češtiny do slovenštiny Zachar, Lukáš ; Mrnuštík, Michal (oponent) ; Smrž, Pavel (vedoucí práce) Tahle práce popisuje princip strojového překladu, oboznamuje čtenáře s již existujícimi systémem pro strojový překlad Moses a navrhuje systém, kteří za jeho pomoci je schopen se naučit a posléze překládat text z češtiny do slovenštiny. Úplný záznam
	Automatická tvorba slovníků z překladových textů Sumbalová, Lenka ; Kouřil, Jan (oponent) ; Smrž, Pavel (vedoucí práce) Cílem této bakalářské práce bylo vytvořit systém pro automatickou tvorbu slovníků z překladových testů. Je popsána implementace systému, který generuje česko-anglický slovník ze zarovnaného paralelního korpusu a shrnut výsledek práce. Dále je analyzován paralelní korpus CzEng, který byl použit jako zdroj dat pro slovníky a vysvětleny teoretické pojmy související s touto problematikou. Úplný záznam
	Paralelní korpusový manažer Kouřil, Jan ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce) Cílem diplomové práce bylo implementovat paralelní korpusový manažer, který umí zarovnat paralelní cizojazyčné texty a vložit je do korpusu, kde jsou poskytnuty další funkce pro jejich zpracování. Program poskytuje možnosti automatického zarovnání paralelních textů a jejich interaktivní úpravy. Tyto zarovnané texty se následně vkládají do korpusu. Program umí spravovat několik korpusů, paralelní korpus je identifikován vždy dvojicí jazyků. V korpusu je potom možno vyhledávat podle několika kategorií, zobrazovat a editovat jednotlivé výběry, lemmatizovat a morfologicky značkovat dané texty, provádět různá třídění výběrů, importovat a exportovat data, různými způsoby upravovat korpus pro další snadnou navigaci a přidávat další významy do spravovaných slovníků. Jednotlivé kapitoly popisují úvod ke korpusové problematice, teorii zarovnání paralelních textů, morfologické značkování textu a lemmatizaci, externí nástroje v programu použité, nejčastější formáty titulků a implementační řešení jednotlivých problémů. Úplný záznam
	Zarovnávání paralelních textů Kadlček, Filip ; Grézl, František (oponent) ; Smrž, Pavel (vedoucí práce) Tato práce se zabývá zarovnáváním paralelních textů. V první části popisuje přístupy k zarovnávání a některé nástroje na zarovnávání. V práci je nejprve jednoduše popsáno statistické zarovnávání, a dále je popsáno zarovnávání s využitím slovníku, jež je hlavním tématem této práce. V další částii práce je uveden princip slovníkového zarovnávání a také ukázka zarovnání dat na vybraném vzorku dat. V závěru práce jsou shrnuty získané výsledky a také návhy na budoucí rozvoj v daném tématu. Úplný záznam
	Automatická tvorba slovníků z překladových textů Svoboda, František ; Matějka, Pavel (oponent) ; Smrž, Pavel (vedoucí práce) Cílem práce je vytvoření systému, který by dokázal generovat z paralelních dvojjazyčných textů překladové slovníky. Jsou popsány příklady, jak lze takové dokumenty získat, a jaké kroky je vhodné nad daty podniknout, aby z nich bylo možné extrahovat požadovanou informaci. Za tímto účelem byly prozkoumány a využity zejména statistické metody strojového překladu. Kromě popisu vytvořeného systému lze v práci nalézt rozbor problémů, které jsou s tématem spojeny, a hodnocení dosažených výsledků. Úplný záznam
	Kontrola konzistence informací extrahovaných z textu Stejskal, Jakub ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce) Tato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému. Úplný záznam
	Collocability of German Adjectives in a Bilingual Dictionary Budín, Tomáš ; Vachková, Marie (vedoucí práce) ; Šemelík, Martin (oponent) Tato diplomová práce si klade za cíl zmapovat kolokabilitu německých adjektiv a ze získaných poznatků vyvodit závěry a doporučení pro její zpracování v mikrostruktuře adjektivních hesel v německo-českém překladovém slovníku. Diplomová práce je vedlejším výstupem projektu Velkého německo-českého akademického slovníku, který vzniká od roku 2000 na půdě Ústavu germánských studií Filozofické fakulty Univerzity Karlovy v Praze. Při práci na slovníku i v této diplomové práci byly využívány metody korpusové lingvistiky, zejména kombinace konceptů corpus-based a corpus-driven. Pomocí kookurenční databanky CCDB Institutu pro německý jazyk v Mannheimu byla zjišťována nejčetnější slovní spojení daného adjektiva; konkrétní slovníkové příklady pak byly vyhledávány v korpusu DeReKo IDS Mannheim systémem COSMAS II nebo na internetu pomocí vyhledávače Google. Získaná data byla ukládána do speciálního číselného rastru slovnědruhově strukturované databáze. Práce dochází ke zjištění, že heslovou stať každého adjektiva lze realizovat více způsoby v závislosti na preferovaném kritériu. Jedná se především o hlediska frekvenční, sémantická, syntaktická a didaktická. V praktické části práce bylo analyzováno 15 adjektiv vybraných z 500 hesel, jejichž zpracování předcházelo této diplomové práci. Ke každému adjektivu byly... Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English