keywords:"romanization" - Search Results - Digital Repository

guest :: login Digital Repository
		Search		Submit		Help		About

Home > Search Results: keywords:"romanization"

Search:

Search Tips :: Advanced Search

Search collections:

Sort by:	Display results:	Output format:

	End-to-End Speech Recognition for Low-Resource Languages Sokolovskii, Vladislav ; Schwarz, Petr (referee) ; Karafiát, Martin (advisor) Oblast automatického rozpoznávání řeči začala přijímat end-to-end řešení neuronové sítě pro vytváření rozpoznávačů řeči. Povaha datového hladu těchto typů systémů však umožňuje vytvářet rozpoznávače pouze pro jazyky s velkými zdroji, jako je angličtina, čínština nebo španělština. Ve scénářích s nízkými zdroji je třeba vyvinout některá řešení, která zmírní problém nedostatku dat. Jednou z nejúčinnějších technik je doladění předtrénovaného modelu. Problém se stávajícími přístupy ladění spočívá v tom, že sada tokenů cílového a zdrojového jazyka se obvykle liší. To je důvod, proč předchozí přístupy k učení vícejazyčného přenosu vyžadovaly změnu výstupní vrstvy nebo smíchání tokenů z různých jazyků ve výstupní vrstvě, případně použití univerzální sady tokenů anebo samostatné výstupní vrstvy pro každý jazyk. To je nežádoucí, jelikož sdílení napříč jazyky je v tomto případě latentní a neovladatelné ve výstupním prostoru, když jsou grafémy specifické pro daný jazyk disjunktní. Proto tato práce navrhuje mapování tokenů do společné sady před začátkem předtréninku. Stávající řešení spočívá v transliteraci zdrojového jazyka do cílového, novým přístupem je romanizace, kde je sada tokenů cílového jazyka romanizována tak, aby odpovídala anglické abecedě. Následně lze diakritiku z romanizovaných hypotéz obnovit pomocí dalšího modelu obnovy. To má výhodu ve zvýšení sdílení v prostoru výstupního grafému. Detailed record
	Roman Impact on Cherusci Švitorková, Hana ; Kepartová, Jana (advisor) ; Zdichynec, Jan (referee) This Bachelor Thesis is focused on the Roman impact on Cherusci in the period from the last two decades of the 1st century BC to 90 AC. The Thesis aims to determine the extent of the impact of the Roman-Cherusci relation on the tribe, which took a friendly as well as hostile form for several times during the researched period. First, the thesis provides an overview of the ancient literary and archaeological sources, of available information about the tribe itself, and of the history of Roman-Cherusci relations. The second part deals with the impact of the Roman presence in Germania on the power of Cherusci chieftains and aristocracy. The internal relations in the tribe, influenced by the Roman luxurious gifts and financial support of the Cherusci aristocrats, are researched. The next chapter focuses on the romanization of the chieftain sons on the example of Arminius and Flavus, the sons of Cherusci chieftain Segimer. The last part deals with the retinue of chieftains, with the Cherusci presence in the auxiliaries of the Roman army, with the Germanic personal guard of the emperors of the Julio-Claudian dynasty (the so-called Germani corporis custodes), and with the Roman impact on the Germanic warfare. In the research, the analysis of primary and secondary sources was used. The conducted research... Detailed record
	End-to-End Speech Recognition for Low-Resource Languages Sokolovskii, Vladislav ; Schwarz, Petr (referee) ; Karafiát, Martin (advisor) Oblast automatického rozpoznávání řeči začala přijímat end-to-end řešení neuronové sítě pro vytváření rozpoznávačů řeči. Povaha datového hladu těchto typů systémů však umožňuje vytvářet rozpoznávače pouze pro jazyky s velkými zdroji, jako je angličtina, čínština nebo španělština. Ve scénářích s nízkými zdroji je třeba vyvinout některá řešení, která zmírní problém nedostatku dat. Jednou z nejúčinnějších technik je doladění předtrénovaného modelu. Problém se stávajícími přístupy ladění spočívá v tom, že sada tokenů cílového a zdrojového jazyka se obvykle liší. To je důvod, proč předchozí přístupy k učení vícejazyčného přenosu vyžadovaly změnu výstupní vrstvy nebo smíchání tokenů z různých jazyků ve výstupní vrstvě, případně použití univerzální sady tokenů anebo samostatné výstupní vrstvy pro každý jazyk. To je nežádoucí, jelikož sdílení napříč jazyky je v tomto případě latentní a neovladatelné ve výstupním prostoru, když jsou grafémy specifické pro daný jazyk disjunktní. Proto tato práce navrhuje mapování tokenů do společné sady před začátkem předtréninku. Stávající řešení spočívá v transliteraci zdrojového jazyka do cílového, novým přístupem je romanizace, kde je sada tokenů cílového jazyka romanizována tak, aby odpovídala anglické abecedě. Následně lze diakritiku z romanizovaných hypotéz obnovit pomocí dalšího modelu obnovy. To má výhodu ve zvýšení sdílení v prostoru výstupního grafému. Detailed record

Interested in being notified about new results for this query?
Subscribe to the RSS feed.

Digital Repository :: :: :: ::
Powered by v1.1.2
Maintained by

This site is also available in the following languages:
Česky English