Original title:
Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník
Translated title:
The usage of an InterCorp parallel corpus to obtain equivalents for a Croatian-Czech dictionary
Authors:
Jirásek, Karel Document type: Papers Conference/Event: Korpusová lingvistika Praha 2011, Praha (CZ), 2011-09-22 / 2011-09-24
Year:
2011
Language:
cze Abstract:
[cze][eng] Paralelní chorvatsko-český korpus, který je součástí projektu InterCorp, v roce 2010 přesáhl rozsah 10 milionů textových slov v obou jazykových verzích, a proto bylo možno přistoupit k jeho praktickému využití při hledání ekvivalentů pro připravované chorvatsko-české slovníky. Uvedená velikost korpusu se ukázala jako vcelku postačující pro zpracování slovníku středního rozsahu, který by měl obsahovat přibližně 20 tisíc hesel. U frekventovaných hesel již tato velikost korpusu díky konfrontaci dvou jazyků umožňuje zaznamenat polysémii slov nezřídka lépe, než jak to činí některé stávající výkladové a překladové slovníky. To je velkou výhodou zejména pro tvorbu překladových slovníků mezi úzce příbuznými jazyky.In the year 2010, the parallel Croatian-Czech corpus, which is part of the InterCorp project, exceeded 10 million tokens in both language versions and therefore it was possible to proceed to its practical use in finding equivalents for the Croatian-Czech dictionaries being prepared. The indicated size of the corpus has proved to be quite adequate for building a medium size dictionary, which should contain approximately 20 thousand entries. In the case of frequent entries, due to the confrontation of two languages, this corpus size is often adequate to capture the polysemy of words better than some existing explanatory or bilingual dictionaries. This is a great advantage, especially for the creation of bilingual dictionaries of two closely related languages.
Keywords:
Croatian language; Czech language; dictionaries; Intercorp; lexicography Project no.: CEZ:AV0Z90920516 (CEP) Host item entry: Korpusová lingvistika Praha 2011, ISBN 978-80-7422-114-9
Institution: Institute of Slavonic Studies AS ČR
(web)
Document availability information: Fulltext is available at the institute of the Academy of Sciences. Original record: http://hdl.handle.net/11104/0203315