Název:
Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník
Překlad názvu:
The usage of an InterCorp parallel corpus to obtain equivalents for a Croatian-Czech dictionary
Autoři:
Jirásek, Karel Typ dokumentu: Příspěvky z konference Konference/Akce: Korpusová lingvistika Praha 2011, Praha (CZ), 2011-09-22 / 2011-09-24
Rok:
2011
Jazyk:
cze
Abstrakt: [cze][eng] Paralelní chorvatsko-český korpus, který je součástí projektu InterCorp, v roce 2010 přesáhl rozsah 10 milionů textových slov v obou jazykových verzích, a proto bylo možno přistoupit k jeho praktickému využití při hledání ekvivalentů pro připravované chorvatsko-české slovníky. Uvedená velikost korpusu se ukázala jako vcelku postačující pro zpracování slovníku středního rozsahu, který by měl obsahovat přibližně 20 tisíc hesel. U frekventovaných hesel již tato velikost korpusu díky konfrontaci dvou jazyků umožňuje zaznamenat polysémii slov nezřídka lépe, než jak to činí některé stávající výkladové a překladové slovníky. To je velkou výhodou zejména pro tvorbu překladových slovníků mezi úzce příbuznými jazyky.In the year 2010, the parallel Croatian-Czech corpus, which is part of the InterCorp project, exceeded 10 million tokens in both language versions and therefore it was possible to proceed to its practical use in finding equivalents for the Croatian-Czech dictionaries being prepared. The indicated size of the corpus has proved to be quite adequate for building a medium size dictionary, which should contain approximately 20 thousand entries. In the case of frequent entries, due to the confrontation of two languages, this corpus size is often adequate to capture the polysemy of words better than some existing explanatory or bilingual dictionaries. This is a great advantage, especially for the creation of bilingual dictionaries of two closely related languages.
Klíčová slova:
Croatian language; Czech language; dictionaries; Intercorp; lexicography Číslo projektu: CEZ:AV0Z90920516 (CEP) Zdrojový dokument: Korpusová lingvistika Praha 2011, ISBN 978-80-7422-114-9
Instituce: Slovanský ústav AV ČR
(web)
Informace o dostupnosti dokumentu:
Dokument je dostupný v příslušném ústavu Akademie věd ČR. Původní záznam: http://hdl.handle.net/11104/0203315