| |
|
Korpus rozhlasových nahrávek
Štěpánová, Veronika
Příspěvek představuje vznikající korpus rozhlasových nahrávek profesionálních mluvčích, jehož vybudování je podpořeno grantovým projektem GA UK. Tento korpus nahrávek s jejich přepisy poslouží především jako zdroj výzkumu výslovnostního úzu v českých médiích. Materiál je získáván ze zvukového archivu Českého rozhlasu, z něhož lze volně stahovat záznamy mnoha rozhlasových pořadů v dobré kvalitě. Vybíráni jsou mluvčí, od nichž je k dispozici větší množství delších monologických nahrávek, aby bylo pravděpodobné, že se v nich vyskytnou sledované jevy v dostatečném počtu.
|
| |
|
Využití paralelního korpusu InterCorp k získávání ekvivalentů pro chorvatsko-český slovník
Jirásek, Karel
Paralelní chorvatsko-český korpus, který je součástí projektu InterCorp, v roce 2010 přesáhl rozsah 10 milionů textových slov v obou jazykových verzích, a proto bylo možno přistoupit k jeho praktickému využití při hledání ekvivalentů pro připravované chorvatsko-české slovníky. Uvedená velikost korpusu se ukázala jako vcelku postačující pro zpracování slovníku středního rozsahu, který by měl obsahovat přibližně 20 tisíc hesel. U frekventovaných hesel již tato velikost korpusu díky konfrontaci dvou jazyků umožňuje zaznamenat polysémii slov nezřídka lépe, než jak to činí některé stávající výkladové a překladové slovníky. To je velkou výhodou zejména pro tvorbu překladových slovníků mezi úzce příbuznými jazyky.
|