Název:
Automatická tvorba paralelního korpusu z titulků k filmům
Překlad názvu:
Automatic Creation of Parallel Corpus from Movie Subtitles
Autoři:
Straňák, Marek ; Černocký, Jan (oponent) ; Smrž, Pavel (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2009
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstrakt: [cze][eng]
Táto práca sa zaoberá tvorbou paralelného korpusu, ktorého zdrojom sú filmové titulky. Konkrétne sa jedná o zarovnanie českých a anglických viet s využitím slovníkov a morfologických analyzátorov, prípadne zarovnanie titulkov v iných jazykoch na základe časovania jednotlivých komentárov. Práca taktiež pojednáva o obecnej problematike paralelných korpusov.
This work is about the creation of parallel corpus, where movie subtitles is main source. In particulary, it is about alignment czech and english sentences using dictionaries and morphologic analyzers or alignment talks of subtitles in other languages using timing of talks. The work give basic information about parallel corpus.
Klíčová slova:
paralelný korpus; titulky; zarovnanie; značkovanie; alignment; parallel corpus; subtitles; tagging
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/54454