| |
| |
| |
| |
|
Od korpusu jako otevřeného zdroje pro bádání ke komerčním produktům
Šimandl, Josef
Článek nastiňuje vývoj korpusů od velkých souborů neznačkovaných textů přes značkované korpusy k nástrojům, které operují nad značkovanými korpusy a produkují data prezentovaná jako data o jazyku, jako jsou např. Word Sketches (TM). Článek připomíná, že každý korpus je jen reprezentací textů a že se musíme ptát po kvalitě reprezentace. Nezbytná otázka při výzkumu je, jak je korpus vybudován a jak, na základě jakých principů, pracuje obslužný program. Tam, kde zkoumáme korpus s deformacemi, kde se texty objevují v podobě, jak je nikdo nenapsal (číslice a jejich okolí jsou často jevy takového druhu), stejně jako tam, kde nemáme dovoleno dívat se "pod kapotu" nebo měnit pracovní parametry, sotva můžeme mluvit o tom, že bychom dělali vědecký výzkum.
|
| |
|
Slovo prý/prej: možnosti jeho funkční a sémantické diferenciace
Hoffmannová, Jana ; Kolářová, I.
Způsoby „citování“, „reprodukování", resp. parafrázování cizí / vlastní řeči, tj. různé možnosti odkazování k jiným promluvám: 2.1 prý jako neutrální signál „reprodukování“, „citování“, „parafrázování“, 2.2 prý jako modální částice, 2.3 podíl konstrukcí s prý na textových přechodech mezi řečí přímou, polopřímou a nepřímou (event. smíšenou); výskyt prý s dalšími nositeli modálních významů, syntaktická distribuce tohoto výrazu a distribuce v různých stylech a žánrech (jak ji dokládá korpus SYN 2000).
|
| |
| |