Národní úložiště šedé literatury Nalezeno 11 záznamů.  1 - 10další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Metody extrakce informací
Adamček, Adam ; Smrž, Pavel (oponent) ; Kouřil, Jan (vedoucí práce)
Cílem procesu extrakce informací je získání relačních dat z textu psaného přirozeným jazykem na další jednodušší zpracování výpočetní technikou. Oblast využití takto získaných informací je široká - od sumarizace textů, přes vytváření ontologií až po zodpovídání otázek QA systémy. Tato práce popisuje návrh a implementaci systému fungujícího ve výpočetním clusteru, který transformuje výpis článků Wikipedie na množinu vyextrahovaných informací, které jsou následně uloženy do distribuované RDF databáze a je nad nimi možné sestavovat dotazy prostřednictvím vytvořeného uživatelského rozhraní.
Kontrola konzistence informací extrahovaných z textu
Stejskal, Jakub ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému.
Sledování aktivovanosti objektů v textech
Václ, Jan ; Vidová Hladká, Barbora (vedoucí práce) ; Novák, Michal (oponent)
V kontextu analýzy diskurzu stupeň aktivovanosti (salience) modeluje aktuální míru zapojenosti odkazovaných objektů a její vývoj v průběhu textu. Algoritmus pro určování aktivovanosti a vizualizaci jejího průběhu již byl navržen a otestován na malém vzorku dat. Tato práce reprodukuje výsledky algoritmu ve větším měřítku pomocí dat z Pražského diskurzního korpusu 1.0. Výsledky jsou pak zpracovány do přístupného tvaru a je provedena jejich analýza jak pomocí vizuálního výstupu, tak i výstupů kvantitativních. Přitom jsou zohledněny dva základní stavební kameny aktivovanosti; koreferenční vztahy a informační struktura věty. V závěru jsou provedeny experimenty zkoumající možné využití informace o aktivovanosti v některé z úloh strojového učení při zpracování přirozeného jazyka na příkladech shlukování dokumentů a tematických modelů. Powered by TCPDF (www.tcpdf.org)
Coreference from the Cross-lingual Perspective
Novák, Michal ; Žabokrtský, Zdeněk (vedoucí práce) ; Stede, Manfred (oponent) ; Rosen, Alexandr (oponent)
Koreference z mezijazykové perspektivy Michal Novák Tématem této práce je studium vlastností koreference s použitím mezijazy- kových přístupů. Motivací práce je výzkum lingvistické typologie založené na koreferenci. Další motivací je prozkoumání, jestli rozdíly ve způsobech, jak ja- zyky vyjadřují koreferenci, mohou být využity k natrénování lepších modelů pro rozpoznávání koreference. Navrhujeme dvě mezijazykové metody: rozpoznávání koreference s informací z druhého jazyka a projekci koreference. Výsledky našich experimentů s těmito metodami na česko-anglických datech naznačují, že s ohle- dem na koreferenci přináší angličtina více informací do češtiny než naopak. Rozpoznávání koreference s informací z druhého jazyka navíc dokázalo při apli- kaci na paralelních datech překonat na obou jazycích výsledky jednojazykového systému na rozpoznávání. Při experimentech používáme jednojazykový roz- poznávač koreference a vylepšenou metodu na zarovnání koreferenčních výrazů, které jsme rovněž navrhli v rámci této práce. 1
Rozpoznávání koreference pro Universal Dependencies
Faryad, Ján ; Novák, Michal (vedoucí práce) ; Rosa, Rudolf (oponent)
Název práce: Rozpoznávání koreference pro Universal Dependencies Autor: Ján Faryad Ústav: Ústav formální a aplikované lingvistiky Vedoucí bakalářské práce: Mgr. Michal Novák Abstrakt: Koreference je důležitým prostředkem pro udržení soudržnosti textu. V univerzálním popisu morfologie a závislostní syntaxe Universal Dependencies (UD) však dosud chyběla možnost jejího vyznačení. Práce představuje způsob, jak koreferenci v projektu UD značit. Součástí práce je i převod dat s anotací koreference z korpusů PDT 3.0 a OntoNotes 5.0 za pomoci nástroje UDPipe pro automatickou analýzu textu ve stylu UD. Práce se dále zabývá implementací systému pro automatické rozpoznávání koreference zájmen pomocí strojového učení. Nakonec je jednoduchým způsobem vyhodnocena úspěšnost systému. Při návrhu programu je kladen důraz na jazykovou nezávislost a kompatibilitu s rozhraním Udapi používaným pro práci s UD. Klíčová slova: rozpoznávání koreference, koreference, anafora, Universal Dependencies, UD
Sledování aktivovanosti objektů v textech
Václ, Jan ; Vidová Hladká, Barbora (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
V kontextu analýzy diskurzu stupeň aktivovanosti (salience) modeluje aktuální míru zapojenosti odkazovaných objektů a její vývoj v průběhu textu. Algoritmus pro určování aktivovanosti a vizualizaci jejího průběhu již byl navržen a otestován na malém vzorku dat. Tato práce reprodukuje výsledky algoritmu ve větším měřítku pomocí dat z Pražského závislostního korpusu 3.0. Výsledky jsou pak zpracovány do přístupného tvaru a je provedena jejich analýza jak pomocí vizuálního výstupu, tak i výstupů kvantitativních. Přitom jsou zohledněny dva základní stavební kameny aktivovanosti; koreferenční vztahy a informační struktura věty. Práce se také zabývá možností modelování aktivovanosti pomocí strojového učení za použití algoritmů rozhodovacích stromů a náhodného lesa. V závěrečné části je proveden experiment zkoumající možné využití informace o aktivovanosti v některé z úloh strojového učení při zpracování přirozeného jazyka na příkladě shlukování dokumentů. Powered by TCPDF (www.tcpdf.org)
Sledování aktivovanosti objektů v textech
Václ, Jan ; Vidová Hladká, Barbora (vedoucí práce) ; Novák, Michal (oponent)
V kontextu analýzy diskurzu stupeň aktivovanosti (salience) modeluje aktuální míru zapojenosti odkazovaných objektů a její vývoj v průběhu textu. Algoritmus pro určování aktivovanosti a vizualizaci jejího průběhu již byl navržen a otestován na malém vzorku dat. Tato práce reprodukuje výsledky algoritmu ve větším měřítku pomocí dat z Pražského diskurzního korpusu 1.0. Výsledky jsou pak zpracovány do přístupného tvaru a je provedena jejich analýza jak pomocí vizuálního výstupu, tak i výstupů kvantitativních. Přitom jsou zohledněny dva základní stavební kameny aktivovanosti; koreferenční vztahy a informační struktura věty. V závěru jsou provedeny experimenty zkoumající možné využití informace o aktivovanosti v některé z úloh strojového učení při zpracování přirozeného jazyka na příkladech shlukování dokumentů a tematických modelů. Powered by TCPDF (www.tcpdf.org)
Kontrola konzistence informací extrahovaných z textu
Stejskal, Jakub ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému.
Metody extrakce informací
Adamček, Adam ; Smrž, Pavel (oponent) ; Kouřil, Jan (vedoucí práce)
Cílem procesu extrakce informací je získání relačních dat z textu psaného přirozeným jazykem na další jednodušší zpracování výpočetní technikou. Oblast využití takto získaných informací je široká - od sumarizace textů, přes vytváření ontologií až po zodpovídání otázek QA systémy. Tato práce popisuje návrh a implementaci systému fungujícího ve výpočetním clusteru, který transformuje výpis článků Wikipedie na množinu vyextrahovaných informací, které jsou následně uloženy do distribuované RDF databáze a je nad nimi možné sestavovat dotazy prostřednictvím vytvořeného uživatelského rozhraní.
Koheze a koherence textu komiksových příběhů (Astérix a Obélix).
BEDNAŘÍKOVÁ, Nikola
Tato práce se zabývá analýzou komiksových textů. Cílem práce je analýza vztahů v tomto typu textů, se zaměřením na mimojazykovou (obrazovou) složku a na klasifikaci různých (nalezených) typů anafor. Jako předloha k jejímu vypracování slouží komiksová alba Astérix, vydaná ve francouzském jazyce. Práce je rozdělena na část teoretickou a část analytickou. Teoretická část se dále člení na tři kapitoly, z nichž první se zabývá popisem komiksu jakožto samostatného umění, druhá poté popisem komiksu Astérix a třetí je věnována lingvistickým termínům, které jsou úzce spjaty s touto tematikou. V analytické části jsou na konkrétních ukázkách z komiksu Astérix představeny koreferenční vztahy mezi jednotlivými referenty.

Národní úložiště šedé literatury : Nalezeno 11 záznamů.   1 - 10další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.