Národní úložiště šedé literatury Nalezeno 64 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Automatic detection and attribution of quotes
Ustinova, Evgeniya ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Quotations extraction and attribution are important practical tasks for the media, but most of the presented solutions are monolingual. In this work, I present a complex machine learning-based system for extraction and attribution of direct and indirect quo- tations, which is trained on English and tested on Czech and Russian data. Czech and Russian test datasets were manually annotated as part of this study. This system is com- pared against a rule-based baseline model. Baseline model demonstrates better precision in extraction of quotation elements, but low recall. The machine learning-based model is better overall in extracting separate elements of quotations and full quotations as well. 1
Analysis and visualization of OCR output
Nová, Kateřina ; Vidová Hladká, Barbora (vedoucí práce) ; Mírovský, Jiří (oponent)
Optické rozpoznávání znaků (OCR) je proces převodu textu z obrázku do strojově čitelného textu. Spustili jsme tři OCR systémy (Tesseract, Ocrad a GOCR) na vytvořeném vícejazyčném datasetu a provedli statistickou a lingvistickou analýzu výsledků za účelem porovnání testovaných systémů a identifikování typických OCR chyb. 1
Measuring readability of technical texts
Kriukova, Anna ; Cinková, Silvie (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Title: Measuring readability of technical texts Author: Anna Kriukova Faculty of Mathematics and Physics: Institute of Formal and Applied Linguistics Supervisor: Mgr. Cinkov'a Silvie, Ph.D., Institute of Formal and Applied Lin- guistics Abstract: This research explores various approaches to measuring readability of technical texts. The data I work with is provided by Hyperskill, an online educa- tional platform dedicated mostly to Computer Science, where I did my internship. In the first part of my research, I examine classical readability formulas and try to find correlations between their values and the user statistics available for the texts. The results show that there are no high correlations, thus, the standard formulas are not suitable for the task. The second part of the research is dedi- cated to experiments with machine learning algorithms. Firstly, I use four sets of features to predict the average rating, completion time, and completion rate of a step. Then, I introduce a rule-based algorithm to split the texts into well- and poorly-written ones, which relies on students' comments. However, binary classification trained on this division shows low results and is not used in the final pipeline. The system suggested as the outcome of my work employs the user statistics' prediction for new texts and...
Pražský závislostní korpus jako cvičebnice jazyka českého
Kučera, Ondřej ; Vidová Hladká, Barbora (vedoucí práce) ; Panevová, Jarmila (oponent)
Pražský závislostní korpus (PDT) patří mezi nejvýznamnější jazykové korpusy na světě. Cílem této práce je představit softwarový systém, který nad daty PDT tvoří cvičebnici českého jazyka. Procvičování probíhá ve dvou oblastech: tvarosloví (určování slovních druhů a jejich morfologických kategorií) a větný rozbor (určování větných členů a závislostí mezi nimi). Vzhledem k odlišnostem mezi akademickými rozbory vět a rozbory tak, jak jsou vyučovány ve školách, však nelze data PDT použít zcela přímočaře. Mnoho vět je potřeba z dat úplně vyřadit, na ostatních je nutné provést množství transformací, které převedou původní reprezentaci do tvaru, na který jsou žáci zvyklí ze školy.
Určování syntaktické smysluplnosti českých vět
Kríž, Vincent ; Vidová Hladká, Barbora (vedoucí práce) ; Mírovský, Jiří (oponent)
Určovanie syntaktickej zmysluplnosti viet je zaujímavou a užitočnou úlohou v aplikáciách počítačového spracovania prirodzeného jazyka, napríklad v strojovom preklade, vyhľadávacích strojoch a v systémoch zodpovedania otázok. Teoretická lingvistika skúma prirodzený jazyk ako systém rovín. V našom projekte tento pohľad rešpektujeme a berieme do úvahy pri definovaní zmysluplnosti. Zmysluplnosť skúmame na základe morfologickej a syntaktickej roviny. V práci implementujeme znalostnú (pravidlovú) procedúru, ktorá o reťazci českých slov rozhodne, či je zmysluplný, alebo nie. Pred spustením procedúry bude reťazec slov analyzovaný externými modulmi, ktoré dodajú morfologické a syntaktické informácie o reťazci. Cieľovým jazykom je čeština.
Automatické kombinace rysů a šablon rysů
Dubovský, Jakub ; Novák, Václav (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Hľadanie užitočných kombinácií rysov a šablón rysov je netriviálna úloha. Kombinácie sú však hodnotným nástrojom pri zvyšovaní úspešnosti strojového učenia. V tejto práci je navrhovaný postup, ktorý by sám hľadal užitočné kombinácie kategoriálnych rysov a ich šablón. Proces hľadania bol zverený metódam simulovaného žíhania a upravenému genetickému algoritmu. Súčasťou je návrh funkcie, ktorá hodnotí kvalitu kategoriálnej šablóny. Kombinujú sa samostatne šablóny, rysy a tiež obe spoločne. Najlepšie zlepšenia nájdené navrhnutým postupom sú približne 0.1 percentného bodu. Pokusy prebiehali na dvoch datasetoch. Navrhnutý postup je teda potrebné testovať na ďalších dátach, aby sa overila všeobecná použiteľnosť. Pokusy však naznačujú, že by sa mohlo jednať o základ použiteľného algoritmu. Súčasťou práce je jednoduchá aplikácia, ktorá bola navrhnutá a používaná na vykonávanie experimentov.
Implementace hry Shannon switching game pro iOS
Macík, Miroslav ; Vidová Hladká, Barbora (vedoucí práce) ; Brom, Cyril (oponent)
Shannon switching game je logická hra pro dva hráče. Základem hry je graf s dvěmi označenými vrcholy. Cílem jednoho z hráčů je dané vrcholy spojit, cílem druhého hráče je mu v tom zabránit. Tuto hru vymyslel americký matematik Claude Shannon, nezávisle na něm také David Gale, jehož hra je známa pod názvu Bridg-It nebo Gale. iOS je operační systém vyvinutý společností Apple Inc. Systém je určený pro mobilní telefon iPhone, hudební přehrávač iPod a tablet iPad. Základem vývoje pro tento systém je programovací jazyk Objective-C a framework Cocoa Touch.
On the Possibility of ESP Data Use in Natural Language Processing
Knopp, Tomáš ; Vidová Hladká, Barbora (vedoucí práce) ; Pecina, Pavel (oponent)
Cílem této bakalářské práce je prozkoumat databázi popisků obrázků ze hry ESP z pohledu zpracování přirozeného jazyka. ESP hra je online hra, ve které lidští hráči konají užitečnou práci - obrázky popisují. Výstupem hry ESP je pak databáze obrázků a jejich popisků. Zajímá nás, zda by data nashromážděná v průběhu získávání popisků obrázků mohla být užitečná pro úkoly zpracování přirozeného jazyka. Konkrétně máme na mysli úkol automatického určování koreferencí, rozšíření lexikální databáze WordNet, zjišťování idiomů a zjišťování slovních spojení. V této bakalářské práci se zaměříme na první dva z nich, tedy na použití databáze pro automatické určování koreferencí a na prozkoumání jejího potenciálního přínosu lexikální databázi WordNet.
Hloubková automatická analýza angličtiny
Dušek, Ondřej ; Hajič, Jan (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Tato diplomová práce popisuje studii hloubkové, tj. sémantické analýzy angličtiny, zejména na základě teoretického popisu pomocí propozic a jejich argumentové struktury. Hlavním cílem práce je vytvořit systém pro automatickou klasi kaci sémantických vztahů mezi propozicemi a jejich argumenty - značkování sémantických rolí. Vyvinuli jsme prostředí pro paralelní zpracování experimentů, přičemž jsme integrovali existující nástroje pro strojové učení a implementovali jak již popsané, tak nové postupy. Prostudovali jsme známé přístupy k tomuto problému a navrhli několik vylepšení, jako např. nové rysy pro klasi kaci, oddělené řešení pro příslovečná určení nebo zvláštní zacházení s řídkými predikáty. Na základě tohoto výzkumu jsme zkonstruovali vlastní systém pro sémantickou analýzu, který sestává z modulů pro disambiguaci predikátů a klasi kaci argumentů. Práce je zakončena testem našeho systému na anglickém korpusu určeném pro soutěž CoNLL 2009 Shared Task.
Morfologická disambiguace češtiny pomocí Markovkých modelů
Dufková, Kateřina ; Podveský, Petr (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Ve své bakalářské práci jsem se rozhodla věnovat morfologické disambiguaci textu. Tato úloha má své opodstatnění především v oblasti překladu přirozených jazyků, kde slouží k předzpracování textu určeného k přeložení tak, aby z něj byly odstraněny nejednoznačnosti ve slovních druzích a dalších morfologických kategoriích, které by v dalších fázích překladu působily problémy anebo neúnosně zvyšovaly jeho časovou náročnost. Zvolila jsem statistický přístup k tomuto problému, který je v porovnání s dalšími možnými metodami rychlejší, univerzálnější a je schopen vždy jednoznačně určit kategorii slova. Svoji aplikaci KDTagger, kterou jsem vytvořila v rámci této bakalářské práce, jsem založila na teorii skrytých Markovských modelů. Mým cílem bylo vytvořit takový program, který by byl univerzální co do operačního systému i způsobu ovládání a umožňoval zároveň nastavení všech důležitých lingvistických parametrů pro odborníky i komfortní použití pro laiky. Součástí mé práce byla rozsáhlá testování vytvořené aplikace, které jsem prováděla na českých novinových textech z Pražského závislostního korpusu verze 2.0. Aplikace je ovšem bez sebemenší změny použitelná i na libovolný jiný přirozený jazyk. Powered by TCPDF (www.tcpdf.org)

Národní úložiště šedé literatury : Nalezeno 64 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.