Národní úložiště šedé literatury Nalezeno 21 záznamů.  předchozí11 - 20další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Morphological Segmentation in Czech using Word-Formation Network
Bodnár, Jan ; Žabokrtský, Zdeněk (vedoucí práce) ; Hana, Jiří (oponent)
Morfologická segmentace se zabývá dělením slov na morfémy - nejmenší jednotky nesoucí význam. Jedná se o nízkoúrovňový problém z oblasti zpracování přirozeného jazyka. Jelikož se morfologická segmentace někdy používá jako metoda předzpracování dat, její zlepšení může pomoci algoritmům řešícím nejrůznější problémy z oblasti NLP, zejména, pokud v situaci, kdy je nedostatek dat. Zlepšení morfologické segmentace může také pomoci lingvistickému výzkumu, využívajícímu korpusy. V této práci navrhujeme nový ensemble algoritmus pro morfologickou segmentaci Českých lemmat, který používá derivační stromy z datasetu DeriNet. Zároveň vytváříme návrhy na zlepšení tohoto datasetu.
Comparison of approaches to text classification
Knížek, Jan ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
The focus of this thesis is short text classification. Short text is the prevailing form of text on e-commerce and review platforms, such as Yelp, Tripadvisor or Heureka. As the popularity of the online communication is increasing, it is becoming infeasible for users to filter information manually. It is therefore becoming more and more important to recog- nise the relevant information in text. Classification of reviews is especially challenging, because they have limited structure, use informal language, contain a high number of errors and rely heavily on context and common knowledge. One of the possible appli- cations of machine learning is to automatically filter data and show users only relevant pieces of information. We work with restaurant reviews from Yelp and aim to predict their usefulness. Most restaurants have relatively many reviews, yet only few are truly useful. Our objective is to compare machine learning methods for predicting usefulness. 1
An online collaborative platform for the development of empirical grammars
Garcia Sevilla, Antonio Fernando ; Rosen, Alexandr (vedoucí práce) ; Hana, Jiří (oponent)
Název: On-line platforma pro spolupráci na vývoji empirických gramatik Autor: Antonio Fernando Garcia Sevilla Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Alexandr Rosen, Ph.D., Ústav formální a aplikované lingvistiky Ve světě moderní vědy jsou stále běžnější týmové projekty a jiné způsoby spolupráce většího počtu badatelů, tedy tzv. Big Science. Počítačová lingvistika v tom není výjimkou. Zejména vývoj rozsáhlých lingvistických zdrojů je úkol, pro který se nejlépe hodí kolaborativní přístupy. Tato práce se zabývá návrhem a implementací prostředí pro pěstování počítačové lingvistiky on-line. Tímto prostředím je softwarový nástroj, který umožňuje vyvíjet formální gramatiky a jiné zdroje pro počítačové zpracování přirozeného jazyka za účasti týmu spolupracovníků. Aplikace podporuje formalismus lingvistické teorie HPSG jako jedno z možných východisek pro tento způsob spolupráce.
Native Language Identification of L2 Speakers of Czech
Tydlitátová, Ludmila ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Cílem identifikace rodného jazyka je rozpoznat autorův rodný jazyk na základě jeho projevu ve druhém jazyce. Tímto druhým jazykem je v naprosté většině dosavadního výzkumu angličtina. V této bakalářské práci používáme 3 715 textů, které jsou napsány v češtině nerodilými mluvčími. Metodami strojového učení určujeme, zda autorův rodný jazyk patří mezi slovanské jazyky. Pomocí nejlepších modelů dosahujeme při klasifikaci úspěšnosti 78%. 1
Automatic assignment of diagnosis to medical reports
Lachata, Adrián ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Cieľom práce je preskúmať úspešnosť automatického priraďovania kódov diagnóz (ICD­10) lekárskym správam písaných v českom jazyku. Použili sme metódy strojového učenia a algoritmy na kategorizáciu textu ako sú Naive Bayes a Rozhodovacie stromy. Na samotnú klasifikáciu sme využili program WEKA. Na výber atribútov a predspracovanie dát sme vytvorili vlastný program. Hlavné schopnosti programu sú vybratie atribútov na základe IG alebo PMI, lematizácia textu a generovanie stopwords podľa IDF. Najviac sme skúmali diagnózu I10 ale výsledky boli spracované aj pre H660, J00, K30 a Z001. Ako zaujímavosť sme uviedli porovnanie automatického verzus manuálneho priradenia I10 priamo lekármi na vzorke 100 správ. Celkovo sme mali k dispozícií milión správ.
Implementace hry Shannon switching game pro iOS
Macík, Miroslav ; Vidová Hladká, Barbora (vedoucí práce) ; Hana, Jiří (oponent)
iOS je operační systém určený pro mobilní telefon iPhone, hudební přehrávač iPod a tablet iPad. Shannon switching game je logická grafová hra pro dva hráče. Hru vytvořil americký matematik Claude Shannon. Práce popisuje existující implementace této hry a implementaci pro systém iOS vytvořenou v rámci této práce. Tato implementace umožňuje hru proti virtuálnímu soupeři, hru dvou hráčů na jednom zařízení nebo na dvou zařízeních komunikujících přes internet. Součástí práce je i popis algoritmů pro volbu tahu virtuálního soupeře či způsob generování herních plánů.
Jazykové modelování pro němčinu
Tlustý, Marek ; Bojar, Ondřej (vedoucí práce) ; Hana, Jiří (oponent)
Práce se zabývá jazykovým modelováním pro němčinu. Soustředí se na specifika německé gramatiky, která činí běžným n-gramovým modelům problémy. Nejprve popisuje statistické metody jazykového modelování a vysvětluje problematické jevy němčiny. Následně navrhuje vlastní varianty n-gramových jazykových modelů s cílem tyto problémy zlepšit. Vlastní modely jsou trénovány jednak jako standardní n-gramové, a jednak také metodou maximální entropie s n-gramovými rysy. Oba typy jsou vždy porovnány z hlediska korelace ručně hodnocené plynulosti vět a automatického hodnocení - perplexity. Srovnány jsou zároveň výpočetní nároky. Dále je navrhnuta množina vlastních rysů reprezentující počet gramatických chyb vybraných jevů. Úspěšnost se ověřuje na schopnosti predikovat ručně hodnocenou plynulost. Využito je modelů maximální entropie a vlastních modelů klasifikujících jen na základě mediánů hodnot rysů vypočtených z trénovacích dat.
An HPSG-based Formal Grammar of a Core Fragment of Georgian Implemented in TRALE
Abzianidze, Lasha ; Rosen, Alexandr (vedoucí práce) ; Hana, Jiří (oponent)
Gruzínština se výrazně odlišuje od indoevropských jazyků. Vyznačuje se řadou jazykových jevů, které jsou obtížné pro lingvistickou teorii i počítačové zpracování. Navíc patří mezi jazyky, u kterých nelze plně využít existující zdroje, a není ani dostatečně prozkoumána z hlediska matematické lingvistiky. Cílem této práce je vytvořit formální gramatiku morfologie a syntaxe jádra gruzínštiny. Tato formální gramatika vychází z teorie HPSG, která je v současnosti jedním z nejúspěšnějších rámců pro formální popis jazyka. Gramatiku implementujeme v systému TRALE, který umožňuje věrné zachycení ručně psaných gramatik založených na HPSG. Tato práce je první aplikací teorie HPSG na gruzínštinu.
Semantic disambiguation using Distributional Semantics
Prodanovic, Srdjan ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Ve statistických modelů sémantiky jsou významy slov pouze na základě jejich distribuční vlastnosti.Základní zdroj je zde jeden slovník, který lze použít pro různé úkoly, kde se význam slov reprezentovány jako vektory v vektorového prostoru, a slovní podoby jako vzdálenosti mezi jejich vektorových osobnosti. Pomocí silných podobnosti, může vhodnost podmínek uvedených zejména v souvislosti se vypočítá a používá pro celou řadu úkolů, jeden z nich je slovo smysl Disambiguation. V této práci bylo vyšetřeno několik různých přístupů k modelům z vektorového prostoru a prováděny tak, aby k překročení vyhodnocení vlastního výkonu na Word Sense disambiguation úkolem Prague Dependency Treebank.
Automatické osvojení vzorů s minimální supervizí
Klíč, Radoslav ; Hana, Jiří (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Diplomová práce popisuje algoritmus pro automatické osvojení vzorů s minimální supervizí, který vznikl rozšířením systému Paramor (Monson, 2009), fungujícího zcela bez supervize. Systém je modifikován, aby přijímal snadno dostupná data ve formě ohýbaných slov s označenou hranicí morfémů jako dodatečný vstup. Součástí práce je také knihovna pro hierarchické shlukování, která umožňuje kombinaci různých zdrojů informací. Přístup byl testován na češtině, slovinštině, němčině a katalánštině a vykázal zvýšenou F-míru v porovnáni se základním Paramorem.

Národní úložiště šedé literatury : Nalezeno 21 záznamů.   předchozí11 - 20další  přejít na záznam:
Viz též: podobná jména autorů
1 HÁNA, Jiří
1 HÁNA, Jonatan
1 Hána, J.
9 Hána, Jan
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.