Národní úložiště šedé literatury Nalezeno 21 záznamů.  začátekpředchozí12 - 21  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Comparison of approaches to text classification
Knížek, Jan ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
The focus of this thesis is short text classification. Short text is the prevailing form of text on e-commerce and review platforms, such as Yelp, Tripadvisor or Heureka. As the popularity of the online communication is increasing, it is becoming infeasible for users to filter information manually. It is therefore becoming more and more important to recog- nise the relevant information in text. Classification of reviews is especially challenging, because they have limited structure, use informal language, contain a high number of errors and rely heavily on context and common knowledge. One of the possible appli- cations of machine learning is to automatically filter data and show users only relevant pieces of information. We work with restaurant reviews from Yelp and aim to predict their usefulness. Most restaurants have relatively many reviews, yet only few are truly useful. Our objective is to compare machine learning methods for predicting usefulness. 1
An online collaborative platform for the development of empirical grammars
Garcia Sevilla, Antonio Fernando ; Rosen, Alexandr (vedoucí práce) ; Hana, Jiří (oponent)
Název: On-line platforma pro spolupráci na vývoji empirických gramatik Autor: Antonio Fernando Garcia Sevilla Katedra: Ústav formální a aplikované lingvistiky Vedoucí práce: Ing. Alexandr Rosen, Ph.D., Ústav formální a aplikované lingvistiky Ve světě moderní vědy jsou stále běžnější týmové projekty a jiné způsoby spolupráce většího počtu badatelů, tedy tzv. Big Science. Počítačová lingvistika v tom není výjimkou. Zejména vývoj rozsáhlých lingvistických zdrojů je úkol, pro který se nejlépe hodí kolaborativní přístupy. Tato práce se zabývá návrhem a implementací prostředí pro pěstování počítačové lingvistiky on-line. Tímto prostředím je softwarový nástroj, který umožňuje vyvíjet formální gramatiky a jiné zdroje pro počítačové zpracování přirozeného jazyka za účasti týmu spolupracovníků. Aplikace podporuje formalismus lingvistické teorie HPSG jako jedno z možných východisek pro tento způsob spolupráce.
Native Language Identification of L2 Speakers of Czech
Tydlitátová, Ludmila ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Cílem identifikace rodného jazyka je rozpoznat autorův rodný jazyk na základě jeho projevu ve druhém jazyce. Tímto druhým jazykem je v naprosté většině dosavadního výzkumu angličtina. V této bakalářské práci používáme 3 715 textů, které jsou napsány v češtině nerodilými mluvčími. Metodami strojového učení určujeme, zda autorův rodný jazyk patří mezi slovanské jazyky. Pomocí nejlepších modelů dosahujeme při klasifikaci úspěšnosti 78%. 1
Automatic assignment of diagnosis to medical reports
Lachata, Adrián ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Cieľom práce je preskúmať úspešnosť automatického priraďovania kódov diagnóz (ICD­10) lekárskym správam písaných v českom jazyku. Použili sme metódy strojového učenia a algoritmy na kategorizáciu textu ako sú Naive Bayes a Rozhodovacie stromy. Na samotnú klasifikáciu sme využili program WEKA. Na výber atribútov a predspracovanie dát sme vytvorili vlastný program. Hlavné schopnosti programu sú vybratie atribútov na základe IG alebo PMI, lematizácia textu a generovanie stopwords podľa IDF. Najviac sme skúmali diagnózu I10 ale výsledky boli spracované aj pre H660, J00, K30 a Z001. Ako zaujímavosť sme uviedli porovnanie automatického verzus manuálneho priradenia I10 priamo lekármi na vzorke 100 správ. Celkovo sme mali k dispozícií milión správ.
Implementace hry Shannon switching game pro iOS
Macík, Miroslav ; Vidová Hladká, Barbora (vedoucí práce) ; Hana, Jiří (oponent)
iOS je operační systém určený pro mobilní telefon iPhone, hudební přehrávač iPod a tablet iPad. Shannon switching game je logická grafová hra pro dva hráče. Hru vytvořil americký matematik Claude Shannon. Práce popisuje existující implementace této hry a implementaci pro systém iOS vytvořenou v rámci této práce. Tato implementace umožňuje hru proti virtuálnímu soupeři, hru dvou hráčů na jednom zařízení nebo na dvou zařízeních komunikujících přes internet. Součástí práce je i popis algoritmů pro volbu tahu virtuálního soupeře či způsob generování herních plánů.
Jazykové modelování pro němčinu
Tlustý, Marek ; Bojar, Ondřej (vedoucí práce) ; Hana, Jiří (oponent)
Práce se zabývá jazykovým modelováním pro němčinu. Soustředí se na specifika německé gramatiky, která činí běžným n-gramovým modelům problémy. Nejprve popisuje statistické metody jazykového modelování a vysvětluje problematické jevy němčiny. Následně navrhuje vlastní varianty n-gramových jazykových modelů s cílem tyto problémy zlepšit. Vlastní modely jsou trénovány jednak jako standardní n-gramové, a jednak také metodou maximální entropie s n-gramovými rysy. Oba typy jsou vždy porovnány z hlediska korelace ručně hodnocené plynulosti vět a automatického hodnocení - perplexity. Srovnány jsou zároveň výpočetní nároky. Dále je navrhnuta množina vlastních rysů reprezentující počet gramatických chyb vybraných jevů. Úspěšnost se ověřuje na schopnosti predikovat ručně hodnocenou plynulost. Využito je modelů maximální entropie a vlastních modelů klasifikujících jen na základě mediánů hodnot rysů vypočtených z trénovacích dat.
An HPSG-based Formal Grammar of a Core Fragment of Georgian Implemented in TRALE
Abzianidze, Lasha ; Rosen, Alexandr (vedoucí práce) ; Hana, Jiří (oponent)
Gruzínština se výrazně odlišuje od indoevropských jazyků. Vyznačuje se řadou jazykových jevů, které jsou obtížné pro lingvistickou teorii i počítačové zpracování. Navíc patří mezi jazyky, u kterých nelze plně využít existující zdroje, a není ani dostatečně prozkoumána z hlediska matematické lingvistiky. Cílem této práce je vytvořit formální gramatiku morfologie a syntaxe jádra gruzínštiny. Tato formální gramatika vychází z teorie HPSG, která je v současnosti jedním z nejúspěšnějších rámců pro formální popis jazyka. Gramatiku implementujeme v systému TRALE, který umožňuje věrné zachycení ručně psaných gramatik založených na HPSG. Tato práce je první aplikací teorie HPSG na gruzínštinu.
Semantic disambiguation using Distributional Semantics
Prodanovic, Srdjan ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Ve statistických modelů sémantiky jsou významy slov pouze na základě jejich distribuční vlastnosti.Základní zdroj je zde jeden slovník, který lze použít pro různé úkoly, kde se význam slov reprezentovány jako vektory v vektorového prostoru, a slovní podoby jako vzdálenosti mezi jejich vektorových osobnosti. Pomocí silných podobnosti, může vhodnost podmínek uvedených zejména v souvislosti se vypočítá a používá pro celou řadu úkolů, jeden z nich je slovo smysl Disambiguation. V této práci bylo vyšetřeno několik různých přístupů k modelům z vektorového prostoru a prováděny tak, aby k překročení vyhodnocení vlastního výkonu na Word Sense disambiguation úkolem Prague Dependency Treebank.
Automatické osvojení vzorů s minimální supervizí
Klíč, Radoslav ; Hana, Jiří (vedoucí práce) ; Hlaváčová, Jaroslava (oponent)
Diplomová práce popisuje algoritmus pro automatické osvojení vzorů s minimální supervizí, který vznikl rozšířením systému Paramor (Monson, 2009), fungujícího zcela bez supervize. Systém je modifikován, aby přijímal snadno dostupná data ve formě ohýbaných slov s označenou hranicí morfémů jako dodatečný vstup. Součástí práce je také knihovna pro hierarchické shlukování, která umožňuje kombinaci různých zdrojů informací. Přístup byl testován na češtině, slovinštině, němčině a katalánštině a vykázal zvýšenou F-míru v porovnáni se základním Paramorem.
Detekce podezřelých anotací
Václ, Jan ; Vidová Hladká, Barbora (vedoucí práce) ; Hana, Jiří (oponent)
Tato práce popisuje způsob kontroly morfologické anotace pomocí strojového učení a představuje implementaci tohoto přístupu - aplikaci MissTagger. Procedura kontroly zahrnuje jak detekci chyb, tak jejich opravu. Tento přístup je založen na zjednodušeném algoritmu strojového učení, který si jednotlivé trénovací případy (instance) ukládá přímo do paměti bez zobecňování. Za tyto instance jsou považovány morfologické značky jednotlivých slov a jako rysy těchto instancí je brán jejich větný kontext pevné délky. Konkrétní slova, jejichž morfologické značky tvoří tento kontext, se vybírají buď přímo podle lineární struktury věty, nebo na základě závislostního stromu její syntaktické analýzy. Do experimentů k vyhodnocení tohoto přístupu jsou zapojeny dva jazyky - čeština a angličtina.

Národní úložiště šedé literatury : Nalezeno 21 záznamů.   začátekpředchozí12 - 21  přejít na záznam:
Viz též: podobná jména autorů
1 HÁNA, Jiří
1 HÁNA, Jonatan
1 Hána, J.
9 Hána, Jan
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.