Národní úložiště šedé literatury Nalezeno 149 záznamů.  začátekpředchozí21 - 30dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Syntaktický analyzátor pro český jazyk
Beneš, Vojtěch ; Otrusina, Lubomír (oponent) ; Kouřil, Jan (vedoucí práce)
Diplomová práce popisuje teoretický návrh a vytvoření syntaktického analyzátoru pro český jazyk pracujícího s frázovým přístupem ke stavbě věty. Využívaná frázová syntaxe je založena na slovních druzích, které jsou sdružovány do větších slovních celků - frází. Implementovaný program pracuje s manuálně sestaveným anotovaným vzorkem dat (korpusem češtiny), na základě kterého za běhu vytvoří pravděpodobnostní bezkontextovou gramatiku (strojové učení). Syntaktický analyzátor, jehož jádrem je rozšířený CKY algoritmus, poté pro zadanou českou větu rozhodne, zda-li patří do jazyka generovaného vytvořenou gramatikou, a v kladném případě vrátí nejpravděpodobnější derivační strom této věty. Tento výsledek je následně porovnán s očekávaným řešením, čímž je vyhodnocena úspěšnost syntaktické analýzy.
Zjednoznačňování slovních významů
Kraus, Michal ; Glembek, Ondřej (oponent) ; Smrž, Pavel (vedoucí práce)
Diplomová práce je zaměřena na rozpoznávání a zjednoznačňování českých slov.  Nejprve se čtenář seznámí s historickým kontextem úkolu, poté jsou mu předvedeny použité algoritmy: naivní Bayesův klasifikátor, klasifikátor AdaBoost, metoda maximální entropie a rozhodovací strom. Použité metody jsou názorně předvedeny na příkladu. V dalších částech práce jsou popsány datové sady a parametry pro klasifikaci. V závěrečné části práce dojde na zhodnocení výsledků a nastínění možných úprav.
Data mining
Mrázek, Michal ; Sehnalová, Pavla (oponent) ; Bednář, Josef (vedoucí práce)
Tato diplomová práce se zabývá analýzou vícerozměrných dat. Jsou zavedeny tři algoritmy pro snižování dimenze dat. Pomocí metod zpracování přirozeného jazyka je ukázáno, jak manipulovat s textovými dokumenty. V praktické části je cílem zpracovat reálná data z internetového fóra. Nejprve soubor diskuzních příspěvků převedeme na numerickou reprezentaci, provedeme transformaci do dvourozměrného prostoru a vizualizujeme. Dále najdeme tématické okruhy příspěvků. V závěru porovnáme několik vybraných algoritmů na redukci dimenze.
Similarity Search in Document Collections
Jordanov, Dimitar Dimitrov ; Plchot, Oldřich (oponent) ; Smrž, Pavel (vedoucí práce)
The main objective of this work is to estimate the efficiency of the available software for similarity search in document collections and on two in particular, Semantic Vectors and Lecene's class MoreLikeThis. The paper provides a comparison of those two approaches and introduces methods that can lead to improving the quality of the results generated by a search.
Vytvoření znalostní báze entit z české Wikipedie
Sychra, Martin ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je navrhnout a implementovat systém pro automatickou extrakci pojmenovaných entit z textů české Wikipedie, vytvořit znalostní báze těchto entit a vyhodnotit úspěšnost a výsledky vytvořeného systému. První část práce vysvětluje základní pojmy z této oblasti zpracování přirozeného jazyka a informuje o existujících systémech podobného charakteru. V ústřední části je popsán vlastní návrh několika metod extrakce a způsobu implementace těchto metod. K extrakci byly vybrány tyto entitní typy: osoby, místa, události a organizace. V závěru jsou popsány výsledky práce, tedy úspěšnost jednolitých metod u daného entitního typu a statistiky extrakce jednotlivých entit vztažené k celkovému složení české Wikipedie.
Pragmatic aspects of communication with chatbots
Kopecký, Michal ; Krhutová, Milena (oponent) ; Haupt, Jaromír (vedoucí práce)
Chatbots, programs able to communicate with a human, are becoming more and more popular in recent years. But because the artificial intelligence is a very complex scientific branch, it is difficult to create a human-like conversational robot. This paper will provide a brief introduction into the chatbot theory, where and how they are used, and Natural Language Processing technology. Several chatbots will be briefly described and exemplary conversations with them will be shown. The main attention will be paid to the pragmatic issues of conversation with a chatbot, such as observing the Conversational Maxims and Cooperation Principle. The findings will be demonstrated using analyses of dialogues with chatbots in the second part of the thesis.
Aplikace pro analýzu dat z Twitteru
Rýdl, Pavel ; Komosný, Dan (oponent) ; Galáž, Zoltán (vedoucí práce)
Tato práce se zabývá vytvořením aplikace pro automatické stahování a analýzu dat z Twitteru založené na technikách zpracování přirozeného jazyka. Aplikace je vytvořena v programovacím jazyku Python. Pro tvorbu aplikace bylo použito vývojové prostředí Jupyter Notebook, ve kterém byla celá aplikace včetně GUI implementována. V části teorie je popsána problematika stahování dat a analýza pomocí zpracování přirozeného jazyka. V části implementace je popsáno řešení aplikace v jednotlivých krocích jako jsou vytvoření aplikace na straně Twitteru, stahování, předpříprava, analýza dat s technikami zracování přirozeného jazyka a následná vizualizace. Implementována byla i analýza bez použití technik zpracování přirozeného jazyka. Testování probíhalo na tweetech, které obsahovali zmínku o americkém prezidentu Donaldovi Trumpovi.
Databáze XML pro správu slovníkových dat
Samia, Michel ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Práce se zabývá automatizací zpracování slovníkových dat, především těch ve formátech postavených na XML. Čtenář je nejprve seznámen s použitými pojmy lingvistiky a lexikografie, dále jsou představeny jednotlivé typy formátů lexikografických dat a konkrétní formáty a diskutovány jejich výhody a nevýhody. Z nich je vybrán na základě určitých kritérií formát LMF a pro něj navržena a realizována aplikace v Pythonu zaměřená především na inteligentní spojování více slovníků do jednoho. Tato aplikace byla poté, co prošla všemi jednotkovými testy, použita také pro zpracování LMF slovníků, které jsou uloženy na školním serveru výzkumné skupiny pro zpracování přirozeného jazyka. Na závěr jsou diskutovány výhody a nevýhody takto navržené a implementované aplikace a nastíněny možnosti dalšího použití a rozšiřování.
Knihovna pro podporu vývoje systému ReReSearch
Heller, Stanislav ; Otrusina, Lubomír (oponent) ; Šperka, Svatopluk (vedoucí práce)
Vývoj systému ReReSearch je značně zpomalen vzájemnou nekompatibilitou jednotlivých modulů z hlediska programových prostředků, faktem, že vývojáři často opakují již známé chyby a v neposlední řadě slabou komunikací vývojářů mezi sebou. Pro řešení uvedených problémů bylo zapotřebí vytvořit prvek, který by implementoval časté úkony a procesy, sjednotil některá rozhraní v systému a poskytl prostředky pro řešení problémů na vyšší úrovni abstrakce. Výsledkem této snahy je knihovna rrslib, která by měla sloužit všem, kteří se věnují vývoji systému ReReSearch: práci s jeho databází, extrakci, zpracování, analýze a indexaci dat z webu a z lokálních dokumentů nebo jiným částem systému ReReSearch. Používáním knihovny by mělo být docíleno konzistentnějšího, rychlejšího a méně chybového vývoje systému ReReSearch.
Analýza postojů českých a slovenských uživatelů na základě dat ze sociálních sítí a webových diskusí
Sojka, Matěj ; Dočekal, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
Díky digitalizaci se šíření názorů v populaci za poslední dobu razantně zrychlilo, nicméně potřeba jim porozumět se nezměnila. Cílem této práce je vytvořit systém pro automatické stahování dat ze sociálních sítí a webových diskuzí a analyzování názorů v českém a slovenském jazyce. Systém disponuje webovým rozhraním pro vizualizaci výsledků a konfiguraci analýzy dat. Systém umí uživateli nabídnout témata, která se podle něj v datech vyskytují, a klasifikovat příspěvky podle uživatelem definovaných názorů.

Národní úložiště šedé literatury : Nalezeno 149 záznamů.   začátekpředchozí21 - 30dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.