Národní úložiště šedé literatury Nalezeno 142 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Word2vec modely s přidanou kontextovou informací
Šůstek, Martin ; Rozman, Jaroslav (oponent) ; Zbořil, František (vedoucí práce)
Tato práce se zabývá porozuměním word2vec modelů. Přestože tyto modely vznikly nedávno (2013), staly se velmi populárními. Učením těchto modelů lze obdržet vektorovou reprezentaci slov v~N-dimenzionálním prostoru reálných čísel. Pomocí operací nad těmito vektory je možné určit sémantické vazby mezi slovy. Dále se práce snaží o rozšíření představených modelů za účelem jiné reprezentace slov. K tomuto účelu je navrženo využití obrazové informace. Taktéž je diskutována možnost použití konvolučních neuronových sítí ve spojitosti s poskytnutím odlišné kontextové informace.
Extrakce informací z biomedicínských textů
Knoth, Petr ; Burget, Radek (oponent) ; Smrž, Pavel (vedoucí práce)
V poslední době bylo vynaloženo velké úsilí k tomu, aby byly biomedicínské znalosti, typicky uložené v podobě vědeckých článků, snadněji přístupné a bylo možné je efektivně sdílet. Ve skutečnosti ale nestrukturovaná podstata těchto textů způsobuje velké obtíže při použití technik pro získávání a vyvozování znalostí. Anotování entit nesoucích jistou sémantickou informaci v textu je prvním krokem k vytvoření znalosti analyzovatelné počítačem. V této práci nejdříve studujeme metody pro automatickou extrakci informací z textů přirozeného jazyka. Dále zhodnotíme hlavní výhody a nevýhody současných systémů pro extrakci informací a na základě těchto znalostí se rozhodneme přijmout přístup strojového učení pro automatické získávání exktrakčních vzorů při našich experimentech. Bohužel, techniky strojového učení často vyžadují obrovské množství trénovacích dat, která může být velmi pracné získat. Abychom dokázali čelit tomuto nepříjemnému problému, prozkoumáme koncept tzv. bootstrapping techniky. Nakonec ukážeme, že během našich experimentů metody strojového učení pracovaly dostatečně dobře a dokonce podstatně lépe než základní metody. Navíc v úloze využívající techniky bootstrapping se podařilo významně snížit množství dat potřebných pro trénování extrakčního systému.
Komunikační agent pro informace o Brně
Křištof, Jiří ; Fajčík, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je implementace komunikačního agenta poskytující informace o Brně. Komunikační agent využívá třívrstvé architektury. Pro vlastní odpovídání na otázky jsou použity techniky strojového učení a neuronových sítí. Na základě provedeného testu bylo se systémem spokojeno 58 % respondentů, s přesností odpovědí poté 84 % uživatelů. Přínosem této práce je usnadnění získávání informací o Brně jeho obyvatelům i návštěvníkům.
Syntaktický analyzátor pro český jazyk
Beneš, Vojtěch ; Otrusina, Lubomír (oponent) ; Kouřil, Jan (vedoucí práce)
Diplomová práce popisuje teoretický návrh a vytvoření syntaktického analyzátoru pro český jazyk pracujícího s frázovým přístupem ke stavbě věty. Využívaná frázová syntaxe je založena na slovních druzích, které jsou sdružovány do větších slovních celků - frází. Implementovaný program pracuje s manuálně sestaveným anotovaným vzorkem dat (korpusem češtiny), na základě kterého za běhu vytvoří pravděpodobnostní bezkontextovou gramatiku (strojové učení). Syntaktický analyzátor, jehož jádrem je rozšířený CKY algoritmus, poté pro zadanou českou větu rozhodne, zda-li patří do jazyka generovaného vytvořenou gramatikou, a v kladném případě vrátí nejpravděpodobnější derivační strom této věty. Tento výsledek je následně porovnán s očekávaným řešením, čímž je vyhodnocena úspěšnost syntaktické analýzy.
Zjednoznačňování slovních významů
Kraus, Michal ; Glembek, Ondřej (oponent) ; Smrž, Pavel (vedoucí práce)
Diplomová práce je zaměřena na rozpoznávání a zjednoznačňování českých slov.  Nejprve se čtenář seznámí s historickým kontextem úkolu, poté jsou mu předvedeny použité algoritmy: naivní Bayesův klasifikátor, klasifikátor AdaBoost, metoda maximální entropie a rozhodovací strom. Použité metody jsou názorně předvedeny na příkladu. V dalších částech práce jsou popsány datové sady a parametry pro klasifikaci. V závěrečné části práce dojde na zhodnocení výsledků a nastínění možných úprav.
Data mining
Mrázek, Michal ; Sehnalová, Pavla (oponent) ; Bednář, Josef (vedoucí práce)
Tato diplomová práce se zabývá analýzou vícerozměrných dat. Jsou zavedeny tři algoritmy pro snižování dimenze dat. Pomocí metod zpracování přirozeného jazyka je ukázáno, jak manipulovat s textovými dokumenty. V praktické části je cílem zpracovat reálná data z internetového fóra. Nejprve soubor diskuzních příspěvků převedeme na numerickou reprezentaci, provedeme transformaci do dvourozměrného prostoru a vizualizujeme. Dále najdeme tématické okruhy příspěvků. V závěru porovnáme několik vybraných algoritmů na redukci dimenze.
Similarity Search in Document Collections
Jordanov, Dimitar Dimitrov ; Plchot, Oldřich (oponent) ; Smrž, Pavel (vedoucí práce)
The main objective of this work is to estimate the efficiency of the available software for similarity search in document collections and on two in particular, Semantic Vectors and Lecene's class MoreLikeThis. The paper provides a comparison of those two approaches and introduces methods that can lead to improving the quality of the results generated by a search.
Vytvoření znalostní báze entit z české Wikipedie
Sychra, Martin ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je navrhnout a implementovat systém pro automatickou extrakci pojmenovaných entit z textů české Wikipedie, vytvořit znalostní báze těchto entit a vyhodnotit úspěšnost a výsledky vytvořeného systému. První část práce vysvětluje základní pojmy z této oblasti zpracování přirozeného jazyka a informuje o existujících systémech podobného charakteru. V ústřední části je popsán vlastní návrh několika metod extrakce a způsobu implementace těchto metod. K extrakci byly vybrány tyto entitní typy: osoby, místa, události a organizace. V závěru jsou popsány výsledky práce, tedy úspěšnost jednolitých metod u daného entitního typu a statistiky extrakce jednotlivých entit vztažené k celkovému složení české Wikipedie.
Pragmatic aspects of communication with chatbots
Kopecký, Michal ; Krhutová, Milena (oponent) ; Haupt, Jaromír (vedoucí práce)
Chatbots, programs able to communicate with a human, are becoming more and more popular in recent years. But because the artificial intelligence is a very complex scientific branch, it is difficult to create a human-like conversational robot. This paper will provide a brief introduction into the chatbot theory, where and how they are used, and Natural Language Processing technology. Several chatbots will be briefly described and exemplary conversations with them will be shown. The main attention will be paid to the pragmatic issues of conversation with a chatbot, such as observing the Conversational Maxims and Cooperation Principle. The findings will be demonstrated using analyses of dialogues with chatbots in the second part of the thesis.
Aplikace pro analýzu dat z Twitteru
Rýdl, Pavel ; Komosný, Dan (oponent) ; Galáž, Zoltán (vedoucí práce)
Tato práce se zabývá vytvořením aplikace pro automatické stahování a analýzu dat z Twitteru založené na technikách zpracování přirozeného jazyka. Aplikace je vytvořena v programovacím jazyku Python. Pro tvorbu aplikace bylo použito vývojové prostředí Jupyter Notebook, ve kterém byla celá aplikace včetně GUI implementována. V části teorie je popsána problematika stahování dat a analýza pomocí zpracování přirozeného jazyka. V části implementace je popsáno řešení aplikace v jednotlivých krocích jako jsou vytvoření aplikace na straně Twitteru, stahování, předpříprava, analýza dat s technikami zracování přirozeného jazyka a následná vizualizace. Implementována byla i analýza bez použití technik zpracování přirozeného jazyka. Testování probíhalo na tweetech, které obsahovali zmínku o americkém prezidentu Donaldovi Trumpovi.

Národní úložiště šedé literatury : Nalezeno 142 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.