Národní úložiště šedé literatury Nalezeno 55 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Databáze XML pro správu slovníkových dat
Samia, Michel ; Dytrych, Jaroslav (oponent) ; Smrž, Pavel (vedoucí práce)
Práce se zabývá automatizací zpracování slovníkových dat, především těch ve formátech postavených na XML. Čtenář je nejprve seznámen s použitými pojmy lingvistiky a lexikografie, dále jsou představeny jednotlivé typy formátů lexikografických dat a konkrétní formáty a diskutovány jejich výhody a nevýhody. Z nich je vybrán na základě určitých kritérií formát LMF a pro něj navržena a realizována aplikace v Pythonu zaměřená především na inteligentní spojování více slovníků do jednoho. Tato aplikace byla poté, co prošla všemi jednotkovými testy, použita také pro zpracování LMF slovníků, které jsou uloženy na školním serveru výzkumné skupiny pro zpracování přirozeného jazyka. Na závěr jsou diskutovány výhody a nevýhody takto navržené a implementované aplikace a nastíněny možnosti dalšího použití a rozšiřování.
Metody extrakce informací
Adamček, Adam ; Smrž, Pavel (oponent) ; Kouřil, Jan (vedoucí práce)
Cílem procesu extrakce informací je získání relačních dat z textu psaného přirozeným jazykem na další jednodušší zpracování výpočetní technikou. Oblast využití takto získaných informací je široká - od sumarizace textů, přes vytváření ontologií až po zodpovídání otázek QA systémy. Tato práce popisuje návrh a implementaci systému fungujícího ve výpočetním clusteru, který transformuje výpis článků Wikipedie na množinu vyextrahovaných informací, které jsou následně uloženy do distribuované RDF databáze a je nad nimi možné sestavovat dotazy prostřednictvím vytvořeného uživatelského rozhraní.
Strojové učení pro odpovídání na otázky v přirozeném jazyce
Sasín, Jonáš ; Fajčík, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
Práce se zabývá odpovídáním na otázky v přirozeném jazyce nad českou Wikipedií. Systémy pro odpovídání na otázky získávají rostoucí popularitu, většina jich ale vzniká pro angličtinu. Cílem této práce je prozkoumat dostupné možnosti a datové sady a vytvořit takový systém pro češtinu. V práci jsem se zaměřil na dva přístupy. Jeden z nich využívá pro extrakci odpovědi anglický model ALBERT a strojový překlad pasáží. Druhý využívá vícejazyčný model BERT. V práci je provedeno porovnání několika variant systému. Diskutovány jsou také možnosti získávání relevantních pasáží. Pro všechny varianty testovaných systémů je provedeno vyhodnocení pomocí standardních metrik. Nejlepší varianta systému byla vyhodnocena na datové sadě SQAD v3.0 s úspěšností 0,44 EM a 0,55 F1 skóre, což je v porovnání s existujícími systémy vynikající výsledek. Hlavním přínosem této práce je analýza možností a nasazení laťky pro další vývoj lepších systémů pro češtinu. 
Chatbot pro Smart Cities
Jusko, Ján ; Herout, Adam (oponent) ; Zemčík, Pavel (vedoucí práce)
Cílem této práce je zjednodušit přístup k informacím občanům statutárního města Brno a zároveň modernizovat způsob komunikace mezi občanem a jeho městem. Zvolený problém práce řeší vytvořením konverzačního agenta - chatbota Kroka. S využitím umělé inteligence a analyzátoru českého jazyka je agent schopen porozumět určité množině textových dotazů v přirozeném jazyce a odpovídat na ně. Agent je dostupný na platformě Messenger a disponuje znalostní bází, která obsahuje data poskytnutá městem. Při provedení rozsáhlého uživatelského testování na celkovém počtu 76 občanů města se ukázalo, že až 97\% respondentům se líbí idea městského chatbota a vědí si představit, že ho budou pravidelně používat. Hlavním zjištěním této práce je, že široká veřejnost dokáže dobře přijmout a efektivně využívat chatbota a výsledky této práce motivují k dalšímu vývoji praktických aplikací konverzačních agentů.
Zpracování češtiny v Pythonu
Novotný, Zdeněk ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
V této práci jsou představeny některé způsoby zpracování českého jazyka. První část obsahuje obecný popis systému NLTK. Některé později zmíněné funkce byly inspirovány funkcemi ze systému NLTK. Jsou zde popsány funkce zabývající se časováním a skloňováním slov různých slovních druhů v českém jazyce. Další část je zaměřena na zpracování textu v českém jazyce, v němž dochází k vyhledávání a označení jednotlivých vět a jiných částí. Poslední část popisuje možnost aplikace transformačních pravidel na části textu. Výsledek po aplikaci pravidel lze zobrazit graficky.
Internetový robot plnící funkci kalendáře
Klos, Jakub ; Očenášek, Pavel (oponent) ; Smrčka, Aleš (vedoucí práce)
Tato bakalářská práce se zabývá vytvořením internetového robota, který funguje jako správce kalendáře událostí. Robot s uživatelem komunikuje pomocí podmnožiny přirozeného anglického jazyka. Uživatel se nemusí učit speciální syntaxi příkazů a používání robota-kalendáře je mu tak maximálně usnadněno, což je hlavním přínosem této práce. Tento způsob ovládání by měl pomoci zejména počítačově méně zdatným uživatelům, pro které by ovládání speciálními příkazy mohlo být překážkou. Pro komunikaci, která se odehrává formou instant messagingu, je využit protokol XMPP. Ke strojovému zpracování přirozeného jazyka bylo využito nástroje NLTK. Program robota byl kompletně vytvořen v programovacím jazyce Python. Práce se také zabývá dalšími možnostmi rozšiřování funkcionality robota.
Pro lidi srozumitelný jazyk temporální logiky
Žilka, Lukáš ; Letko, Zdeněk (oponent) ; Smrčka, Aleš (vedoucí práce)
Tato práce se zabývá automatickým překladem z přirozeného jazyka do temporální logiky. Existující výzkum na toto téma je shrnut a práce je na něm založena. Pro specifikaci temporálních vlastností, je vytvořen kontrolovaný jazyk, podmnožina anglického jazyka. Hlavním přínosem práce jsou algoritmy pro překlad mezi přirozeným jazykem a temporální logikou, založený na zpracovávání a prohledávání vzorů v gramatických závislostech Standfordského parseru angličtiny. Další směr vývoje je diskutován na konci.
Kontrola konzistence informací extrahovaných z textu
Stejskal, Jakub ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému.
Mendel University performance analysis through data mining
Panggam, Osunam
Tato práce se zabývá analýzou výkonnosti Mendelovy univerzity a souvislostí mezi hodnocením univerzity a zpravodajskými články a recenzemi. Cílem studie je analyzovat mediální pokrytí a revidovat data o univerzitách v průběhu let a jejich dopad na pověst a hodnocení univerzity. Metodologie výzkumu zahrnuje webové seškrabování zpravodajských článků a recenzí souvisejících s Mendelovou univerzitou a používání technik dolování dat a NLP k analýze jejich sentimentu a distribuce témat. Kromě toho budou kvalitativní data shromážděná z novinových článků a recenzí online studentů korelována s údaji o hodnocení univerzity za období minulého roku, aby bylo možné identifikovat jakékoli vzorce nebo vztahy. Závěry studie se pokusí najít vhled do vlivu mediálního pokrytí na hodnocení a pověst univerzity. Osvětlí také techniky dolování dat pro analýzu textových dat souvisejících s univerzitou na zajímavé vzory.
Binární klasifikace zákaznických incidentů pomocí metod NLP
Pokorný, Jiří
Tato bakalářská práce se zabývá vybudováním modelu umožňujícího binární klasifikaci zákaznických incidentů v rámci systému SAP. Klasifikace je provedena pro věty obsažené v incidentech, dle čehož je určena konečná kategorie incidentu. Využitý text je v anglickém jazyce. Za účelem porovnání tradičních a moderních přístupů pro textovou klasifikaci, a získání optimálního výsledku, je provedena série experimentů obnášející využití různých metod vyvážení datasetu, vektorové reprezentace a klasifikačních algoritmů. Výsledky jsou v konečné řadě zhodnoceny a je zformulováno doporučení s ohledem na další rozvoj, včetně uplatnění získaných znalostí v prostředí SAP.

Národní úložiště šedé literatury : Nalezeno 55 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.