Národní úložiště šedé literatury Nalezeno 51 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Zpracování češtiny v Pythonu
Novotný, Zdeněk ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
V této práci jsou představeny některé způsoby zpracování českého jazyka. První část obsahuje obecný popis systému NLTK. Některé později zmíněné funkce byly inspirovány funkcemi ze systému NLTK. Jsou zde popsány funkce zabývající se časováním a skloňováním slov různých slovních druhů v českém jazyce. Další část je zaměřena na zpracování textu v českém jazyce, v němž dochází k vyhledávání a označení jednotlivých vět a jiných částí. Poslední část popisuje možnost aplikace transformačních pravidel na části textu. Výsledek po aplikaci pravidel lze zobrazit graficky.
Internetový robot plnící funkci kalendáře
Klos, Jakub ; Očenášek, Pavel (oponent) ; Smrčka, Aleš (vedoucí práce)
Tato bakalářská práce se zabývá vytvořením internetového robota, který funguje jako správce kalendáře událostí. Robot s uživatelem komunikuje pomocí podmnožiny přirozeného anglického jazyka. Uživatel se nemusí učit speciální syntaxi příkazů a používání robota-kalendáře je mu tak maximálně usnadněno, což je hlavním přínosem této práce. Tento způsob ovládání by měl pomoci zejména počítačově méně zdatným uživatelům, pro které by ovládání speciálními příkazy mohlo být překážkou. Pro komunikaci, která se odehrává formou instant messagingu, je využit protokol XMPP. Ke strojovému zpracování přirozeného jazyka bylo využito nástroje NLTK. Program robota byl kompletně vytvořen v programovacím jazyce Python. Práce se také zabývá dalšími možnostmi rozšiřování funkcionality robota.
Pro lidi srozumitelný jazyk temporální logiky
Žilka, Lukáš ; Letko, Zdeněk (oponent) ; Smrčka, Aleš (vedoucí práce)
Tato práce se zabývá automatickým překladem z přirozeného jazyka do temporální logiky. Existující výzkum na toto téma je shrnut a práce je na něm založena. Pro specifikaci temporálních vlastností, je vytvořen kontrolovaný jazyk, podmnožina anglického jazyka. Hlavním přínosem práce jsou algoritmy pro překlad mezi přirozeným jazykem a temporální logikou, založený na zpracovávání a prohledávání vzorů v gramatických závislostech Standfordského parseru angličtiny. Další směr vývoje je diskutován na konci.
Kontrola konzistence informací extrahovaných z textu
Stejskal, Jakub ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato práce je zaměřena na strojové techniky, které jsou využívány při zpracování přirozeného jazyka a extrakce informací z textu. Přibližuje obecné metody začínající zpracováním surového textu, až po extrakci vztahů ze zpracovaných jazykových konstrukcí a uvádí možnosti využití pro získaná relační data, které je možné vidět například u projektu DBpedia. Dalším milníkem této práce je návrh a realizace automatického systému pro extrakci informací o entitách, které nemají vlastní článek na anglické verzi Wikipedie. Práce představuje vytvořené algoritmy pro extrakci entit s vlastním jménem, ověření existence článků extrahovaných entit a nakonec samotnou extrakci informací o jednotlivých entitách, které lze využívat při kontrole konzistence informací. Na závěr je možné zhlédnout dosažené výsledky a návrhy dalšího vývoje vytvořeného systému.
Mendel University performance analysis through data mining
Panggam, Osunam
Tato práce se zabývá analýzou výkonnosti Mendelovy univerzity a souvislostí mezi hodnocením univerzity a zpravodajskými články a recenzemi. Cílem studie je analyzovat mediální pokrytí a revidovat data o univerzitách v průběhu let a jejich dopad na pověst a hodnocení univerzity. Metodologie výzkumu zahrnuje webové seškrabování zpravodajských článků a recenzí souvisejících s Mendelovou univerzitou a používání technik dolování dat a NLP k analýze jejich sentimentu a distribuce témat. Kromě toho budou kvalitativní data shromážděná z novinových článků a recenzí online studentů korelována s údaji o hodnocení univerzity za období minulého roku, aby bylo možné identifikovat jakékoli vzorce nebo vztahy. Závěry studie se pokusí najít vhled do vlivu mediálního pokrytí na hodnocení a pověst univerzity. Osvětlí také techniky dolování dat pro analýzu textových dat souvisejících s univerzitou na zajímavé vzory.
Binární klasifikace zákaznických incidentů pomocí metod NLP
Pokorný, Jiří
Tato bakalářská práce se zabývá vybudováním modelu umožňujícího binární klasifikaci zákaznických incidentů v rámci systému SAP. Klasifikace je provedena pro věty obsažené v incidentech, dle čehož je určena konečná kategorie incidentu. Využitý text je v anglickém jazyce. Za účelem porovnání tradičních a moderních přístupů pro textovou klasifikaci, a získání optimálního výsledku, je provedena série experimentů obnášející využití různých metod vyvážení datasetu, vektorové reprezentace a klasifikačních algoritmů. Výsledky jsou v konečné řadě zhodnoceny a je zformulováno doporučení s ohledem na další rozvoj, včetně uplatnění získaných znalostí v prostředí SAP.
Generating Code from Textual Description of Functionality
Šamánek, Jan ; Fajčík, Martin (oponent) ; Smrž, Pavel (vedoucí práce)
As machine learning and neural network models continue to grow, there is an increasing demand for GPU-accelerated resources and algorithms to support them. Large language models have the potential to assist with this task, as they are already used as coding assistants for popular programming languages. If these models could also learn less commonly used paradigms like CUDA, they could help develop and maintain the necessary systems. This thesis aims to explore the capabilities of modern language models for learning CUDA as a programming paradigm and creating a training corpus specifically for this purpose.
Text Analysis in Specialized Translation: Accuracy and Error Rate
Parobková, Alžbeta ; Marcoň, Petr (oponent) ; Dohnal, Přemysl (vedoucí práce)
The focus of the thesis is on researching and applying text analysis and machine translation methods to quality evaluation of machine translated technical texts. The experimental part uses these methods to implement error identification and classification algorithm. The error and grammar correction neural model was also applied. The comparison of error rate and accuracy of different language tools is presented via error typology and standardized translation evaluation metrics.
Sémantická analýza matričního záznamu
Kaňkovský, Adam ; Zbořil, František (oponent) ; Rozman, Jaroslav (vedoucí práce)
Cílem této práce je navrhnout a implementovat aplikaci pro sémantickou analýzu matričních záznamů, která bude mít na vstupu text získaný ze scanu matriky. Tyto záznamy zpracuje a výsledky vyexportuje do příslušných polí tabulky.
Automatic detection and attribution of quotes
Ustinova, Evgeniya ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
Quotations extraction and attribution are important practical tasks for the media, but most of the presented solutions are monolingual. In this work, I present a complex machine learning-based system for extraction and attribution of direct and indirect quo- tations, which is trained on English and tested on Czech and Russian data. Czech and Russian test datasets were manually annotated as part of this study. This system is com- pared against a rule-based baseline model. Baseline model demonstrates better precision in extraction of quotation elements, but low recall. The machine learning-based model is better overall in extracting separate elements of quotations and full quotations as well. 1

Národní úložiště šedé literatury : Nalezeno 51 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.