Národní úložiště šedé literatury Nalezeno 23 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Automatizovaná detekce ofenzivního jazyka a nenávistných projevů v přirozeném jazyce
Štajerová, Alžbeta ; Žmolíková, Kateřina (oponent) ; Fajčík, Martin (vedoucí práce)
Táto práca sa zaoberá fenoménom nenávistných prejavov a ofenzívneho jazyka, ich definíciami a detekciou. Popisuje metódy doterajšieho riešenia detekcie. Zhodnocuje dostupné dátové sady využiteľné pri trénovaní modelov zameraných na detekciu tohto fenoménu. Dáva si za cieľ uviesť ďalšie metódy riešenia detekcie tohto problému a porovnanie ich výsledkov a vyhodnotenie úspešnosti. Zvolený problém bol riešený piatimi modelmi. Dva z nich boli zamerané na extrakciu príznakov a ich následnú klasifikáciu. Ďalšie tri boli riešené pomocou neurónových sietí. Úspešnosť implementovaných modelov som experimentálne vyhodnotila. Výsledky tejto práce umožňujú porovnanie typických prístupov s metódami využívajúcimi najnovšie poznatky z oblasti strojového učenia použitých pre klasifikáciu nenávistného a ofenzívneho jazyka.
Deep Neural Networks Used for Customer Support Cases Analysis
Marušic, Marek ; Ryšavý, Ondřej (oponent) ; Pluskal, Jan (vedoucí práce)
Artificial intelligence is remarkably popular these days. It can be used to resolve various highly complex tasks in fields such as image processing, sound processing, natural language processing, etc. Red Hat has an extensive database of resolved support cases. Therefore an idea was proposed to use these data for data mining and information retrieval in order to ease a resolution process of the support cases. In this work, various deep neural network models were created for prediction of features which could help during the resolution process. Techniques and models used in this work are described as well as their performance in the specific tasks. Comparison of individual models is outlined as well.
Určení základního tvaru slova
Šanda, Pavel ; Burget, Radim (oponent) ; Karásek, Jan (vedoucí práce)
Lemmatizace je důležitou procedurou před dolováním v textu v mnoha aplikacích. Proces lemmatizace je podobný procesu stemmingu, s tím rozdílem, že neurčuje pouze kořen slova, ale snaží se slovo převést pomocí metod Brute Force a Suffix Stripping do jeho základního tvaru. Hlavním cílem této práce je prezentovat metody pro vylepšení algoritmů lemmatizace českého jazyka. Obsahem je vytvoření trénovací množiny dat, kterou lze libovolně použít pro studentské i vědecké práce zabývající se podobnou problematikou.
Detektor plagiátů textových dokumentů
Kořínek, Lukáš ; Horák, Karel (oponent) ; Petyovský, Petr (vedoucí práce)
Diplomová práce se zabývá rešerší metod detekce plagiátů v textových dokumentech a následným návrhem a implementací nového detektoru plagiátů, jehož primárním účelem je odhalování plagiátů v akademických pracích VUT v Brně. Vytvořené řešení aplikuje vícekrokové algoritmy předzpracování na cílové dokumenty, jejichž zpracovaná data jsou následně uložena do vlastního korpusu (báze dokumentů). Úloha hledání shod (možných plagiátů) porovnává vybraný dokument vůči zbytku korpusu, přičemž využívá paralelních výpočtů na grafické kartě. Cílem je dosáhnout co nejrychlejšího srovnání při zachování přijatelné kvality výstupu.
Webová aplikace pro intuitivní sestavení filtrů textu
Sadílek, Jakub ; Kolář, Martin (oponent) ; Herout, Adam (vedoucí práce)
Cílem této práce je poskytnout intuitivní a snadno použitelný nástroj pro pokročilou filtraci textu s možností jednoduchého prototypování a ladění, bez nutnosti znát techniky programování. Základním principem je volba textových nástrojů a jejich řazení do řady tzv. pipeline, což je typické pro shell, ze kterého aplikace čerpá inspiraci. Nástroje také lze dodatečně editovat či zaměňovat. Aplikace míří zejména na uživatele neznající tento princip nebo programátory, pro které je časově výhodné si nechat text takto upravit a následně si vygenerovat ekvivalentní shell výraz. Další způsob ladění je realizován pomocí tzv. breakpointů, přes které se lze snadno a rychle zaměřit na vybrané řádky textu. Aplikace tak nabízí běh ve dvou režimech, mezi kterými lze libovolně přepínat podle potřeb uživatele.
Klasifikační framework
Koroncziová, Dominika ; Otrusina, Lubomír (oponent) ; Kouřil, Jan (vedoucí práce)
Cílem této práce je návrh a implementace klasifikačního software postaveného na knihovně RapidMiner. Výsledná aplikace bude sdružovat nejpoužívanější algoritmy a procesy implementované v RapidMineru do jednoduchého použitelného programu. Součástí nároků na aplikaci je jednoduché rozhraní pro ovládání z příkazové řádky, stejně jako grafické rozhraní zjednodušující nastavení více parametrů. Aplikace má také umožňovat tvorbu samostatných jednoúčelových programů, sloužících na opakovanou klasifikaci s použitím předem natrénovaného modelu. Nad rámec původního zadání je implementována i práce s textovými daty z Wikipedie, jejich stáhnutí a předzpracování a následné použití jako trénovacích dat. Text práce se zabývá postupně jednotlivými algoritmy a popisem kvalifikačních algoritmů, jejich vlastnostmi a použitím, a popisuje návrh a implementaci systému. V rámci práce byla vykonána i sada několika testů pro ověření výkonu a funkcionality aplikace. Jejich výsledky jsou shrnuty v závěru práce.
Rozpoznávání emocí z textu pomocí umělé inteligence
Vylíčil, Radek ; Karásek, Jan (oponent) ; Mašek, Jan (vedoucí práce)
Tato práce se zabývá rozpoznáváním emocí z textů pomocí strojového učení. V textu jsou popsány metody pro trénování a testování rozpoznávacích modelů. Hlavní přínos této práce spočívá ve vytvořeném algoritmu rozhodovacího stromu v jazyce Java. Vytvořený algoritmus byl integrován jako rozšíření do programu RapidMiner. V tomto programu vzniklo několik vzorových příkladů. Funkčnost byla ověřena na vytvořené databázi dat.
Shlukování textových dokumentů a jejich částí
Zápotocký, Radoslav ; Kopecký, Michal (vedoucí práce) ; Skopal, Tomáš (oponent)
Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty - z hlediska možnosti usnadnění navigace v dokumentu mezi podobnými částmi. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.
Shlukování textových dokumentů a jejich částí
Zápotocký, Radoslav ; Kopecký, Michal (vedoucí práce) ; Skopal, Tomáš (oponent)
Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která takto upravený model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.
Text Document Plagiarism Detector
Kořínek, Lukáš
This paper provides an overview of diploma thesis concerned with research on availablemethods of plagiarism detection and then with design and implementation of such detector. Primaryaim is to detect plagiarism within academic works or theses issued at BUT. The detector uses sophisticatedpreprocessing algorithms to store documents in its own NoSQL corpus. Implementedcomparison algorithms are designed for parallel execution on graphical processing units and theycompare a single subject document against all other documents within the corpus in the shortest timepossible, enabling near real-time detection capabilities.

Národní úložiště šedé literatury : Nalezeno 23 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.