Národní úložiště šedé literatury Nalezeno 23 záznamů.  začátekpředchozí14 - 23  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Automatizovaná detekce ofenzivního jazyka a nenávistných projevů v přirozeném jazyce
Štajerová, Alžbeta ; Žmolíková, Kateřina (oponent) ; Fajčík, Martin (vedoucí práce)
Táto práca sa zaoberá fenoménom nenávistných prejavov a ofenzívneho jazyka, ich definíciami a detekciou. Popisuje metódy doterajšieho riešenia detekcie. Zhodnocuje dostupné dátové sady využiteľné pri trénovaní modelov zameraných na detekciu tohto fenoménu. Dáva si za cieľ uviesť ďalšie metódy riešenia detekcie tohto problému a porovnanie ich výsledkov a vyhodnotenie úspešnosti. Zvolený problém bol riešený piatimi modelmi. Dva z nich boli zamerané na extrakciu príznakov a ich následnú klasifikáciu. Ďalšie tri boli riešené pomocou neurónových sietí. Úspešnosť implementovaných modelov som experimentálne vyhodnotila. Výsledky tejto práce umožňujú porovnanie typických prístupov s metódami využívajúcimi najnovšie poznatky z oblasti strojového učenia použitých pre klasifikáciu nenávistného a ofenzívneho jazyka.
Deep Neural Networks Used for Customer Support Cases Analysis
Marušic, Marek ; Ryšavý, Ondřej (oponent) ; Pluskal, Jan (vedoucí práce)
Artificial intelligence is remarkably popular these days. It can be used to resolve various highly complex tasks in fields such as image processing, sound processing, natural language processing, etc. Red Hat has an extensive database of resolved support cases. Therefore an idea was proposed to use these data for data mining and information retrieval in order to ease a resolution process of the support cases. In this work, various deep neural network models were created for prediction of features which could help during the resolution process. Techniques and models used in this work are described as well as their performance in the specific tasks. Comparison of individual models is outlined as well.
Shlukování textových dokumentů a jejich částí
Zápotocký, Radoslav ; Kopecký, Michal (vedoucí práce) ; Skopal, Tomáš (oponent)
Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty - z hlediska možnosti usnadnění navigace v dokumentu mezi podobnými částmi. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.
Shlukování textových dokumentů a jejich částí
Zápotocký, Radoslav ; Kopecký, Michal (vedoucí práce) ; Skopal, Tomáš (oponent)
Práce analyzuje možnosti použití vektorového modelu a shlukování aplikované na jednotlivé části dokumentu - kapitoly, odstavce a věty. Součásti práce je rovněž simulační aplikace (SimDIS), napsaná v jazyce C#, která takto upravený model implementuje a nabízí nástroje pro vizualizaci vektorů a shluků.
Rozpoznávání emocí z textu pomocí umělé inteligence
Vylíčil, Radek ; Karásek, Jan (oponent) ; Mašek, Jan (vedoucí práce)
Tato práce se zabývá rozpoznáváním emocí z textů pomocí strojového učení. V textu jsou popsány metody pro trénování a testování rozpoznávacích modelů. Hlavní přínos této práce spočívá ve vytvořeném algoritmu rozhodovacího stromu v jazyce Java. Vytvořený algoritmus byl integrován jako rozšíření do programu RapidMiner. V tomto programu vzniklo několik vzorových příkladů. Funkčnost byla ověřena na vytvořené databázi dat.
Klasifikační framework
Koroncziová, Dominika ; Otrusina, Lubomír (oponent) ; Kouřil, Jan (vedoucí práce)
Cílem této práce je návrh a implementace klasifikačního software postaveného na knihovně RapidMiner. Výsledná aplikace bude sdružovat nejpoužívanější algoritmy a procesy implementované v RapidMineru do jednoduchého použitelného programu. Součástí nároků na aplikaci je jednoduché rozhraní pro ovládání z příkazové řádky, stejně jako grafické rozhraní zjednodušující nastavení více parametrů. Aplikace má také umožňovat tvorbu samostatných jednoúčelových programů, sloužících na opakovanou klasifikaci s použitím předem natrénovaného modelu. Nad rámec původního zadání je implementována i práce s textovými daty z Wikipedie, jejich stáhnutí a předzpracování a následné použití jako trénovacích dat. Text práce se zabývá postupně jednotlivými algoritmy a popisem kvalifikačních algoritmů, jejich vlastnostmi a použitím, a popisuje návrh a implementaci systému. V rámci práce byla vykonána i sada několika testů pro ověření výkonu a funkcionality aplikace. Jejich výsledky jsou shrnuty v závěru práce.
Určení základního tvaru slova
Šanda, Pavel ; Burget, Radim (oponent) ; Karásek, Jan (vedoucí práce)
Lemmatizace je důležitou procedurou před dolováním v textu v mnoha aplikacích. Proces lemmatizace je podobný procesu stemmingu, s tím rozdílem, že neurčuje pouze kořen slova, ale snaží se slovo převést pomocí metod Brute Force a Suffix Stripping do jeho základního tvaru. Hlavním cílem této práce je prezentovat metody pro vylepšení algoritmů lemmatizace českého jazyka. Obsahem je vytvoření trénovací množiny dat, kterou lze libovolně použít pro studentské i vědecké práce zabývající se podobnou problematikou.
Options of automated categorization of contracts
Bereš, Miroslav ; Jelínek, Ivan (vedoucí práce) ; Oškera, Radek (oponent)
Objektem zájmu mé bakalářské práce je automatická kategorizace. Hlavním cílem je přezkoumání současných přístupů k automatické kategorizaci, návrh metodiky a provedení experimentu, ve kterém se sleduje úspěšnost kategorizovaných kontraktů veřejné zprávy s využitím strojového učení. Bakalářská práce je rozdělena do dvou hlavních částí. První část je věnována teorii, která přibližuje a vysvětluje danou problematiku. Rovněž jsou v této části popsány současné přístupy k automatické kategorizaci. Druhá část je zaměřena na navržení metodiky experimentu a jeho provedení, během kterého se sleduje úspěšnost automatické kategorizace kontraktů. V průběhu experimentu jsou vytvořeny modely, které se v konečném důsledku aplikují na kontrolní skupinu. Výstupem jsou rozkategorizované dokumenty, při kterých se sleduje úspěšnost jejich kategorizace. Za tímto účelem je v práci použit program Apache OpenNLP. Teoretická část a návrh metodiky experimentu je vypracována na základě studia zahraniční odborné literatury primárně získané z online elektronických a informačních zdrojů.
And the winner is... The presence of political slant in the movie production
Selep, Ján ; Stroukal, Dominik (vedoucí práce) ; Dušek, Libor (oponent)
V predkladanej diplomovej práci študujem maximalizáciu zisku filmových štúdií založenú na zafarbovaní používaného jazyka. Skúmam racionálne jednajúcu firmu, ktorá zafarbuje jazyk produkovaných filmov tak, aby bol čo najbližšie k spotrebiteľovi voliacemu buď demokratickú, alebo republikánsku stranu. Využitím technológií počítačového spracovania textu skúmam dáta z takmer dekády prepisov politických prejavov v Kongrese Spojených Štátov Amerických a 457 náhodne vybraných filmových titulkov. Pre meranie vzdialenosti medzi vektormi frází používam chi kvadrát štatistiku a jej Monte Carlo aproximáciu. Na základe popísaných dát som vo filmoch nenašiel žiadne politické vychýlenie jazyka. To platí zároveň pri odhade pre jednotlivé štúdia, tak pri zoskupení za jednotlivé roky. V náväznosti na prevedenú analýzu som pre každý skúmaný film skonštruoval index politického vychýlenia. Využitím tohto indexu odhadujem vplyv politického jazyka na následné výnosy filmu. Nájdený vzťah je však opäť nesignifikantný.
Experimenty s českými lingvistickými daty a ILP
Dědek, Jan ; Eckhardt, Alan ; Vojtáš, Peter
V tomto článku prezentujeme počáteční experimenty, které jsme provedli ve spojitosti s naším výzkumem Sémantického webu. Tyto experimenty by měly demonstrovat možnosti zapojení ILP při získávání sémantických informací z textů českých webových stránek. Těmto experimentům předchází komplexní lingvistická analýza, jejíž výstup je využit v induktivní proceduře ILP.

Národní úložiště šedé literatury : Nalezeno 23 záznamů.   začátekpředchozí14 - 23  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.