Národní úložiště šedé literatury Nalezeno 32 záznamů.  předchozí11 - 20dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Porovnání open-source nástrojů pro strojové učení
Poliakova, Yevheniia
Poliakova, Y. Porovnání open-source nástrojů pro strojové učení. Diplomová práce. Brno: Mendelova univerzita v Brně, 2022. Tato práce se věnuje průzkumu nástrojů umělé inteligence, které mají svůj program volně přístupný a použití těchto nástrojů pro konkrétní úlohy. Hlavním přínosem je porovnávaní těchto open-source nástrojů pomocí experimentů zaměřených na induktivně řízené (supervised) získávání znalostí z velkých objemů textových dat. Tyto experimenty budou provedeny pomocí vhodně zvolených open-source nástrojů. Výsledkem a cílem práce bude shrnutí všech poznatků včetně výhod i nevýhod již zmíněných platforem, jejich vlastností při řešení konkrétních problémů a doporučení volby platformy dle zadané úlohy, nebo dat.
Assessment and implementation of text data preprocessing in neural network models
Ratnasari, Febiyanti
V oblasti zpracování textových dat měla tradičně významnou úlohu předzpracování textu. S nástupem neuronových sítí a nových reprezentací textových dat však bylo předzpracování textu relativně podceňováno. Tato výzkumná práce se snaží vyřešit tuto problematiku prostřednictvím zkoumání potenciálních výhod použití kompozitu více technik předzpracování textových dat společně s textovým zpracovacím modelem založeným na neuronových sítích.
Binární klasifikace zákaznických incidentů pomocí metod NLP
Pokorný, Jiří
Tato bakalářská práce se zabývá vybudováním modelu umožňujícího binární klasifikaci zákaznických incidentů v rámci systému SAP. Klasifikace je provedena pro věty obsažené v incidentech, dle čehož je určena konečná kategorie incidentu. Využitý text je v anglickém jazyce. Za účelem porovnání tradičních a moderních přístupů pro textovou klasifikaci, a získání optimálního výsledku, je provedena série experimentů obnášející využití různých metod vyvážení datasetu, vektorové reprezentace a klasifikačních algoritmů. Výsledky jsou v konečné řadě zhodnoceny a je zformulováno doporučení s ohledem na další rozvoj, včetně uplatnění získaných znalostí v prostředí SAP.
Predikce vývoje ceny ropy na základě textových zpravodajských informací
Skalický, Jan ; Bojar, Ondřej (vedoucí práce) ; Žabokrtský, Zdeněk (oponent)
Pro předpověď vývoje ceny ropy existuje celá řada algoritmů. V této práci přinášíme nový pohled na tuto problematiku a představujeme náš projekt COPF. Pomocí klasifikátoru maximální entropie se snažíme předpovídat z textových informací dostupných na Internetu. Opíráme se o znalosti expertů v daném oboru. V rámci práce jsme testovali a vylepšovali úspěšnost systému COPF. Zjistili jsme, že tento přístup má mnoho problémů, které se ale dají řešit. V současném stavu naše úspěšnost sice překonala baseline, ovšem pro další vývoj je nutné získat více zdrojů dat. Naše metoda nebyla nikdy považována za nosnou, spíše může sloužit k vylepšení úspěšnosti předpovědí numerických algoritmů a v každém případě je zajímavá z hlediska možnosti dolování informací z textu.
Popularita osob automaticky
Hajič, Jan ; Bojar, Ondřej (vedoucí práce) ; Popel, Martin (oponent)
Možnost automaticky sledovat popularitu osob v~novinách by jistě uvítaly nejen tyto osoby samotné. Počítačové zpracovávání subjektivity je sice rychle se rozvíjející podobor komputační lingvistiky, v~češtině ovšem vůbec pro analýzu subjektivity a polarity v publicistice neexistují data. Začali jsme tedy s~tvorbou ručně anotovaného korpusu polarity z~českých publicistických textů, které se ovšem pro takové zpracování ukázaly jako krajně nevhodné. Dále jsme navrhli klasifikátor založený na statistických metodách, který by měl na základě tohoto korpusu popularitu sledovat, a otestovali jsme ho na korpusu recenzí bílého zboží a orientačně na zárodku našeho korpusu vět z~novinových článků. Jako model jsme použili automaticky extrahovaný unigramový slovník, tři příbuzné metody pro zjišťování polárních lemmat a množství filtrů pro selekci relevantních lemmat. Na recenzích bílého zboží jsme dosáhli výsledků srovnatelných se světovým výzkumem už se základním modelem, naopak u českých publicistických textů vidíme kvůli jejich charakteru možný příslib až u více lingvisticky orientovaných metod.
Filtrování spamových zpráv pomocí metod umělé inteligence
Safonov, Yehor ; Uher, Václav (oponent) ; Kolařík, Martin (vedoucí práce)
V moderním počítačovém světě e-mailová komunikace patří do nejpoužívanějších prostředků pro výměnu zpráv mezi uživateli. Jedná se o volně dostupný, efektivní a jednoduchý způsob sloužící ke sdělení informací. Tyto tři základní pilíře přispívají k její světové rozšířenosti a strmému nárůstu přenášených elektronických zpráv. Na druhou stranu, rostoucí popularita této technologie v sobě skrývá velká bezpečnostní rizika a tvoří z ní ideální nástroj pro šíření nevyžádaného obsahu a realizaci útoků cílených jak na koncové uživatele, tak i na celé počítačové infrastruktury. Ačkoliv v dnešní době používané klasické nástroje na filtrování spamu dosahují vysokých přesností, často neumožňují pokrytí dynamičnosti vývoje spamových technik a trpí problémy s přeučením, uváznutím v nevhodných lokálních minimech, neschopností efektivně zpracovávat vysoce dimenzionální data a z dlouhodobého hlediska disponují problémy s udržitelností. Hlavním cílem této diplomové práce je vytvoření a naučení modelů hlubokých neuronových sítí použitím nejmodernějších technik a přístupů existujících ve světě zpracování přirozeného jazyka a strojového učení. V rámci teoretické části se práce zaměřuje na problematiku e-mailové komunikace se zaměřením na filtrování nevyžádané pošty. Následně se věnuje doméně strojového učení a umělých neuronových sítí, zejména principům jejich fungování, základním vlastnostem a možnostem jejich aplikování na okruh problémů spojených s provedením textové analýzy. Mezi silné stránky práce patří provedení podrobného srovnání současných metod strojového učení, jejich specifik a přesnosti při aplikování na klasifikaci spamu. V praktické části práce byl důraz položen na zpracování datové sady surových e-mailů a srovnání modelů ULMFiT, BERT a XLNet. Zpracování dat bylo rozděleno do pěti etap, a to s cílem zachování co nejvyšší informační hodnoty zpráv a vytvoření kvalitní datové sady, která byla použita pro trénování, testování a validaci zvolených druhů neuronových sítí. Dále diplomová práce zahrnuje popis procesu učení sítí včetně etapy finálního přizpůsobení dat k modelování. Na konci práce byly implementované modely srovnány a byla nastíněna případná rozšíření do budoucna.
Extrakce sémantických vztahů z textu
Pospíšil, Milan ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
Dnes existuje spousta polostrukturovaných dokumentů, které by bylo vhodné převést do strukturované podoby. Cílem práce je navrhnout systém, který umožňí tuto práci co nejvíce zautomatizovat. To může být obtížný problém, protože většina těchto dokumentů není generovaná automaticky počítačem a systém proto musí tolerovat nepřesnosti. Protože je třeba i určité sémantické pochopení problému, bude systém testován na doméně sady dokumentů zápisů ze schůzek.
Comparison of approaches to text classification
Knížek, Jan ; Hana, Jiří (vedoucí práce) ; Vidová Hladká, Barbora (oponent)
The focus of this thesis is short text classification. Short text is the prevailing form of text on e-commerce and review platforms, such as Yelp, Tripadvisor or Heureka. As the popularity of the online communication is increasing, it is becoming infeasible for users to filter information manually. It is therefore becoming more and more important to recog- nise the relevant information in text. Classification of reviews is especially challenging, because they have limited structure, use informal language, contain a high number of errors and rely heavily on context and common knowledge. One of the possible appli- cations of machine learning is to automatically filter data and show users only relevant pieces of information. We work with restaurant reviews from Yelp and aim to predict their usefulness. Most restaurants have relatively many reviews, yet only few are truly useful. Our objective is to compare machine learning methods for predicting usefulness. 1
Klasifikace dokumentů pomocí umělé inteligence
Molnár, Ondřej ; Kačic, Matej (oponent) ; Třeštíková, Lenka (vedoucí práce)
Tato práce se zabývá klasifikací dokumentů za použití umělé inteligence. Popisuje principy klasifikace a strojového učení. Seznamuje s metodami UI a dále detailně představuje metodu klasifikace naivního Bayese. Poté líčí praktickou implementaci klasifikátoru do prostředí MS Office a diskutuje další možná rozšíření.
Programovací jazyk Scala a jeho využití pro analýzu dat
Kohout, Tomáš ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Tato práce se zabývá porovnáním jazyka Scala s ostatními běžně používanými jazyky pro analýzu dat. Tyto jazyky se porovnávají z hlediska manipulace a zobrazení dat, strojvého učení a souběžného zpracování. Z tohoto porovnání následně vyplynou silné a slabé stránky jazyka Scala. Silné stránky jsou demonstrovány na implementované aplikaci pro kategorizaci e-mailů.

Národní úložiště šedé literatury : Nalezeno 32 záznamů.   předchozí11 - 20dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.