Národní úložiště šedé literatury Nalezeno 55 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Automatic detection of fake-news on Slovak texts
Romanský, Patrik ; Mareček, David (vedoucí práce) ; Novák, Michal (oponent)
Šírenie fake-news je dlhodobým problémom, ale v posledných rokoch sa stáva ešte výraznejším. Preto sme v tejto práci analyzovali problém ich automatickej detekcie ako úlohu klasifikácie textu. Práca sa od iných, jej podobných štúdií, odlišuje primárne v tom, že sa zameriava na slovenčinu, kde doposiaľ nebola vykonaná takáto rozsiahla sada experi- mentov. Počas testov sme vytvorili vybalansovaný dataset. Vykonali sme taktiež viac ako 80 experimentov s cieľom nájsť optimálny klasifikátor pre riešenie tohto problému. Ako prvý sme použili predtrénované jazykové modely typu Transformer (BERT, mBERT, Ro- BERTA, XLM-RoBERTa a SlovakBERT) a pomocou štandardných metrík sme porovnali ich výkonnosť s inými metódami strojového učenia. Pre fine-tuning sme použili aj ang- lické datasety LIAR a COVID19 FN, na ktorých sme otestovali vplyv témy fake-news a prenos vlastnosti medzi jazykmi. Najlepšie výsledky dosiahol SlovakBERT v kombiná- cii s tréningom na výlučne slovenskom datasete (acc = 0, 9610). 1
Unsupervised segmentation of Gregorian chant melodies for exploring chant modality
Lanz, Vojtěch ; Hajič, Jan (vedoucí práce) ; Mareček, David (oponent)
Gregoriánský chorál, jako ústní hudební tradice, byl prováděn zpěváky, kteří se museli naučit tisíce melodií. Každá melodie má několik vlastností, z nichž jednou je, do jakého modu v rámci modálního systému patří. Pro pochopení principů vyučování chorálových melodií může být užitečné rozložit melodie na menší jednotky a analyzovat jejich vz- tah k modalitě. V této práci porovnáváme modely neřízené segmentace založené na Bayesovských metodách s těmi, které využívají neuronové sítě. Jejich schopnost segmen- tovat chorální melodie měříme námi navrženými metrikami s cílem prozkoumat vlastnosti chorálů, jak v kontextu modality, tak v kontextu řešení problému se zapamatováním si všech zpěvů. K tomuto účelu máme k dispozici dva datasety: jeden s více než třinácti tisíci antifonami a druhý s více než sedmi tisíci responsorií. Zjistili jsme, že metoda založená na Pitman-Yor procesu je pro tuto konkrétní úlohu vhodnějším modelem než BERT, zejména námi navržený podmíněný model Pitman-Yor procesu, který segmentuje každý modus samostatně. Uvádíme několik jasných argumentů, že modalita úzce souvisí se segmentací melodií. Rovněž zpochybňujeme tvrzení, že přirozená segmentace podle slov nebo slabik chorálu je z hlediska klasifikace modů nejlepší (Cornelissen et al. [2020]), a poskytujeme doposud nejlepší výsledek v úloze...
Automatické generování Einsteinových hádanek v přirozeném jazyce
Hubená, Michaela ; Mareček, David (vedoucí práce) ; Hajič, Jan (oponent)
V rámci bakalářské práce byla vytvořena aplikace na příkazové řádce pro generování Einsteinových hádanek v přirozeném jazyce pomocí jazyko- vého modelu GPT-3 (generativní předtrénovaný Transformer třetí generace). Pro generování Einsteinových hádanek byla použita metoda few-shot, kdy je jazykovému modelu kromě zadání požadované úlohy předáno i několik vy- řešených příkladů této úlohy, pomocí kterých se má jazykový model úlohu naučit přímo při generování. Vytvořená aplikace umožňuje generovat Einstei- novy hádanky různých velikostí a obtížností na libovolné téma v českém či anglickém jazyce. Při generování je kladen důraz na kreativitu a originalitu Einsteinových hádanek.
Vývoj mobilní aplikace a generátoru otázek pro hru Desítka
Tomiška, Tadeáš ; Mareček, David (vedoucí práce) ; Rosa, Rudolf (oponent)
Tato bakalářská práce se zaměřuje na vytvoření mobilní aplikace pro Android. Apli- kace umožní hrát online verzi hry Desítka od společnosti Mindok. Součástí práce je i vy- tvoření otázek pro hru. Ty budou generovány pomocí webových stránek z Wikipedie. Pro získání potřebných dat bude použita technika parsování stránek. Aplikace bude napsána v jazyce Java a bude určena pro Android verze 10 a vyšší. Pro komunikaci mezi zaříze- ními bude použita client-server architektura. Komunikačním prostředkem bude techno- logie wifi. Aplikace bude mít stejná pravidla jako hra Desítka a bude podporovat 2 herní režimy. Půjde hrát v režimu online s ostatními hráči nebo v režimu friend s přáteli. 1
Automatic detection of fake-news on Slovak texts
Romanský, Patrik ; Mareček, David (vedoucí práce) ; Novák, Michal (oponent)
Šírenie fake-news je dlhodobým problémom, ale v posledných rokoch sa stáve ešte výraznejším. Preto sme sa v tejto práci pozreli na problém ich automatickej detekcie ako na úlohu klasifikácie textu. Práca sa od iných, jej podobných štúdií, odlišuje primárne v tom, že sa zameriava na slovenčinu, kde doposiaľ nebola vykonaná takáto rozsiahla sada experimentov. Počas testov sme vytvorili vybalansovaný dataset. Vykonali sme taktiež viac ako 80 experimentov s cieľom nájsť optimálny klasifikátor pre riešenie tohto pro- blému. Ako prvý sme použili predtrénované jazykové modely typu Transformer (BERT, mBERT, RoBERTA, XLM-RoBERTa a SlovakBERT) a pomocou štandardných metrík sme porovnali ich výkonnosť s inými metódami strojového učenia. Pre fine-tuning sme použili aj anglické datasety LIAR a COVID19 FN, na ktorých sme otestovali vplyv témy fake-news a prenos vlastnosti medzi jazykmi. Najlepšie výsledky dosiahol SlovakBERT v kombinácii s tréningom na výlučne slovenskom datasete (acc = 0.9610). 1
Question Answering in Czech via Machine Translation and Cross-lingual Transfer
Macková, Kateřina ; Straka, Milan (vedoucí práce) ; Mareček, David (oponent)
Informatické zpracování dovednosti čtení s porozuměním a úlohy odpovídání na otázky se zabývají oblastmi zpracování přirozeného jazyka a vyhledávání informací. Čtení s porozuměním je schopnost modelu číst a zpracovat text a porozumět jeho významu. Jednou z jeho aplikací je úloha odpovídání na otázky, které se zabývá vytvořením systému, který dokáže v textu automaticky najít odpověď na určitou otázku, která přímo souvisí s obsahem dokumentu. Pro angličtinu se jedná se o hojně studovanou úlohu, pro kterou existují obrovská tréninková data a spousty modelů. Pro tuto oblast však neexistují žádné modely ani data v češtině. Tato práce se zaměřuje na vytvoření systémů pro úlohy čtení s porozuměním a odpovídání na otázky v českém jazyce, a to bez nutnosti ručně vytvářet česká data. Hlavním cílem je automatické vytvoření českých trénovacích a testovacích dat a vytvoření modelů pro úlohu odpovídání na otázky v češtině. Využívá se existujících anglických dat a modelů za pomoci překladu a mezijazykového přenosu znalostí a následného porovnání výsledků a výběru modelu s nejlepšími výsledky. Nejprve jsme přeložili volně dostupná anglická data pro úlohu odpovídání na otázky SQuAD 1.1 a SQuAD 2.0 do češtiny, aby- chom vytvořili trénovací a testovací data. Poté jsme přetrénovali a vyhodnotili několik základních modelů BERT...
Automatic extraction of the main characters from books and their interactions
Brezinová, Viktória ; Mareček, David (vedoucí práce) ; Rosa, Rudolf (oponent)
Cieľom tejto práce bolo automaticky nájsť pomenované postavy v knihách, nájsť všetky ich výskyty a určiť všetky miesta v texte, na ktorých spolu interagovali dve alebo viacero postáv. Jedným z výstupov tejto práce je nástroj na zobrazovanie interaktívnych grafov, na ktorom môžeme vidieť výskyty a interakcie postáv v knihe. Pomocou tohto nástroja môžeme hľadať a analyzovať miesta v texte, na ktorých je výskyt alebo inte- rakcia postáv, keďže grafy sú prepojené s textom knihy. Tiež sme vyhodnotili použité metódy na dátach, ktoré sme predtým nevideli, analyzovali sme chyby a navrhli sme možné vylepšenia, ktoré by mohli byť v budúcnosti preskúmané. 1
Investigating Large Language Models' Representations Of Plurality Through Probing Interventions
Hanna, Michael ; Mareček, David (vedoucí práce) ; Helcl, Jindřich (oponent)
Title: Investigating Large Language Models' Representations Of Plurality Through Probing Interventions Author: Michael Hanna Institute: Institute of Formal and Applied Linguistics Supervisor: RNDr. David Mareček, Ph.D., Institute of Formal and Applied Linguistics Abstract: Large language models (LLMs) have become ubiquitous in natural language processing, but how exactly they process their input and arrive at good downstream task performance is still poorly understood. While much work has been done using probing to examine LLM internals, or behavioral studies, to determine LLMs' linguistic capabilities, these techniques are too weak to allow us to draw conclusions how LLMs process language. In this paper, I use both probing and causal intervention methods to investigate the question of subject-verb agreement with respect to the subject's plurality. I find that while probing reveals that subject plurality information is distributed throughout a sentence, causal interventions suggest that only information stored in linguistically relevant tokens is used. Probing interventions suggest that some but not all probes capture information in a way that reflects LLMs' usage thereof. Keywords: Interpretability, Probing, Natural Language Processing, Computational Linguistics
Analysis and visualization of the GPT-2 language model
Šipoš, Daniel ; Mareček, David (vedoucí práce) ; Rosa, Rudolf (oponent)
Vizualizácia komplexných modelov neurónových sietí s architektúrou typu Transfor- mer je vo všeobecnosti veľmi náročná úloha, ktorá sa väčšinou rieši vizualizáciou blokov Attention a sledovaním, na ktoré slová sa tento blok zameriava. Modely Transformer ale majú veľké množstvo vrstiev, na každej vrstve majú veľké množstvo hláv Attention a každá hlava môže sledovať rôzne lingvistické znaky. My sme sa preto v tejto práci za- merali na vytvorenie programu, ktorý je určený na prehľadnejšiu vizualizáciu správania jazykového modelu GPT-2. Prišli sme so štyrmi metódami vizualizácie, ktoré skúmajú závislosti generovaných slov od prechádzajúcich slov v texte. Tieto závislosti sledujeme tak, že skúsime prvé slovo v texte vynechať alebo zameniť za podobné slovo a pozorujeme zmenu v pravdepodobnosti generovaného slova. Metódy sme vyskúšali na modele GPT- 2 Medium a demonštrujeme, aké výsledky dané metódy vytvorili. Zároveň vyslovujeme hypotézy, ktoré sa pokúšajú objasniť, prečo tieto výsledky vyšli práve tak. 1
Analysis of valid moves in Scrabble
Dančejová, Katarína ; Zeman, Daniel (vedoucí práce) ; Mareček, David (oponent)
Cieľom práce je vytvoriť program, ktorý slúži na analýzu ťahov v spoločenskej hre Scrabble. Slovník jazyka je uložený v dátovej štruktúre GADDAG, ktorá umožňuje rýchle vyhľadávanie slov v slovníku. Ťahy sú vyhodnocované na základe heuristík pre strednú hru a koncovku. Tieto heuristiky berú v úvahu aj strategické aspekty pozície a snažia sa o dosiahnutie čo najvyššieho počtu bodov na konci hry. To má za následok zvýšenie úrovne analýzy ťahov natoľko, že je program hodnotný aj pre skúsenejšieho hráča. Simuláciami je porovnávaná výkonnosť umelej inteligencie používajúcej heuristiku s umelými inteligen- ciami, ktoré heuristiku nepoužívajú. Umelá inteligencia s heuristikou dosahuje v partiách výrazne lepšie výsledky, či už hru začína prvá alebo druhá v poradí. Na analýzu ťahov v Scrabble je vytvorené grafické používateľské rozhranie, ktoré navrhuje najlepšie ťahy podľa preukázane výhodnej heuristiky. 1

Národní úložiště šedé literatury : Nalezeno 55 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Viz též: podobná jména autorů
6 Mareček, Daniel
1 Mareček, Denis
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.