Národní úložiště šedé literatury Nalezeno 24 záznamů.  předchozí5 - 14další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Linguistic Issues in Machine Translation between Czech and Russian
Klyueva, Natalia ; Kuboň, Vladislav (vedoucí práce) ; Panevová, Jarmila (oponent) ; Strossa, Petr (oponent)
V této disertační práci zkoumáme strojový překlad mezi češtinou a ruštinou z hlediska lingvisty. Pracujeme s několika pravidlovými a statistickými překladovými systémy a pomocí změn v jejích nastavení se snážíme dosáhnout co nejlepších výsledků překladu. Jedna z otázek, které řešíme v naší práci, je nakolik příbuznost obou jazyků pomáhá strojovému překladu. Hlavním cílem práce je lingvistický rozbor chyb ve výstupu čtyř systémů strojového překladu, dvou experimentálních - TectoMT, Moses, a dvou komerčních - PC Translator a Google Translate. Analyzujeme každý typ chyb a řešíme, zda daná chyba souvisí s rozdílem mezi češtinou a ruštinou nebo zda je zapříčiněná architecturou jednotlivých systémů. Pro některé chyby nabízíme cesty, jak je opravit. Ve zvláštní kapitole se zaměřujeme na chyby v povrchové valenci sloves. Zkoumáme rozdíly v české a ruské povrchové valenci, popisujeme extrakci slovníku povrchových forem a tento slovník integrujeme do systému TectoMT. Dále nabízíme souhrn lingvistických pozorování o povaze rozdílů v české a ruské valenci. Powered by TCPDF (www.tcpdf.org)
Správa, vyhledávání a zpřístupňování elektronických vysokoškolských kvalifikačních prací
Mach, Jan ; Bratková, Eva (vedoucí práce) ; Strossa, Petr (oponent) ; Souček, Martin (oponent)
Disertační práce je věnována analýze současné praxe a trendům provozu repozitářů elektronických vysokoškolských kvalifikačních prací (eVŠKP) z pohledu jejich správy, vyhledávání a zpřístupňování. První část představuje výchozí pojmy a současný stav zpřístupňování eVŠKP v českých a zahraničních repozitářích, obsahuje průzkum zpřístupňování eVŠKP v ČR z roku 2014, kterého se zúčastnily všechny veřejné vysoké školy. V druhé části práce je představen metadatový soubor EVSKP-MS, konkrétně možnosti mapování prvků EVSKP-MS na další metadatové formáty a využití standardu v rámci OAI-PMH protokolu. Problematika zpřístupňování eVŠKP je dále řešena z pohledu vhodnosti metrik pro evaluaci využití distribuovaných eVŠKP. Vyhledáváním eVŠKP se zabývají popsané případové studie a doporučení pro výběr discovery služby a pro tvorbu vyhledávacího serveru metadat eVŠKP a související uživatelské rozhraní s fasetovým vyhledáváním. Poslední část disertační práce se zabývá problematikou plagiátorství. V práci je představena analýza nejvýznamnějších systémů na podporu vyhledávání plagiátů a vývoj portálu Validátor VŠE pro zpřístupnění výsledků kontroly dokumentů.
Citování vědecké literatury prostřednictvím formátu XML
Jansová, Linda ; Nič, Miloslav (vedoucí práce) ; Souček, Martin (oponent) ; Strossa, Petr (oponent)
Disertace je zaměřena na problematiku využití jazyka XML pro účely citování. Nejprve je přiblížen současný stav problematiky citování, který je významně ovlivněn rozvojem elektronického publikování. Následně jsou představeny vybrané projekty zaměřené na strojově srozumitelná citační data a způsoby zahrnutí citačních dat do XML formátů. Podrobně jsou charakterizovány citační formáty užívané v praxi, a to jak formáty využívající jazyk XML, tak další formáty. Stručně jsou představeny vybrané citační manažery jako nástroje využívané při automatizované práci s citačními daty. Pozornost je věnována také typologii citovaných dokumentů. Zahrnuta je i podrobná analýza citační praxe uplatňované v tzv. barevných knihách IUPAC. Na základě dílčích zjištění byly formulovány doporučené postupy pro zahrnutí citačních dat do XML formátů. Doporučené postupy mají podobu sedmi zásad, které lze stručně shrnout takto: využití kódování UTF-8, nízký počet prvků i atributů, maximální strukturování dat, využití řízených slovníků, zachycení hierarchie dat a propojení dat pomocí odkazů, využití existující typologie dokumentů nebo vytvoření nové typologie, využití principu rekurze při práci s daty. Na základě doporučených postupů byl navržen experimentální formát. Možnost jeho implementace v praxi je ukázána na příkladu citačních dat z...
Citování vědecké literatury prostřednictvím formátu XML
Jansová, Linda ; Nič, Miloslav (vedoucí práce) ; Souček, Martin (oponent) ; Strossa, Petr (oponent)
Disertace je zaměřena na problematiku využití jazyka XML pro účely citování. Nejprve je přiblížen současný stav problematiky citování, který je významně ovlivněn rozvojem elektronického publikování. Následně jsou představeny vybrané projekty zaměřené na strojově srozumitelná citační data a způsoby zahrnutí citačních dat do XML formátů. Podrobně jsou charakterizovány citační formáty užívané v praxi, a to jak formáty využívající jazyk XML, tak další formáty. Stručně jsou představeny vybrané citační manažery jako nástroje využívané při automatizované práci s citačními daty. Pozornost je věnována také typologii citovaných dokumentů. Zahrnuta je i podrobná analýza citační praxe uplatňované v tzv. barevných knihách IUPAC. Na základě dílčích zjištění byly formulovány doporučené postupy pro zahrnutí citačních dat do XML formátů. Doporučené postupy mají podobu sedmi zásad, které lze stručně shrnout takto: využití kódování UTF-8, nízký počet prvků i atributů, maximální strukturování dat, využití řízených slovníků, zachycení hierarchie dat a propojení dat pomocí odkazů, využití existující typologie dokumentů nebo vytvoření nové typologie, využití principu rekurze při práci s daty. Na základě doporučených postupů byl navržen experimentální formát. Možnost jeho implementace v praxi je ukázána na příkladu citačních dat z...
Metodika pro lokalizaci webových stránek z pohledu webdesignu
Čermák, Radim ; Doucek, Petr (vedoucí práce) ; Strossa, Petr (oponent) ; Hřebíček, Jiří (oponent) ; Dědič, Filip (oponent)
Internet a webové stránky dnes patří k nejdůležitějším komunikačním kanálům téměř všech firem. Nabízí totiž jednoduchý, rychlý a efektivní způsob komunikace, který je navíc dostupný během okamžiku po celém světě. S globalizací trhu stále více firem expanduje a snaží se své podnikání rozšiřovat za území domácího státu. V současné době masového zakládání start-upů je navíc internet často médiem, které umožňuje vznik novým sférám podnikání, pro něž jsou webové stránky naprosto esenciálním kanálem. Tento typ podnikání je na webu postaven a má velmi často hned od počátku nadnárodní ambice. Vzhledem k tomu, že každý stát (případně region) můžeme chápat jako svébytnou kulturu, je vhodné lokalizovat webové stránky pro potřeby cílového státu. Právě tímto tématem se zabývá předkládaná práce. Konkrétním cílem práce je nabídnout metodiku lokalizace webových stránek z pohledu webdesignu. Základním stavebním kamenem práce je vymezení multidisciplinárního teoretického rámce zabývajícího se pojmem kultura a literární rešerše umožňující aktuální vhled do problematiky propojení webu a kultury, tedy kulturní lokalizace webových stránek. Z teoretického rámce vychází výběr vhodného způsobu pro uchopení tak komplexního pojmu, jakým je kultura. Jako nejvhodnější metoda byly stanoveny Hofstedeho kulturní dimenze, které jsou následně použity pro analýzu kulturní determinace webových elementů. Sběr dat pro analýzu kulturní determinace webových elementů je proveden pomocí obsahové analýzy webových stránek z celkem devíti různých států. Výsledky provedené analýzy jsou komparovány a syntetizovány se závěry vzešlými z literární rešerše a na tomto základě následně vzniká hlavní artefakt této práce, tedy metodika pro lokalizaci webových stránek z pohledu webdesignu. Ověření navrhované metodiky je provedeno na základě ohodnocení relevance metodiky pro oblast webdesignu rozhovory s experty z různých zemí a uvedením konkrétního příkladu použití metodiky pro lokalizaci webu středního rozsahu.
Učení business rules z výsledků dolování GUHA asociačních pravidel
Vojíř, Stanislav ; Strossa, Petr (vedoucí práce) ; Pour, Jan (oponent) ; Kouba, Zdeněk (oponent) ; Gregor, Jiří (oponent)
V současném vysoce-konkurenčním prostředí je pro podniky velmi důležité, aby jejich informační systémy nejen co nejefektivněji podporovaly stávající podnikové procesy, ale aby se zároveň byly schopny se dynamicky přizpůsobovat měnícímu se prostředí. Stále více se prosazují snahy vzájemně oddělit aplikační a business logiku v rámci informačních systémů, přičemž jedním z vhodných prostředků pro záznam business logiky je využití business rules. Business rules jakožto jednoduchá a srozumitelná pravidla je možné využívat nejen pro shromažďování znalostí v rámci podniku, ale také pro aktivní rozhodování a řízení podnikových procesů. Ačkoliv je business rule přístup využíván již téměř 20 let, jednotlivé specifikace a možné aplikace business rules jsou stále předmětem aktivního výzkumu i praktického vývoje. Nevýhodou business rules je velká náročnost jejich získávání - pravidla jsou obvykle zadávána ručně prostřednictvím doménových expertů. Jedním z problémů, na které je zaměřen aktuální výzkumu v této oblasti, je možnost (polo)automatického získávání business rules z jiných zdrojů - podnikových dokumentů či historických dat. Získávání business pravidel z historických podnikových dat je věnována také tato práce. Hlavním cílem této disertační práce je navrhnout a ověřit metodu (polo)automatického učení business rules za využití dolování asociačních pravidel. Asociační pravidla jsou známou data miningovou metodou objevování zajímavých vztahů v datech, přičemž nalezené vztahy jsou srozumitelné a vysvětlitelné. Tato srozumitelnost napomáhá možnosti využívat je pro učení business pravidel. K učení business pravidel lze využívat nejen jednoduchá asociační pravidla získávaná pomocí algoritmu Apriori či FP Growth, ale také složitější asociační pravidla získávaná za využití metody GUHA. V rámci práce je využívána procedura 4ft-Miner data miningového systému LISp-Miner. V rámci této práce je nejprve popsána problematika business pravidel a jejich využívání pro modelování podniků i praktické zapojení do podnikových procesů a také problematika dolování asociačních pravidel. S ohledem na roztříštěnost specifikací a standardů pro definici business rules je v rámci práce definován a následně prakticky aplikován proces pro výběr odpovídající specifikace business rules pro konkrétní praktické využití. Následně jsou v rámci práce navrženy tři způsoby zapojení dolování asociačních pravidel pro učení business rules. V rámci těchto modelů byl též definován model pro transformaci GUHA asociačních pravidel do business pravidel ve formátu DRL (pro systém Drools). Pro možnost získávání business pravidel za využití většího množství zdrojů, zejména za využití dolování asociačních pravidel z většího množství data setů, je v další části práce navržena struktura báze znalostí vhodné pro propojení business rules a asociačních pravidel z většího množství zdrojů, přičemž z pohledu business rules slouží jako terminologický slovník, pro dolování asociačních pravidel pak plní úlohu báze doménových znalostí pro předzpracování dat. Navržené modely byly ověřeny za využití praktických implementacích v systémech EasyMiner (v kombinaci se systémem Drools) a Erian. V rámci práce jsou kromě popisů praktických implementací definovány také dva modelové příklady praktického využití učení business pravidel z výsledků dolování GUHA asociačních pravidel, založené na reálných datech. Jeden v oblasti marketingu, druhý v oblasti kontrol ve zdravotních pojišťovnách.
Návrh vyhledávacího systému pro moderní potřeby
Maršálek, Tomáš ; Palovská, Helena (vedoucí práce) ; Strossa, Petr (oponent)
V této práci tvrdím, že oblast textového vyhledávání se obecně soustředí na dlouhé textové dokumenty, přičemž vzrůstá potřeba po efektivním vyhledávacím systému soustředícím se na krátký text, na který jsou kladeny odlišné požadavky. Díky tomuto zmenšení objemu prohledávaných dat se stanou některé algoritmické techniky výpočetně dostupnější. Přesnější zaměření této práce je na techniky přibližného a prefixového vyhledávání a ohodnocovacích metod založených čistě na textové shodě, protože statistické metody na krátkém textu ztrácejí význam. Na základě nich byl vytvořen jednoduchý prototyp vyhledávacího systému, jehož vlastnosti jsou zde demonstrovány na několika vyhledávacích případech a porovnány se dvěma dalšími open source vyhledávacími systémy, které reprezentují doporučovaná řešení pro problém vyhledávání v krátkém textu v dnešní době. Dle výsledků porovnání lze usoudit proveditelnost navrhovaného řešení z pohledu vyhledávacích schopnosti i výkonu. Na základě toho je pak představeno několik možností pro budoucí vývoj systému.
Pragmatický lematizátor českých slov
Vacek, Matěj ; Strossa, Petr (vedoucí práce) ; Kliegr, Tomáš (oponent)
Tato práce se zabývá lemmatizací podstatných a přídavných jmen na základě morfologie českého jazyka. Cílem práce je vytvořit lemmatizátor, který bude lemmatizovat slova s úspěšností alespoň 90%. Zároveň by měl být lemmatizátor co nejjednodušší, tj. měl by mít co nejméně pravidel. Lemmatizátor bude vytvářen pro oblast realitních inzerátů na prodej domů. V práci budou analyzovány specifika této oblasti a lemmatizátor bude přizpůsoben této oblasti, tak aby při lemmatizaci vytvářel co nejlepší výsledky. Lemmatizátor byl vytvořen v jazyce Java. Bylo použito velmi málo pravidel (pouze tři typy) a celkově byl lemmatizátor úspěšný v 96,4% případech.
Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce
Pytelka, Petr ; Strossa, Petr (vedoucí práce) ; Pinkas, Otakar (oponent)
Cílem práce je měření kvality lemmatizace pro český jazyk v systémech zpracování doku-mentů a analýza výsledků tohoto měření. V teoretické části práce je popsán princip plno-textového vyhledávání, možnosti realizace lemmatizace a běžné problémy, které je nutné řešit při zpracování přirozeného jazyka. V práci jsou diskutovány možnosti hodnocení kva-lity lemmatizace pomocí měření přesnosti a úplnosti vyhledávání. Pro detailnější hodnocení lemmatizátoru je popsána metoda měření nadměrné a nedostatečné lemmatizace. V druhé části práce je navržen experiment a testovací aplikace pro měření kvality lemmati-zace ve třech systémech, které jsou používány pro realizaci vyhledávání dokumentů. Jedná se o knihovnu Apache Lucene, databázové systémy PostgreSQL a Microsoft SQL Server. Experiment je prováděn s využitím Pražského závislostního korpusu, a to pro korpus jako celek a zvlášť pro vybrané slovní druhy. Rozbor výsledků pro výchozí lemmatizátor pro český jazyk v Lucene umožnil návrh několika drobných úprav, které vedou k měřitelnému zlepšení vyhledávání. Výsledky práce ukazují, jak lze využít uvedené metriky a podrobné výsledky pro zlepšování lemmatizačních algoritmů a tím i pro zkvalitnění plnotextového vyhledávání pro český jazyk.
NoSQL databáze
Günzl, Richard ; Palovská, Helena (vedoucí práce) ; Strossa, Petr (oponent)
Práce se zabývá databázovými systémy spadající do skupiny označované jako NoSQL databáze. V druhé kapitole vysvětluji základní pojmy a teorii související s databázovými systémy. V krátkosti zde vykládám o databázových systémech založených na relačním modelu dat a standardizovaném dotazovacím jazyku SQL. Třetí kapitola je zaměřena na výklad pojmu a historii NoSQL databází. Dále jsou v této kapitole představeny databázové modely, podstatné vlastnosti a využití NoSQL databází také v porovnání s tradičními databázovými systémy. Ve čtvrté kapitole se věnuji rozdělení NoSQL databází na jejich jednotlivé představitele. Charakterizuji zde několik hlavních představitelů NoSQL databází. V další kapitole se věnuji praktické ukázce NoSQL databáze, konkrétně databázovému systému Apache Cassandra. Ve stručnosti se zde zabývám zprovozněním databázového systému Apache Cassandra a nástroji pro jeho správu. Dále praktická ukázka obsahuje základní operace vykonávané nad vzorovou databází s pomocí interaktivního rozhraní příkazové řádky označované jako Cassandra CLI. Cílem této kapitoly je seznámit čtenáře, jak pracovat s databázovým systémem Apache Cassandra a poukázat na některé jeho specifika. Hlavním cílem práce je seznámit čtenáře s nejdůležitějšími vlastnostmi a představiteli NoSQL databází a s jejich možnou využitelností v praxi.

Národní úložiště šedé literatury : Nalezeno 24 záznamů.   předchozí5 - 14další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.