Národní úložiště šedé literatury Nalezeno 24 záznamů.  předchozí11 - 20další  přejít na záznam: Hledání trvalo 0.00 vteřin. 
Návrh vyhledávacího systému pro moderní potřeby
Maršálek, Tomáš ; Palovská, Helena (vedoucí práce) ; Strossa, Petr (oponent)
V této práci tvrdím, že oblast textového vyhledávání se obecně soustředí na dlouhé textové dokumenty, přičemž vzrůstá potřeba po efektivním vyhledávacím systému soustředícím se na krátký text, na který jsou kladeny odlišné požadavky. Díky tomuto zmenšení objemu prohledávaných dat se stanou některé algoritmické techniky výpočetně dostupnější. Přesnější zaměření této práce je na techniky přibližného a prefixového vyhledávání a ohodnocovacích metod založených čistě na textové shodě, protože statistické metody na krátkém textu ztrácejí význam. Na základě nich byl vytvořen jednoduchý prototyp vyhledávacího systému, jehož vlastnosti jsou zde demonstrovány na několika vyhledávacích případech a porovnány se dvěma dalšími open source vyhledávacími systémy, které reprezentují doporučovaná řešení pro problém vyhledávání v krátkém textu v dnešní době. Dle výsledků porovnání lze usoudit proveditelnost navrhovaného řešení z pohledu vyhledávacích schopnosti i výkonu. Na základě toho je pak představeno několik možností pro budoucí vývoj systému.
Pragmatický lematizátor českých slov
Vacek, Matěj ; Strossa, Petr (vedoucí práce) ; Kliegr, Tomáš (oponent)
Tato práce se zabývá lemmatizací podstatných a přídavných jmen na základě morfologie českého jazyka. Cílem práce je vytvořit lemmatizátor, který bude lemmatizovat slova s úspěšností alespoň 90%. Zároveň by měl být lemmatizátor co nejjednodušší, tj. měl by mít co nejméně pravidel. Lemmatizátor bude vytvářen pro oblast realitních inzerátů na prodej domů. V práci budou analyzovány specifika této oblasti a lemmatizátor bude přizpůsoben této oblasti, tak aby při lemmatizaci vytvářel co nejlepší výsledky. Lemmatizátor byl vytvořen v jazyce Java. Bylo použito velmi málo pravidel (pouze tři typy) a celkově byl lemmatizátor úspěšný v 96,4% případech.
Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce
Pytelka, Petr ; Strossa, Petr (vedoucí práce) ; Pinkas, Otakar (oponent)
Cílem práce je měření kvality lemmatizace pro český jazyk v systémech zpracování doku-mentů a analýza výsledků tohoto měření. V teoretické části práce je popsán princip plno-textového vyhledávání, možnosti realizace lemmatizace a běžné problémy, které je nutné řešit při zpracování přirozeného jazyka. V práci jsou diskutovány možnosti hodnocení kva-lity lemmatizace pomocí měření přesnosti a úplnosti vyhledávání. Pro detailnější hodnocení lemmatizátoru je popsána metoda měření nadměrné a nedostatečné lemmatizace. V druhé části práce je navržen experiment a testovací aplikace pro měření kvality lemmati-zace ve třech systémech, které jsou používány pro realizaci vyhledávání dokumentů. Jedná se o knihovnu Apache Lucene, databázové systémy PostgreSQL a Microsoft SQL Server. Experiment je prováděn s využitím Pražského závislostního korpusu, a to pro korpus jako celek a zvlášť pro vybrané slovní druhy. Rozbor výsledků pro výchozí lemmatizátor pro český jazyk v Lucene umožnil návrh několika drobných úprav, které vedou k měřitelnému zlepšení vyhledávání. Výsledky práce ukazují, jak lze využít uvedené metriky a podrobné výsledky pro zlepšování lemmatizačních algoritmů a tím i pro zkvalitnění plnotextového vyhledávání pro český jazyk.
NoSQL databáze
Günzl, Richard ; Palovská, Helena (vedoucí práce) ; Strossa, Petr (oponent)
Práce se zabývá databázovými systémy spadající do skupiny označované jako NoSQL databáze. V druhé kapitole vysvětluji základní pojmy a teorii související s databázovými systémy. V krátkosti zde vykládám o databázových systémech založených na relačním modelu dat a standardizovaném dotazovacím jazyku SQL. Třetí kapitola je zaměřena na výklad pojmu a historii NoSQL databází. Dále jsou v této kapitole představeny databázové modely, podstatné vlastnosti a využití NoSQL databází také v porovnání s tradičními databázovými systémy. Ve čtvrté kapitole se věnuji rozdělení NoSQL databází na jejich jednotlivé představitele. Charakterizuji zde několik hlavních představitelů NoSQL databází. V další kapitole se věnuji praktické ukázce NoSQL databáze, konkrétně databázovému systému Apache Cassandra. Ve stručnosti se zde zabývám zprovozněním databázového systému Apache Cassandra a nástroji pro jeho správu. Dále praktická ukázka obsahuje základní operace vykonávané nad vzorovou databází s pomocí interaktivního rozhraní příkazové řádky označované jako Cassandra CLI. Cílem této kapitoly je seznámit čtenáře, jak pracovat s databázovým systémem Apache Cassandra a poukázat na některé jeho specifika. Hlavním cílem práce je seznámit čtenáře s nejdůležitějšími vlastnostmi a představiteli NoSQL databází a s jejich možnou využitelností v praxi.
Geografické informační systémy
Vodička, Ondřej ; Palovská, Helena (vedoucí práce) ; Strossa, Petr (oponent)
Diplomová práce se zaměřuje na geografické databázové systémy (GIS). První část je věnována charakteristice GIS, ukazuje jejich specifika a představuje význam standardizace v této oblasti. V druhé části je zachycen aktuální stav na trhu GIS softwaru. GIS software je rozdělen na kategorie podle poskytované funkčnosti a zároveň na open source a komerční část. Na základě jednotlivých kategorií jsou pak charakterizovány nejvýznamnější GIS produkty. Další část se samostatně věnuje produktům firmy Oracle, které jsou touto společností nabízeny v souvislosti GIS. Poslední část představuje soubor možností, námětů a doporučení pro návrh architektury GIS v kontextu produktové řady firmy ESRI.
Extrakce informací z webových stránek pomoci extrakčních ontologií
Labský, Martin ; Berka, Petr (vedoucí práce) ; Strossa, Petr (oponent) ; Vojtáš, Peter (oponent) ; Snášel, Václav (oponent)
S rozvojem Internetu a růstem množství textových dokumentů vzrostla během posledního desetiletí poptávka po nástrojích pro automatickou extrakci informací (IE - information extraction). Úkolem IE je nalézt v analyzovaných dokumentech údaje předem specifikovaného sémantického typu a tyto extrahovat pro potřeby dalších aplikací. Analyzovanými dokumenty mohou přitom být webové stránky, e-maily, dokumenty uvnitř firemních informačních systémů, ale i běžné textové zdroje jakými jsou noviny a časopisy. Aplikace, které nejčastěji využívají výsledky IE, zahrnují tradiční textové vyhledávače, které lze pomocí IE rozšířit o tzv. strukturované vyhledávání, dále systémy pro automatické zodpovídání otázek nebo např. aplikace pro podporu posuzování kvality webových stránek. Tato práce se zabývá vývojem metod a nástrojů pro IE, které jsou obzvláště vhodné pro extrakci ze semi-strukturovaných dokumentů, jakými jsou webové stránky, a pro situace kdy existuje málo trénovacích dat. Hlavním přínosem této práce je navržený přístup rozšířených extrakčních ontologií, který v sobě kombinuje využití extrakčních znalostí tří typů: (1) expertem zadané extrakční znalosti, (2) znalosti naučené z trénovacích dat a (3) znalosti indukované na základě opakující se formátovací struktury, která se často ve webových stránkách nachází. Naše hypotéza je, že současné využití všech tří typů znalostí extrakčním algoritmem může přispět k celkové přesnosti a robustnosti extrakce. Motivací pro tuto práci byl malý počet dosud popsaných metod pro IE, které by využívaly všechny zmíněné typy extrakční znalosti. Jako první je v tomto textu popsán statistický trénovaný přístup k IE založený na skrytých markovských modelech, který je dále integrován s několika trénovanými klasifikátory obrázků tak, aby bylo možno extrahovat jak textové položky, tak obrázky. Přístup je demonstrován a hodnocen na úloze extrakce popisů bicyklů nabízených různými internetovými obchody. Popsáno je i několik algoritmů pro klasifikaci obrázků s použitím různých množin rysů pro klasifikaci. Tyto trénované přístupy jsou posléze integrovány v rámci navržené metody rozšířených extrakčních ontologií, navazující na práci D.W. Embleyho, kterou rozšiřuje o současné využití všch tří výše zmíněných typů extrakční znalosti. Zamýšlenými přínosy extrakčních ontologií jsou rychlý vývoj funkčního prototypu, jeho plynulý přechod do finální IE aplikace a možnost využít různá množství tří typů extrační znalosti podle jejich dostupnosti. Protože extrakční ontologie je typicky odvozena z vhodné doménové ontologie a zůstává ve středu extrakčního procesu, minimalizuje tento přístup úsilí nutné pro zpětnou konverzi extrahovaných výsledků pro populaci zdrojové ontologie či datového schématu. Výsledky navrženého přístupu jsou prezentovány pro několik reálných domén.
Možnosti použití databázového systému CouchDB
Pultera, Ondřej ; Palovská, Helena (vedoucí práce) ; Strossa, Petr (oponent)
Práce se zabývá možnostmi použití dokumentově orientovaného databázového systému Apache CouchDb. V první kapitole vysvětluji základní teoretické pojmy a principy související s databázovým systémem CouchDb. Ve stručnosti zde také představuji databázové systémy založené na relačním modelu. Druhá kapitola se věnuje architektuře a vlastnostem Apache CouchDb. Zamýšlím se zde nad důvody vzniku Apache CouchDb. Kapitola zároveň popisuje principy běhu Apache CouchDb v distribuovaném prostředí. V třetí kapitole se zabývám případovými studiemi a popisuji zde úspěšné implementace Apache CouchDb. Cílem této kapitoly je čtenáři nastínit případy, ve kterých je vhodné využit Apache CouchDb. V další kapitole se pak věnuji praktické práci s Apache CouchDb. Zmiňuji zde nástroj pro správu databáze a konkrétní možnosti nastavení. Dále je zde praktická ukázka jak provádět základní operace přes HTTP rozhraní pomocí příkladů. Příklady jsou realizované pomocí skriptovacích jazyků PHP a JavaScript. Cílem této kapitoly je čtenáři představit Apache CouchDb z pohledu vývojáře nebo správce. Čtenář by na základě této práce měl porozumět nejpodstatnějším vlastnostem Apache CouchDb a být schopen rámcově určit využitelnost tohoto databázového systému pro konkrétní aplikace.
Efektivní metody detekce plagiátů v rozsáhlých dokumentových skladech
Přibil, Jiří ; Jiroušek, Radim (vedoucí práce) ; Strossa, Petr (oponent) ; Snášel, Václav (oponent)
Práce se zaměřuje na problematiku detekce plagiátů v rozsáhlých dokumentových skladech. Bere přitom v úvahu reálnou situaci, kterou je třeba v současné době řešit i v prostředí univerzit v České republice a navrhuje takový systém, který bude schopen tuto analýzu provádět v reálném čase a bude přitom schopen zachytit co nejširší spektrum plagiátorských postupů. Hlavním přínosem práce je přitom definice tzv. neuspořádaných n-gramů -- {n}-gramů -- které jsou využitelné právě pro detekci některých pokročilejších forem plagiátorských postupů. Veškerá uváděná doporučení, která se týkají jednotlivých komponent systému pro odhalování plagiátů -- předzpracování dokumentu před vložením do dokumentového skladu; způsob reprezentace dokumentů v dokumentovém skladu; identifikace potenciálních zdrojů plagiá-torství; výpočet měr shodnosti; vizualizace výsledků analýzy plagiátorství -- jsou podrobeny diskuzi a příslušně kvantifikovány. Výsledkem práce je návrh parametrů systému tak, aby byl schopen v podmínkách českého jazyka odhalovat plagiáty rychle, přesně a přitom v co nejvíce formách.
Návrh databáze pro hotely a penziony
Vojtek, Michal ; Palovská, Helena (vedoucí práce) ; Strossa, Petr (oponent)
Tato bakalářská práce se zabývá analýzou, návrhem a v neposlední řadě implementací databázového řešení pro hotely a penziony. Hlavním cílem této práce je navrhnout provozuschopné databázové řešení pokrývající funkčnost rezervačního, online přístupového, fakturačního a reklamačního systému. Jedná se tedy o komplexní databázové řešení poskytující informační podporu jak při běžném provozu, tak i pro práci managementu. Vedlejšími stanovenými cíli jsou způsoby, jakými bude databáze využívána, a identifikace uživatele, který bude databázi využívat. Celá práce je zpracována na základě vlastních zkušeností s danou problematikou. První část této práce představuje systémy pracující s touto databází, nejsou tím myšleny konkrétní aplikace, ale pouze v obecné rovině vymezené systémy, u kterých je nastíněna možná využitelnost této databáze. Druhá část se věnuje možnostem, které databáze přináší pro konkrétní osoby přicházející do styku s touto databází. Třetí část popisuje konceptuální datový model, proto se seznámíme s významem všech jeho entit a vztahů, zároveň tato část objasňuje použití integritních omezení. Čtvrtá část představuje další integritní omezení a věnuje se přizpůsobení databáze pro RDBMS Oracle Database Express Edition 10g, ve kterém byla databáze z hlediska funkčnosti testována. Poslední část se věnuje návrhu bezpečnostních opatření. Tato část obsahuje definici přístupových oprávnění k tabulkám, dále představuje vytvořené pohledy, které uživatelům omezují množství viditelných dat, a v neposlední řadě uložené procedury sloužící k automatizaci některých činností.
Návrh databáze pro web o běžeckých závodnících
Šimůnek, Dominik ; Palovská, Helena (vedoucí práce) ; Strossa, Petr (oponent)
Cílem této bakalářské práce je návrh databáze pro web o běžeckých závodnících a vytvoření webové aplikace, která umožní návštěvníkům webu určitá data (převážně o běžcích) přidávat, upravovat či mazat. Důraz je kladen na přesnou specifikaci požadavků po funkcionalitách webu, podle kterých je následně navržen optimální databázový model. Návrh databáze je tedy hlavní částí této práce. Implementace je poté provedena na databázovém systému MySQL. V další části práce je vytvořena webová aplikace pomocí jazyka PHP. Funkčnost aplikace a databázového modelu bude ověřena pomocí skutečných dat vytvořených v rámci této práce, případně importovaných z jiných dostupných zdrojů pro získání většího množství skutečných dat týkajících se běžců. Webová aplikace bude dostupná na internetu pro libovolného návštěvníka.

Národní úložiště šedé literatury : Nalezeno 24 záznamů.   předchozí11 - 20další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.