Pytelka, Petr - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: Pytelka, Petr

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

Národní úložiště šedé literatury	Nalezeno 2 záznamů.	Hledání trvalo 0.01 vteřin.

Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce
Pytelka, Petr ; Strossa, Petr (vedoucí práce) ; Pinkas, Otakar (oponent)
Cílem práce je měření kvality lemmatizace pro český jazyk v systémech zpracování doku-mentů a analýza výsledků tohoto měření. V teoretické části práce je popsán princip plno-textového vyhledávání, možnosti realizace lemmatizace a běžné problémy, které je nutné řešit při zpracování přirozeného jazyka. V práci jsou diskutovány možnosti hodnocení kva-lity lemmatizace pomocí měření přesnosti a úplnosti vyhledávání. Pro detailnější hodnocení lemmatizátoru je popsána metoda měření nadměrné a nedostatečné lemmatizace. V druhé části práce je navržen experiment a testovací aplikace pro měření kvality lemmati-zace ve třech systémech, které jsou používány pro realizaci vyhledávání dokumentů. Jedná se o knihovnu Apache Lucene, databázové systémy PostgreSQL a Microsoft SQL Server. Experiment je prováděn s využitím Pražského závislostního korpusu, a to pro korpus jako celek a zvlášť pro vybrané slovní druhy. Rozbor výsledků pro výchozí lemmatizátor pro český jazyk v Lucene umožnil návrh několika drobných úprav, které vedou k měřitelnému zlepšení vyhledávání. Výsledky práce ukazují, jak lze využít uvedené metriky a podrobné výsledky pro zlepšování lemmatizačních algoritmů a tím i pro zkvalitnění plnotextového vyhledávání pro český jazyk.

Úplný záznam

Uložení hierarchických dat a nestrukturovaných dat s využitím Java Content Repository
Pytelka, Petr ; Pavlíčková, Jarmila (vedoucí práce) ; Feuerlicht, Jiří (oponent)
Práce podává přehled možností uložení hierarchických a nestrukturovaných dat, které poskytují standardy JSR-170 a JSR-283 - "Content Repository for Java". Východiskem práce je v první části teorie grafů, na jejímž základě autor definuje termín hierarchických dat. Zde jsou také ukázány další metody ukládání dat od souborových systémů, databázových systémů až po systémy správy dokumentů. Popis standardu JSR-283 v další části přináší detailnější pohled na jeho možnosti. Následně je provedeno srovnání možnosti relačních, objektově-relačních databází a možnosti, které poskytují jednotlivé techniky objektově relačního mapování. Detailnější pohled je věnován referenční implementaci JackRabbit. Jsou na ní ukázány základy práce s příslušným API. Součástí práce je také případová studie, v níž je realizována vnitřní část systému správy dokumentů. Na této studii jsou provedena měření výkonosti referenční implementace JackRabbit. Vyústěním práce je vytvoření sady kritérií, kdy je vhodné využít pro uložení hierarchických a nestrukturovaných dat repozitář dle standardu JSR-170/283, případně přímo implementaci JackRabbit.

Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English