Národní úložiště šedé literatury Nalezeno 2 záznamů.  Hledání trvalo 0.01 vteřin. 
Jak kvalita lemmatizace ovlivňuje výsledky vyhledávání dokumentů v českém jazyce
Pytelka, Petr ; Strossa, Petr (vedoucí práce) ; Pinkas, Otakar (oponent)
Cílem práce je měření kvality lemmatizace pro český jazyk v systémech zpracování doku-mentů a analýza výsledků tohoto měření. V teoretické části práce je popsán princip plno-textového vyhledávání, možnosti realizace lemmatizace a běžné problémy, které je nutné řešit při zpracování přirozeného jazyka. V práci jsou diskutovány možnosti hodnocení kva-lity lemmatizace pomocí měření přesnosti a úplnosti vyhledávání. Pro detailnější hodnocení lemmatizátoru je popsána metoda měření nadměrné a nedostatečné lemmatizace. V druhé části práce je navržen experiment a testovací aplikace pro měření kvality lemmati-zace ve třech systémech, které jsou používány pro realizaci vyhledávání dokumentů. Jedná se o knihovnu Apache Lucene, databázové systémy PostgreSQL a Microsoft SQL Server. Experiment je prováděn s využitím Pražského závislostního korpusu, a to pro korpus jako celek a zvlášť pro vybrané slovní druhy. Rozbor výsledků pro výchozí lemmatizátor pro český jazyk v Lucene umožnil návrh několika drobných úprav, které vedou k měřitelnému zlepšení vyhledávání. Výsledky práce ukazují, jak lze využít uvedené metriky a podrobné výsledky pro zlepšování lemmatizačních algoritmů a tím i pro zkvalitnění plnotextového vyhledávání pro český jazyk.
Uložení hierarchických dat a nestrukturovaných dat s využitím Java Content Repository
Pytelka, Petr ; Pavlíčková, Jarmila (vedoucí práce) ; Feuerlicht, Jiří (oponent)
Práce podává přehled možností uložení hierarchických a nestrukturovaných dat, které poskytují standardy JSR-170 a JSR-283 - "Content Repository for Java". Východiskem práce je v první části teorie grafů, na jejímž základě autor definuje termín hierarchických dat. Zde jsou také ukázány další metody ukládání dat od souborových systémů, databázových systémů až po systémy správy dokumentů. Popis standardu JSR-283 v další části přináší detailnější pohled na jeho možnosti. Následně je provedeno srovnání možnosti relačních, objektově-relačních databází a možnosti, které poskytují jednotlivé techniky objektově relačního mapování. Detailnější pohled je věnován referenční implementaci JackRabbit. Jsou na ní ukázány základy práce s příslušným API. Součástí práce je také případová studie, v níž je realizována vnitřní část systému správy dokumentů. Na této studii jsou provedena měření výkonosti referenční implementace JackRabbit. Vyústěním práce je vytvoření sady kritérií, kdy je vhodné využít pro uložení hierarchických a nestrukturovaných dat repozitář dle standardu JSR-170/283, případně přímo implementaci JackRabbit.

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.