| |
|
Vyhledávání a grafová struktura webu
Húsek, Dušan ; Řezanková, H. ; Snášel, Václav
Příspěvek je věnován možnostem využití grafové struktury webu při vyhledávání a prezentování výsledků vyhledávání. Využití strukturních vlastností webu umožňuje obohacení existujících přístupů k vyhledávání o nové principy. Vzhledem k rozsáhlosti dané problematiky je v příspěvku uveden stručný přehled známých výsledků a řešení.
|
| |
|
Efektivní metody detekce plagiátů v rozsáhlých dokumentových skladech
Přibil, Jiří ; Jiroušek, Radim (vedoucí práce) ; Strossa, Petr (oponent) ; Snášel, Václav (oponent)
Práce se zaměřuje na problematiku detekce plagiátů v rozsáhlých dokumentových skladech. Bere přitom v úvahu reálnou situaci, kterou je třeba v současné době řešit i v prostředí univerzit v České republice a navrhuje takový systém, který bude schopen tuto analýzu provádět v reálném čase a bude přitom schopen zachytit co nejširší spektrum plagiátorských postupů. Hlavním přínosem práce je přitom definice tzv. neuspořádaných n-gramů -- {n}-gramů -- které jsou využitelné právě pro detekci některých pokročilejších forem plagiátorských postupů. Veškerá uváděná doporučení, která se týkají jednotlivých komponent systému pro odhalování plagiátů -- předzpracování dokumentu před vložením do dokumentového skladu; způsob reprezentace dokumentů v dokumentovém skladu; identifikace potenciálních zdrojů plagiá-torství; výpočet měr shodnosti; vizualizace výsledků analýzy plagiátorství -- jsou podrobeny diskuzi a příslušně kvantifikovány. Výsledkem práce je návrh parametrů systému tak, aby byl schopen v podmínkách českého jazyka odhalovat plagiáty rychle, přesně a přitom v co nejvíce formách.
|
|
Ontology Learning and Information Extraction for the Semantic Web
Kavalec, Martin ; Berka, Petr (vedoucí práce) ; Štěpánková, Olga (oponent) ; Snášel, Václav (oponent)
The work gives overview of its three main topics: semantic web, information extraction and ontology learning. A method for identification relevant information on web pages is described and experimentally tested on pages of companies offering products and services. The method is based on analysis of a sample web pages and their position in the Open Directory catalogue. Furthermore, a modfication of association rules mining algorithm is proposed and experimentally tested. In addition to an identification of a relation between ontology concepts, it suggest possible naming of the relation.
|