Národní úložiště šedé literatury Nalezeno 76 záznamů.  začátekpředchozí56 - 65dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Extrakce informací ze slabě strukturovaného textu
Minárik, Matej ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
V dnešnej dobe sa stretávame s pojmom Web 2.0, ktorý predstavuje web dokumentov. Dokumenty na webe sú dostupné vo väčšine prípadov v neštruktúrovanej, alebo čiastočne štruktúrovanej podobe. Pre lepšie a jednoduchšie vyhľadávanie však potrebujú mať vyhľadávače dáta v štruktúrovanej podobe. Práca sa zameriava na analýzu spôsobov extrakcie informácií z neštruktúrovaného textu. V práci analyzujeme jednak použitie rôznych typov klasifikátorov, ale aj metód, ktoré nepotrebujú mať k dispozícii anotované dáta na trénovanie interných modelov. Ďalej navrhujeme metódu na extrakciu terapeutických indikácií a účinných látok z príbalových letákov liekov.
Extrakce textových dat z internetových stránek
Troják, David ; Morský, Ondřej (oponent) ; Červenec, Radek (vedoucí práce)
Tato práce se zabývá dolováním textových údajů z webových stránek, přehledem možných programů a způsoby extrakce textu. Součástí je program, vytvořený v programovacím jazyku Java, který umožňuje získávat textová data z konkrétních webových stránek a ukládat je do xml souboru.
Extrakce metadat z vědeckých článků
Lokaj, Tomáš ; Dytrych, Jaroslav (oponent) ; Otrusina, Lubomír (vedoucí práce)
Tato práce se zabývá extrakcí metadat z vědeckých článků. Je zde obecně popsán problém extrakce informací se zaměřením na zpracování textových dokumentů. Dále je představen autorem vytvořený program clanky2meta.py určený k vyhledávání potřebných informací ve vědeckých publikacích. V závěru práce je provedeno srovnání toho programu s jinými systémy, především se systémem CiteSeerX.
Podpora extrakce informací ze strukturovaného textu
Kliment, Radek ; Petřík, Patrik (oponent) ; Křivka, Zbyněk (vedoucí práce)
Tato bakalářská práce se zabývá způsobem extrakce informací ze strukturovaných textů. Výsledná aplikace provede převod textů podporovaných formátů na XML reprezentaci, nad kterou jsou následně prováděny dotazy, pomocí nichž je vytvořen odpovídající výstup. V práci jsou popsány jednotlivé vstupní formáty, způsob jejich převodu na XML, dále návrh a implementace aplikace, včetně stručného návodu k ovládání.
Extrakce vztahů mezi pojmenovanými entitami zmíněnými v textu
Voháňka, Ondřej ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato bakalářská práce se zabývá extrakcí vztahů. Vysvětluje základní znalosti nutné pro vývoj extrakčních systémů. Dále popisuje návrh, implementaci a srovnání tří vlastních systémů, které jsou řešeny jinými způsoby. Jsou použity metody jako regulární výrazy, NER a syntaktická analýza. 
Extrakce informací z Wikipedie
Krištof, Tomáš ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato bakalářská práce se zabývá problematikou extrakce informací z nestrukturovaného textu. V první části jsou čtenáři přiblíženy jednotlivé metody, které se v informačních tech- nologiích používají k extrakci informací. Následně je popsán návrh a realizace systému, který získává požadovaná data ze zadaných článků internetového serveru Wikipedie. V po- slední části práce je provedena analýza dosažených výsledků.
Znalec encyklopedie
Krč, Martin ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
Předmětem projektu je systém pro zodpovídání otázek formulovaných v přirozeném jazyce. Práce pojednává nejprve o problémech spjatých se systému tohoto druhu a o některých uplatňovaných přístupech. Důraz je kladen na povrchové metody, které nejsou tolik náročné na dostupnost lingvistických zdrojů. V praktické části je pak popsán návrh systému, který zodpovídá faktografické otázky s využitím české Wikipedie jako zdroje informací. Extrakce odpovědí je založena zčásti na specifických rysech Wikipedie a zčásti na ručně předdefinovaných vzorech. Výsledky ukazují, že pro zodpovídání jednoduchých otázek je systém výrazně přínosnější než běžný vyhledávací stroj.
Rámec pro extrakci informace z WWW
Brychta, Filip ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Prostředí webu se postupně vyvinulo v nejrozsáhlejší zdroj dokumentů v elektronické podobě, takže by bylo velice výhodné, informace v těchto dokumentech zpracovávat automaticky. To však není jednoduchý úkol, protože většina dokumentů je napsána v HTML (Hypertext Markup Language), který neumožňuje definovat sémantiku dat v těchto dokumentech. Cílem této práce je vytvořit modulární systém pro extrakci informací z HTML dokumentů a jejich další zpracování. Dalším zpracováním se myslí ukládání získaných informací například do XML souboru nebo do relační databáze. Modularita systému umožňuje využití různých extrakčních metod a různých metod pro uložení získaných dat. Díky tomu je systém použitelný pro mnoho různých úloh.
Metody extrakce informace z textových dokumentů
Sychra, Tomáš ; Burget, Radek (oponent) ; Bartík, Vladimír (vedoucí práce)
Získávání znalostí z textových dokumentů představuje podmnožinu obecného získávání dat - dataminingu. Textové dokumenty však mají vlastnosti odlišné od běžných databází. Tato práce obsahuje přehled metod použitelných pro dolování informací z textů. Nejpoužívanější dolovací úlohou je klasifikace. Popíši možné přístupy při klasifikování dokumentů. V závěru představím algoritmus Winnow, který by měl při klasifikaci dosahovat dobrých výsledků v porovnání s ostatními algoritmy. Součástí práce je i popis implementace algoritmu Winnow a přehled dosažených výsledků.
Extrakce dat z popisu zboží
Sláma, Vojtěch ; Očenášek, Pavel (oponent) ; Burget, Radek (vedoucí práce)
Tato práce se zabývá návrhem a implementací systému pro automatizovanou podporu sběru informací o zboží pro účely elektronických obchodů. Uvádí přehled existujících přístupů pro extrakci informací z HTML dokumentů, zejména se zaměřuje na wrappery a metody jejich automatické konstrukce. Zmíněn je i vizuální přístup k extrakci dat z dokumentů. V části zabývající se návrhem jsou formalizovány požadavky na systém a navrženy základní principy systému. Implementační část obsahuje podrobný popis algoritmu pro hledání cest ve stromu dokumentu. V závěru práce jsou zhodnoceny výsledky dosažené při experimentech.

Národní úložiště šedé literatury : Nalezeno 76 záznamů.   začátekpředchozí56 - 65dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.