Národní úložiště šedé literatury Nalezeno 32 záznamů.  začátekpředchozí21 - 30další  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Určování typů entit na základě extrakce informací z Wikipedie
Rusiňák, Petr ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je identifikovat typy článků na Wikipedii (např. rozlišit články o osobách od článků o sportovních utkáních), přičemž tento systém by měl být použitelný pro libovolný typ extrahované entity. Vstupem pro tento systém je seznam několika vzorových článků patřících do hledané entity a seznam několika článků nepatřících do této entity. Na základě těchto seznamů budou vygenerovány příznaky, které lze použít k nalezení všech článků patřící do této entity. Tyto příznaky mohou být založeny jak na základě strukturovaných informací na Wikipedii (např. šablony, kategorie), tak i na základě analýzy přirozeného textu v první větě článku, kde bude nalezeno definiční podstatné jméno vystihující entitu daného článku. Tento systém podporuje extrakci česky a anglicky psaných článků a je rozšířitelný pro podporu dalších jazyků.
Autorství a aktérství na české Wikipedii
Sedláček, Štěpán ; Abu Ghosh, Yasar (vedoucí práce) ; Kuřík, Bohuslav (oponent)
Autor prováděl etnografickou studii české Wikipedie při které mapoval lidské i nelidské aktéry, kteří se podílejí na tvorbě a chodu internetové encyklopedie. V rámci tohoto procesu se sám stával jedním z wikipedistů a reflektoval, jak je konstruováno autorství, vyjednávání významů a dohled nad uživateli.
Creating a Bilingual Dictionary using Wikipedia
Ivanova, Angelina ; Zeman, Daniel (vedoucí práce) ; Straňák, Pavel (oponent)
Název práce: Tvorba dvojjazycného slovníku s použitím Wikipedie Autor: Angelina Ivanova Katedra/ Ústav: Ústav formální a aplikované lingvistiky (32-ÚFAL) Vedoucí diplomové práce: RNDr. Daniel Zeman Ph.D. Abstrakt: Strojove citelné slovníky hrají duležitou roli v pocítacové lingvistice. Osved- cily se v oblastech jako je strojový preklad a mezijazykové dobývání informací. V této práci zkoumáme kvalitu a obsah dvojjazycných anglicko-ruských slovníku automaticky získaných z Wikipedie. Slovníky získané z Wikipedie (zde jim pro jednoduchost ríkáme Wiki-slovníky, ale tento pojem nelze zamenovat s Wikislovníkem na http://cs.wiktionary.org) se podstatne liší od tradicních slovníku: pokrytí základní terminologie z Muellerova slovníku je 7,42 %. Pokusy s Wiki-slovníky zabudovanými do trénovacích dat pro strojový preklad vedly k malému, nicméne statisticky významnému poklesu kvality prekladu ve srovnání s experimenty bez Wiki-slovníku. Predpokládáme, že hlavním duvodem je rozdílnost domén mezi slovníkem a korpusem. Na testovacích datech získaných z clánku Wikipedie naopak slovník kvalitu prekladu zlepšuje. V této práci ukazujeme, jak velký je rozdíl mezi slovníky získanými ze struk- tury Wikipedie a tradicními slovníky. Wiki-slovníky...
Extrakce informací z Wikipedie
Krištof, Tomáš ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Tato bakalářská práce se zabývá problematikou extrakce informací z nestrukturovaného textu. V první části jsou čtenáři přiblíženy jednotlivé metody, které se v informačních tech- nologiích používají k extrakci informací. Následně je popsán návrh a realizace systému, který získává požadovaná data ze zadaných článků internetového serveru Wikipedie. V po- slední části práce je provedena analýza dosažených výsledků.
Automatická tvorba tezauru z wikipedie
Novák, Ján ; Schmidt, Marek (oponent) ; Otrusina, Lubomír (vedoucí práce)
Tato práce se věnuje problematice automatické tvorby tezauru z Wikipedie. Obsahuje popis struktury Wikipedie jako vhodné datové sady pro tvorbu tezauru a popisuje některé metody výpočtu sémantické blízkosti termínů, které budou využity při tvorbě tezauru. Dále obsahuje popis návrhu a implementace systému pro automatickou tvorbu tezauru z Wikipedie. Na závěr je provedeno vyhodnocení výsledků systému.
Znalec encyklopedie
Krč, Martin ; Schmidt, Marek (oponent) ; Smrž, Pavel (vedoucí práce)
Předmětem projektu je systém pro zodpovídání otázek formulovaných v přirozeném jazyce. Práce pojednává nejprve o problémech spjatých se systému tohoto druhu a o některých uplatňovaných přístupech. Důraz je kladen na povrchové metody, které nejsou tolik náročné na dostupnost lingvistických zdrojů. V praktické části je pak popsán návrh systému, který zodpovídá faktografické otázky s využitím české Wikipedie jako zdroje informací. Extrakce odpovědí je založena zčásti na specifických rysech Wikipedie a zčásti na ručně předdefinovaných vzorech. Výsledky ukazují, že pro zodpovídání jednoduchých otázek je systém výrazně přínosnější než běžný vyhledávací stroj.
Extrakce informací z Wikipedie
Musil, Martin ; Otrusina, Lubomír (oponent) ; Schmidt, Marek (vedoucí práce)
Tato bakalárská práce se zabývá tématem automatické extrakce informací z textu. Cílem je vytvorení aplikace, která za užití extrakcních vzoru získává znalosti z clánku informacního internetového serveru Wikipedie. V úvodu jsou vysvetleny základní pojmy této problematiky, hlavní cást práce se venuje experimentum a predevším samotné implementaci rozdelené do dvou cástí - zpracování textu a následného získávání informací. Vyhodnocením projektu je pak samotná analýza výsledku experimentu a efektivita vytvorených pravidel.
Systém pro vyhledávání a výběry relevantních článků z Wikipedie podle tématu
Suchý, Ondřej ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Cílem této práce je navrhnout a implementovat systém, který umožní výběr tematicky zaměřených článků z Wikipedie za účelem úspory místa při jejím offline uložení. Řešení tohoto problému je dosaženo s využitím metod spadajících do oblasti vyhledávání informací a jejich konkrétní implementací v rámci nástroje Elasticsearch. Systém se na základě zadaných klíčových slov snaží určit, o jakou tematickou oblast se uživatel zajímá a články z této oblasti zařadit do výsledného výběru. K tomu využívá především mechanismy pro určení podobných dokumentů a zahrnutí všech článků z kategorií, které se ve výběru často opakují. Velikosti souborů generovaných výsledným systémem na základě dotazů nad Simple English Wikipedia se obvykle pohybují pod 30 MB.
Metody extrakce informací
Adamček, Adam ; Smrž, Pavel (oponent) ; Kouřil, Jan (vedoucí práce)
Cílem procesu extrakce informací je získání relačních dat z textu psaného přirozeným jazykem na další jednodušší zpracování výpočetní technikou. Oblast využití takto získaných informací je široká - od sumarizace textů, přes vytváření ontologií až po zodpovídání otázek QA systémy. Tato práce popisuje návrh a implementaci systému fungujícího ve výpočetním clusteru, který transformuje výpis článků Wikipedie na množinu vyextrahovaných informací, které jsou následně uloženy do distribuované RDF databáze a je nad nimi možné sestavovat dotazy prostřednictvím vytvořeného uživatelského rozhraní.

Národní úložiště šedé literatury : Nalezeno 32 záznamů.   začátekpředchozí21 - 30další  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.