Národní úložiště šedé literatury Nalezeno 33 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Web page segmentation utilizing clustering techniques
Zelený, Jan ; Šimko, Marián (oponent) ; Kliegr, Tomáš (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Information extraction and other techniques for mining data from the Web get more important with the development of web technologies and raising amount of information stored exclusively on the Web. However, with this information, the amount of content that is completely irrelevant in context of the presented information grows as well. That's only one of the reasons why it is so important to intensively study and develop preprocessing of information stored on the Web. Segmentation algorithms are one of the possible ways of web page preprocessing. This thesis is dedicated to utilization of clustering techniques for improving the efficiency of existing web page segmentation algorithms, as well as finding completely new ones.
Lokální a globální analytické zprávy o výsledcích DZD
Reischig, Zdeněk ; Rauch, Jan (vedoucí práce) ; Kliegr, Tomáš (oponent)
Název práce: Lokální a globální analytické zprávy o výsledcích DZD Autor: Zdeněk Reischig Katedra: Katedra softwarového inženýrství Vedoucí diplomové práce: doc. RNDr. Jan Rauch, CSc. E-mail vedoucího: rauch@vse.cz Abstrakt: Tématem práce je automatická podpora tvorby lokálních analytických reportů, využití těchto reportů jako zdroje dat pro řešení globálních analytických otázek a tvorba globálních analytických reportů. V práci jsou navrženy metody pro porovnávání pravidel. Tyto metody slouží pro řešení globálních analytických otázek, ale mohou být využity i pro usnadnění tvorby lokálních analytických reportů. Pozornost je také věnována různým typům doménových znalostí. Některé z nich lze použít k odfiltrování nezajímavých pravidel, nebo k nalezení datových matic s neobvyklými vlastnostmi. Další jsou nezbytné pro řešení globálních analýz nad datovými maticemi využívajícími k popisu stejných vlastností různých metrik atd. Součástí práce je také návrh XML struktury pro zaznamenání výsledků globálních analýz. Tato struktura může být využita i pro automatické generování globálních reportů. Pro demonstraci uplatnění navržených postupů byla pomocí aplikace 4ft Miner řešena lokální analytická otázka nad medicínskými daty ADAMEK. Výsledky data miningu byly uloženy do systému SEWEBAR a jsou využity k...
Cross-Lingual Information Retrieval in the Medical Domain
Saleh, Shadi ; Pecina, Pavel (vedoucí práce) ; Hanbury, Allan (oponent) ; Kliegr, Tomáš (oponent)
Vícejazyčné vyhledávání informací v oblasti medicíny Shadi Saleh V posledních letech došlo k exponenciálnímu růstu objemu digitálního ob- sahu dostupného na internetu, což koreluje s rostoucím počtem neanglicky mluvících uživatelů internetu v důsledku celosvětového rozšíření internetu. To zvyšuje význam zpřístupnění informací pro ty, kteří si chtějí vyhledat informace bez omezení na jazyky, jimž rozumějí, zejména pro ty, kteří chtějí využít internet k vyhledání lékařského obsahu týkajícího se jejich zdravotního stavu. Získávání informací napříč jazyky (Cross-Lingual Information Retrieval, CLIR) překonává jazykové bariéry tím, že vyhledává dokumenty napsané v jiném jazyce, než je jazyk dotazu. Tato disertační práce se zabývá úlohou CLIR v lékařské doméně v sedmi evropských jazycích. Vyvinuli jsme systémy pro statistický strojový překlad (Statistical Machine Translation, SMT) adaptované na oblast lékařství, které jsou doladěny pro metodu překladu dotazů (Query Translation, QT) a pro metodu překladu dokumentů (Document Translation, DT). Na empirických datech dokládáme, že oproti tomu, co se předpokládalo od konce 90. let., v úloze CLIR v lékařské doméně metoda DT nepředčí metodu QT pro...
Web page segmentation utilizing clustering techniques
Zelený, Jan ; Šimko, Marián (oponent) ; Kliegr, Tomáš (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Information extraction and other techniques for mining data from the Web get more important with the development of web technologies and raising amount of information stored exclusively on the Web. However, with this information, the amount of content that is completely irrelevant in context of the presented information grows as well. That's only one of the reasons why it is so important to intensively study and develop preprocessing of information stored on the Web. Segmentation algorithms are one of the possible ways of web page preprocessing. This thesis is dedicated to utilization of clustering techniques for improving the efficiency of existing web page segmentation algorithms, as well as finding completely new ones.
Big Data approach to sentiment analysis
Handa, Karandeep ; Berka, Petr (vedoucí práce) ; Kliegr, Tomáš (oponent)
Get to know the emotion of the people about brexit
Named Entity Recognition and Linking
Taufer, Pavel ; Straka, Milan (vedoucí práce) ; Kliegr, Tomáš (oponent)
Cílem této diplomové práce je navrhnout a naimplementovat algoritmus pro rozpoznávání a propojování pojmenovaných entit. Součástí tohoto cíle je také navrhnutí a vytvoření báze znalostí, která je v algoritmu použita. Vzhledem k omezenému množství dat pro jiné jazyky než pro angličtinu chceme, aby naši metodu bylo možné natrénovat na jednom jazyku a naučené parametry přenést na jiné jazyky (ve kterých není tolik trénovacích dat). Práce se skládá z popisu dostupných bází znalostí, existujicích metod, navrhnutí a implementace vlastní báze znalostí a metody pro propojování pojmenovaných entit. Na několika variantách tradičního datasetu AIDA CoNLL-YAGO dosahuje implementovaný algoritmus nejlepších známých výsledků. Na vzorku českých anotovaných dat z datasetu PDT dosahuje algoritmus pomocí parametrů natrénovaných na anglickém CoNLL datasetu srovnatelných výsledků. Powered by TCPDF (www.tcpdf.org)
Lokální a globální analytické zprávy o výsledcích DZD
Reischig, Zdeněk ; Rauch, Jan (vedoucí práce) ; Kliegr, Tomáš (oponent)
Název práce: Lokální a globální analytické zprávy o výsledcích DZD Autor: Zdeněk Reischig Katedra: Katedra softwarového inženýrství Vedoucí diplomové práce: doc. RNDr. Jan Rauch, CSc. E-mail vedoucího: rauch@vse.cz Abstrakt: Tématem práce je automatická podpora tvorby lokálních analytických reportů, využití těchto reportů jako zdroje dat pro řešení globálních analytických otázek a tvorba globálních analytických reportů. V práci jsou navrženy metody pro porovnávání pravidel. Tyto metody slouží pro řešení globálních analytických otázek, ale mohou být využity i pro usnadnění tvorby lokálních analytických reportů. Pozornost je také věnována různým typům doménových znalostí. Některé z nich lze použít k odfiltrování nezajímavých pravidel, nebo k nalezení datových matic s neobvyklými vlastnostmi. Další jsou nezbytné pro řešení globálních analýz nad datovými maticemi využívajícími k popisu stejných vlastností různých metrik atd. Součástí práce je také návrh XML struktury pro zaznamenání výsledků globálních analýz. Tato struktura může být využita i pro automatické generování globálních reportů. Pro demonstraci uplatnění navržených postupů byla pomocí aplikace 4ft Miner řešena lokální analytická otázka nad medicínskými daty ADAMEK. Výsledky data miningu byly uloženy do systému SEWEBAR a jsou využity k...
Reálná úloha dobývání znalostí
Kolafa, Ondřej ; Berka, Petr (vedoucí práce) ; Kliegr, Tomáš (oponent)
Hlavní náplní této práce je provedení reálné úlohy dobývání znalostí s cílem klasifikovat držitele termínovaných účtů. Úloha je řešena nad reálnými, anonymizovanými daty bankovních klientů s nízkým stavem finančních prostředků. V souladu s metodikou CRISP-DM je práce prováděna v následujících krocích: porozumění problematice, porozumění datům, příprava dat, modelování, vyhodnocení výsledků a využití výsledků. Úloha dobývání znalostí probíhá v aplikaci RapidMiner. V teoretické části byly popsány postupy a metody aplikované v reálné úloze. Bylo představeno samotné dobývání znalostí z databází se zvláštním přihlédnutím k aplikacím v oblasti řízení vztahů se zákazníky. Dále byla představena metodika CRISP-DM, možnosti úloh, které dobývání znalostí z databází nabízí, a techniky, které jsou k dané úloze vhodné. Rozdíl ve velikosti skupin majitelů a nevlastníků termínovaného účtu byl natolik značný, že muselo dojít k vybalancování trénovacího datového souboru. Do fáze vyhodnocení bylo vybráno celkem dvanáct modelů. Podle zvolených kritérií hodnocení (plocha pod ROC křivkou a F-míra) byly za nejlepší shledány modely logistické regrese a bayesovské sítě). V poslední fázi data miningového procesu je navrženo možné využití výsledků v praxi. Problém je rozpracován pouze formou doporučení a zamyšlení, neboť nebylo možné výsledky aplikovat na reálnou situaci.
Metody učení preferencí
Pichl, Ota ; Kliegr, Tomáš (vedoucí práce) ; Berka, Petr (oponent)
Diplomová práce se zabývá studiem metod učení preferencí. Preference mohou být studovány v mnoha oblastech od ekonomie, přes statistiku až po informatiku. Tato práce se zabývá především preferencemi informatickými. Nejprve se práce věnuje preferencím obecně a studuje jejich původ, jenž se nachází v oblasti ekonomických věd. Následně jsou tyto znalosti využity pro rozbor metod, které již na preference nahlíží pohledem informatickým, přičemž zapojuje i strojové učení a popisuje, jak na sebe jednotlivé vědy navazují. Praktická část práce se soustřeďuje na využití učení informatických preferencí v praxi. Nejprve jsou popsány základní úlohy a metody učení preferencí, což následně navazuje na detailnější rozbor jedné z vybraných metod (UTA NM). Výsledkem je následný popis a implementace webové služby typu REST, díky níž je možné zpracovávat vybranou úlohu učení preferencí a získávat zpět vypočtené modely preferencí.
Analýza reálných dat produktové redakce Alza.cz pomocí metod DZD
Válek, Martin ; Berka, Petr (vedoucí práce) ; Kliegr, Tomáš (oponent)
Tato práce se zabývá analýzou dat pomocí metod dobývání znalostí z databází. Cílem je vybrat vhodné metody a nástroje a použít je pro realizaci konkrétního projektu založeného na reálných datech od produktové redakce společnosti Alza.cz. Analýza dat je prováděna pomocí asociačních pravidel a rozhodovacích pravidel v systému Lisp-Miner a pomocí rozhodovacích stromů v systému RapidMiner. Použitá metodika je CRISP-DM. Práce je rozdělena do třech hlavních částí. Úvodní část se zaměřuje na souhrn teoretických informací o dobývání znalostí z databází. Jsou zde definovány základní pojmy a popsány typy úloh a vybrané metody DZD použitelné pro praktickou část práce. Ve druhé části je představena metodologie CRISP-DM. V praktické části je nejprve představena společnost Alza.cz a její cíle pro tuto úlohu. Následně je popsána základní struktura dat a jejich příprava pro data miningovou úlohu, která po těchto krocích následuje. V závěru jsou vyhodnoceny získané výsledky a nastíněna možnost jejich využití.

Národní úložiště šedé literatury : Nalezeno 33 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.