keywords:"Data extraction" - Výsledky hledání - Digitální repozitář

host :: přihlásit Digitální repozitář
		Hledej		Nový záznam		Nápověda		O repozitáři

Hlavní stránka > Výsledky hledání: keywords:"Data extraction"

Hledej:

Tipy pro vyhledávaní :: Rozšířené hledání

Hledej ve sbírkách:

Seřadit podle:	Zobrazit výsledky:	Výstupní formát:

	Systém pro rozpoznávání dezinformací v prostředí webu Večerka, Lukáš ; Žádník, Martin (oponent) ; Strnadel, Josef (vedoucí práce) Tato práce se zabyvá návrhem, realizací a ověřením systému pro automatické rozpoznávání dezinformací v prostředí webu. Představuje problematiku šíření dezinformací v online prostředí a jeho dopad na společnost. Zaměřuje se na trénování několika Českych transformers jazykovych modelů pro rozpoznání dezinformací a dále na automatickou extrakci obsahu článků z českych internetovych novin a jejich analyzu využitím klasifikace textu a zpracování přirozeného jazyka pomocí metod hlubokého učení. Vysledky těchto analyz jsou pak prezentovány na webovém uživatelském rozhraní s cílem poskytnout platformu pro ověření článků, autorů a zdrojů. Rozhraní by mohlo byt použito k anotaci dat experty pro průběžné vylepšování jazykovych modelů. Úplný záznam
	Development of YARA-X ecosystem Ďuriš, Tomáš ; Křivka, Zbyněk (oponent) ; Regéciová, Dominika (vedoucí práce) The aim of this work is to extend and create an unified ecosystem of tools for the YARA language. The focus is on incorporating modules that can gather information about the structure of executable files. Additionally, a module that can present obtained information to the user in multiple formats is also being proposed. An interactive environment has been created for evaluating YARA rules and enhancing the overall ecosystem by using an error-tolerant parsing algorithm. The proposed solution enables the seamless integration and utilization of existing tools while addressing the limitations of the original YARA ecosystem. The output of the work is an extended system with tools that facilitate the debugging of YARA rules, obtaining information from executable files, and visualizing them. The final solution has been thoroughly tested, utilized by analysts, and integrated into main YARA-X branch. Úplný záznam
	Automatic Additions and Corrections of Wikidata and Wikipedia Based on Information Extraction Hložek, Matej ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce) This bachelor's thesis is focused on creation of system for automatic extraction of data from articles in English language from internet encyclopedia site Wikipedia. Depending on class given by text classifier, different types of information are extracted from natural language text and from so called infoboxes of individual articles from Wikipedia. Final product of this system is a knowledge base containing all extracted data and classified type. A notable part of this system is an article extractor that extracts infoboxes and first paragraphs of articles from so called wikidump file. Úplný záznam
	Detection of Nudity in an Image Data Pešková, Daniela ; Orság, Filip (oponent) ; Goldmann, Tomáš (vedoucí práce) The focus of this thesis is the creation of a tool capable of detecting nudity in image data. This is achieved by training a model to detect incriminated body parts and creating an algorithm capable of detecting skin. The resulting tools can be used for automatic nudity detection in images. The first part of the thesis focuses on the theory of neural networks and computer vision, with an emphasis on skin detection. The second part discusses the approach chosen for creating the dataset, the process of creation and training the model capable of detecting nudity in images, as well as the algorithmic approach. Úplný záznam
	Inteligentní extrakce dat ve webovém prohlížeči Maštera, František ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce) Cílem této práce je získání dat z webových stránek bez znalosti jejich vnitřní struktury. Podstatou je rozpoznání této struktury pomocí algoritmu a zadaným vstupním informacím o obsahu, který chce uživatel extrahovat. Po analýze struktury následuje extrakce samotného obsahu. Na vybraných sadách internetových stránek se podařilo dosáhnout průměrné úspěšnosti přes 80%. Výsledný algoritmus představuje nový přístup k extrakci dat a může být nasazen v reálném světě, nebo může být součástí dalšího vývoje. Úplný záznam
	Rozšíření Apache Tika o extrakci textu ze souborů průmyslových formátů Rešetár, René ; Burget, Radek (oponent) ; Rychlý, Marek (vedoucí práce) Cieľom bakalárskej práce bolo rozšíriť syntaktické analyzátory projektu Apache Tika o extrakciu tabuliek a dát z priemyslových formátov dokumentov z laboratórnych prístrojov. Tieto dáta majú byť uložené v štruktúrovanom formáte podľa určitej schémy. V teoretickej časti boli preskúmané dodané industriálne formáty, projekt Apache Tika a možnosti jeho rozšírenia. V praktickej časti bol navrhnutý a implementovaný nástroj, ktorý dokumenty pomocou projektu Apache Tika klasifikuje, spracuje, vytvára z nich štruktúrované dáta vo formáte JSON a tie následne validuje. Na záver bola vytvorená sada testov pre overenie a demonštráciu vlastností riešenia. Úplný záznam
	Vyhledávání objektů v obraze na základě předlohy Novák, Pavel ; Mašek, Jan (oponent) ; Burget, Radim (vedoucí práce) Tato práce se zabývá detekcí objektů v obraze na základě předlohy. Hlavním přínosem práce je nová metoda extrakce příznaků histogramu orientovaných gradientů používající sadu komparátorů pro extrakci dat. V práci jsou popsány použité metody komparace a extrakce. Hlavní část je věnována především metodě histogramu orientovaných gradientů, ze které vycházíme. V práci je užita malá sada trénovacích obrazů (celkem 100) ověřená křížovou validací, následně ověřená na reálných scénách. Dosažená úspěšnost křížové validace je až 98% pro SVM algoritmus. Úplný záznam
	Analýza postojů v oblasti automobilového průmyslu Bezák, Adam ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce) Cieľom tejto práce je oboznámiť sa so základnými metódami analýzy postojov na sociálnych sieťach. Téma práce je zameraná na automobilový priemysel, avšak princíp práce je možné použiť na akékoľvek iné skúmané odvetie. Podstatou praktickej časti je získanie dát zo sociálnych sietí, ich analýza a následná indexácia do ElasticSearch databáze. Ďaľším cieľom práce je tieto dáta vizualizovať prostredníctvom portálu. Vytvorený webový portál poskytuje rôzne štatistiky popredných automobilových značiek, prehľad nových trendov alebo vizualizáciu názorov na konkrétne aspekty jednotlivých automobilov. Úplný záznam
	Vztah změn sázkových kurzů a výsledků fotbalových zápasů Jurkovič, Juraj ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce) Cieľom tejto práce je demonštrovať techniky pre riešenie úloh extrakcie dát z webu a získavania znalostí z dát. Prípadová štúdia je zameraná na zber dát zo stávkových kancelárií a následnú analýzu týchto dát. Práca demonštruje riešenie úlohy získavania dát z webu v jazyku Python. Práca popisuje vybrané implementačné detaily pre vytvorenie systému na zber dát z webu a navrhuje schému databázy, ktorá môže byť v tomto systéme použitá. Získané dáta sú analyzované štatistickými metódami a vo vývojoch cien kurzov sú objavované frekventované vzory pomocou apriori algoritmu. Pozorované vzťahy a objavené frekventované vzory sú prezentované koncovému užívateľovi. Úplný záznam
	Methods of Data Extraction from the Web Perina, Lukáš ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce) The purpose of this bachelor thesis is to design an architecture and subsequent implementation of an application designed for data extraction (web scraping) from web documents. Unlike conventional methods, it is an extraction based on defining data types and regular expressions of requested elements. Extraction is executed in such a manner, where it is not necessary to know the detailed structure of given web document and the possibility of using just one definition to detect requested elements on different web pages. Algorithm is able to achieve overall accuracy of 85,51% and recall 80,28%. This approach can reduce the time required for analysis of web pages significantly and not to take the structure of the code as a determining factor while creating web scraping requests. Úplný záznam

Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.

Digitální repozitář :: :: :: ::
Powered by v1.1.2
Spravuje

Tato stránka je dostupná také v následujících jazycích:
Česky English