Original title:
Pokročilý porovnávač produktov
Authors:
Prexta, Dávid Document type: Master’s theses
Year:
2019
Language:
slo Abstract:
[cze][eng] Tato práce se zabývá problematikou dolování strukturovaných informací týkajících se vlastností produktů z otevřeného textu, využitím otevřené extrakce informací. Tyto vlastnosti usnadní zákazníkům rozhodování při výběru produktu. Na začátku se zabývá stávajícími řešeními, jejich nedostatky a analýzou dostupných systémů pro otevřenou extrakci informací. Dále jsou probrány teoretické podklady a technologie použité při návrhu systému, návrh samotného systému a jeho implementace. V závěru je popsáno testování systému, jeho výsledky a navržená rozšíření, které by bylo možné implementovat do budoucna.This thesis deals with the problem of mining structured information concerning the features of the products from the open text, using open information extraction. These features will make it easier for customers to choose their product. In the beginning, it deals with existing solutions, their shortcomings and analysis of available systems for open information extraction. Furthermore, the theoretical background and technology used in the creation of the system, the design of the system itself and its implementation are discussed. At the end, the system testing, its results and extensions that could be implemented in the future are described.
Keywords:
extrakce vlastnosti produktů; otevřená extrakce informací; TF-IDF; vektorová sémantika; velké data; zpracování přirozeného jazyka