Název:
Automatická klasifikace smluv pro portál HlidacSmluv.cz
Překlad názvu:
Automated contract classification for portal HlidacSmluv.cz
Autoři:
Maroušek, Jakub ; Nečaský, Martin (vedoucí práce) ; Holub, Martin (oponent) Typ dokumentu: Diplomové práce
Rok:
2020
Jazyk:
cze
Abstrakt: [cze][eng] Registr smluv je veřejná databáze obsahující smlouvy uzavřené institucemi veřejné správy. Vzhledem k množství publikovaných dokumentů je však analýza dat problema- tická. Cílem práce je za použití metod strojového učení naleznout postup pro rozdělení smluv do kategorií podle oblastí (realitní služby, stavitelství a podobně) a tento postup implementovat pro použití na webovém portálu Hlídač státu. Komplikaci představuje velké množství kategorií a fakt, že není k dispozici žádná sada již označených smluv. 1The Contracts Register is a public database containing contracts concluded by public institutions. Due to the number of documents in the database, data analysis is proble- matic. The objective of this thesis is to find a machine learning approach for sorting the contracts into categories by their area of interest (real estate services, construction, etc.) and implement the approach for usage on the web portal Hlídač státu. A large number of categories and a lack of a tagged dataset of contracts complicate the solution. 1
Klíčová slova:
e-government; klasifikace dokumentů; multilabel klasifikace; strojové učenı́; transfer learning; document classification; e-government; machine learning; multi-label classification; transfer learning