Název:
Aplikace pro parsování a analýzu obsahu webových stránek
Překlad názvu:
Tool for parsing and analysing of web pages
Autoři:
Odstrčil, Štěpán ; Ilgner, Petr (oponent) ; Galáž, Zoltán (vedoucí práce) Typ dokumentu: Bakalářské práce
Rok:
2019
Jazyk:
cze
Nakladatel: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstrakt: [cze][eng]
Tato bakalářská práce se zabývá parsováním textu z HTML stránek a jejich analýze a rozboru. Byly použity techniky z Natural Language Processingu, neboli Zpracování Přirozeného Jazyka. Byla napsána knihovna v programovacím jazyce Python, za použitím nejnovějších technologií, postupů a knihoven. Byl zpracován popis těchto knihoven a tříd, jejich použití a příklady. Aplikace dále byla otestována unit testy. Aplikace obsahuje GUI (Graphical User Interface) pro snadnější používání a demonstraci funkcionalit.
This bachelor’s thesis is dealing with parsing of text in HTML pages and its analysis. Practices from Natural Language Processing were used. There were written libraries (or packages) in programming language Python, with use of modern practices, techniques and libraries. The usages and examples of these libraries and classes were made. All these libraries were tested using Unit tests. Application contains GUI (Graphical User Interface) for wasier usefulness and demonstration of functionality.
Klíčová slova:
GUI; Natural Language Processing; Parsování HTML stránek Zpracování Přirozeného Jazyka; Parsování webových stránek; Python; GUI; HTML Parsing; Natural Language Processing; Python; WEB Parsing
Instituce: Vysoké učení technické v Brně
(web)
Informace o dostupnosti dokumentu:
Plný text je dostupný v Digitální knihovně VUT. Původní záznam: http://hdl.handle.net/11012/173542