Original title: Rozšíření systému pro získávání, zpracování a analýzu rozsáhlých kolekcí textů z webu
Translated title: Extending System for Acquiring, Processing, and Analysing Large Web Text Collections
Authors: Matějka, Jiří ; Dytrych, Jaroslav (referee) ; Smrž, Pavel (advisor)
Document type: Bachelor's theses
Year: 2018
Language: cze
Publisher: Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract: [cze] [eng]

Keywords: corpus; text analysis; text extraction from HTML code; text in vertical format; web; web pages downloading; analýza textu; extrakce textu z HTML kódu; korpus; stahování webových stránek; vertikální text; web

Institution: Brno University of Technology (web)
Document availability information: Fulltext is available in the Brno University of Technology Digital Library.
Original record: http://hdl.handle.net/11012/85089

Permalink: http://www.nusl.cz/ntk/nusl-386106


The record appears in these collections:
Universities and colleges > Public universities > Brno University of Technology
Academic theses (ETDs) > Bachelor's theses
 Record created 2018-09-11, last modified 2022-09-04


No fulltext
  • Export as DC, NUŠL, RIS
  • Share