| |
|
Extrakce textových dat z internetových stránek
Mazal, Zdeněk ; Morský, Ondřej (oponent) ; Fojtová, Lucie (vedoucí práce)
Tato práce se zabývá získávání textových dat z webových stránek, přehledem jednotlivých wrpapperů a způsobů jejich extrakce. Obsahuje i přehled nejpoužívanějších programů pro extrakci dat z internetu. Součástí je program, vytvořený v programovacím jazyku Java, který umožňuje získávat textová data z konkrétních webových stránek a ukládat je do xml souboru.
|
| |
|
Extrakce textových dat z internetových stránek
Mazal, Zdeněk ; Morský, Ondřej (oponent) ; Fojtová, Lucie (vedoucí práce)
Tato práce se zabývá získávání textových dat z webových stránek, přehledem jednotlivých wrpapperů a způsobů jejich extrakce. Obsahuje i přehled nejpoužívanějších programů pro extrakci dat z internetu. Součástí je program, vytvořený v programovacím jazyku Java, který umožňuje získávat textová data z konkrétních webových stránek a ukládat je do xml souboru.
|