Národní úložiště šedé literatury Nalezeno 12 záznamů.  předchozí11 - 12  přejít na záznam: Hledání trvalo 0.01 vteřin. 
ScraperWiki Tutorial
Levine, Thomas
The objective of the workshop, or better hackathon, was to get the data into a structured format, and join it with data from another sources – together with an overview and showing by example what is possible with scraping. Thomas identified targets for web scraping and navigating the complexity of different types of web pages and introduced that in a few half-hour-long and hour-long modules that catered to different audiences.
Prezentace: Stáhnout plný textPDF
Řízení kvality dat v malých a středních firmách
Zelený, Pavel ; Pour, Jan (vedoucí práce) ; Novotný, Ota (oponent)
Tato práce se zabývá řízením datové kvality. V současné době je i na českém trhu několik nástrojů a metodik podporující řízení datové kvality, ale všechny jsou vytvářeny pro velké firmy. Malé a střední firmy si je z ekonomického hlediska nemohou pořídit. Cílem této práce je nejprve shrnout principy těchto metodik, aby na základě těchto principů mohla být navržena jednodušší metodika využitelná pro malé a střední firmy. Následně v druhé polovině práce je vytvářena a přizpůsobována metodika pro konkrétní firmu. Nejprve je definována oblast zájmu řízení datové kvality v dané firmě. Dále díky nemožnosti pořídit softwarový nástroj na čištění dat, jsou nadefinována pouze relativně jednoduchá pravidla, na jejichž základě jsou vytvořeny čistící skripty v jazyce SQL. Tyto skripty jsou využity pro automatické čištění dat. Na základě další analýzy je rozhodnuto o datech, které mají být čištěny ručním způsobem. V dalším kroku jsou popisována doporučení pro odstranění duplicitních záznamů z databáze. K tomu je použita funkcionalita systému, který využívá daná firma. Posledním krokem v rámci metodiky je vytvoření kontrolního mechanismu, jehož úkolem je i v budoucnu udržet požadovanou datovou kvalitu. Na závěr práce je proveden průzkum dat na čtyřech datových zdrojích. Tyto zdroje pocházejí z firem využívající stejný provozní systém. Průzkum má poskytnout přehled o datové kvalitě a případně sloužit k rozhodnutí pro čištění dat.

Národní úložiště šedé literatury : Nalezeno 12 záznamů.   předchozí11 - 12  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.