Název:
Mining XML Integrity Constraints
Překlad názvu:
Mining XML Integrity Constraints
Autoři:
Fajt, Stanislav ; Nečaský, Martin (vedoucí práce) ; Svoboda, Martin (oponent) Typ dokumentu: Diplomové práce
Rok:
2011
Jazyk:
eng
Abstrakt: [eng][cze] The most important integrity constraints in XML are primary keys and foreign keys. In general, keys are essential in understanding both the structure and properties of data. They provide an instrument by which va- lues from a given set of attributes uniquely identify tuples in a database. As a result, keys are important to main database operations. Since XML beco- mes lingua franca for data exchange on the web, it is widely accepted as a model of real world data. Because XML documents in general can appear in any semi-structured form, structural constraints (including keys) are often imposed on the data that are to be modified or processed These constra- ints are formally defined in a schema.Unfortunately, in spite of the obvious advantages, the presence of a schema is not mandatory and many XML do- cuments are not joined with any. Consequently, no integrity constratins are specified in those documents, neither. This thesis is mainly focused on the inference of primary and foreign keys from XML documents. 1Nejduležitějšími integritními omezeními jsou v XML primární a cizí klíče. Obecně vzato jsou klíče základním kamenem k pochopení struktury a vlast- ností dat. Nabízejí nástroj, s jehož pomocí lze jednoznačně identifikovat jednotlivé řádky tabulky pomocí hodnot z dané množiny atributů. Z toho plyne, že klíče jsou důležité pro provádění základních databázových operací. Od té doby, kdy se XML stalo jedním z nejpoužívanějších jazyků pro výměnu informací na internetu, je všeobecně přijímáno jako model pro reprezentaci skutečných dat. Protože XML dokumenty mohou v podstatě mít jakoukoli semistrukturovanou formu, jsou mnohdy během procesu zpracování či mo- difikace dat vyžadována strukturální omezení (napřílad klíče). Tato omezení jsou definovaná ve schématu. I přes zjevné přínosy není bohužel přítomnost schématu povinná a k mnoha XML dokumentům není žádné schéma připo- jeno. Následkem toho nejsou pro tyto dokumenty specifikována ani žádná integritní omezení. Tato diplomová práce je zaměřená zejména na odvození primárních a cizích klíčů z XML dokumentů. 1
Klíčová slova:
integritní omezení; odvození schématu; XML; XML Schema; integrity constraints; schema inference; XML; XML Schema