● 摘要
数据交换技术是政府和企业间不同应用系统间进行信息共享的重要手段。数据抽取和加载是数据交换和数据集成的重要过程,它能够屏蔽底层数据源的差异,架起政府和企业的不同应用系统之间的桥梁,所以行之有效的数据抽取和加载方法已经成为企业信息化中迫切解决的问题。作者在深入研究了XML与关系数据库(RDB)之间的数据抽取和加载技术的基础上,提出了“一种基于XML的数据抽取和加载方法”,并且在实验室的科研项目“统一数据共享与交换平台”的平台上加以实现。 论文的主要研究内容如下:1) 提出了一种能够表示关系模式的有向图结构本文在关系模式E-R图的基础上提出了一种有向图数据结构—关系模式有向图—来表示关系模式,同时给出了关系模式到关系模式有向图转换的方法。从而保证了数据抽取和加载方法不依赖与某种特定的关系模式,其重点是保证数据结构正确的基础上保留了关系模式的语义约束。2) 提出了一种基于XML的数据抽取和加载方法。本文中通过预先定义的XML自描述文档结构和关系模式有向图,建立了一种数据抽取和加载方法,降低了实际应用时的复杂度并且保留了约束关系,有效的解决了以往基于DTD的数据抽取和加载方法的语义约束关系的保留问题和基于XML-Schema的数据抽取和加载方法的易用性问题。3) 设计并实现了的数据抽取和加载方法。本文提出的数据抽取和加载方法已经成功的在实验室的研究课题“统一数据共享与交换平台”和中共中央组织部“数据共享与交换平台中”得到了成功的运用,并且取得了良好的效果。