● 摘要
中国地震行业在各级行政单位积累了大量分布、异构的数据资源。由于存储形式、数据模型等方面的异构性,造成各数据源之间的互操作困难,形成信息孤岛,使得地震行业的宝贵数据不能充分发挥其作用。另一方面,地震领域的很多应用需要多个分布但有联系的数据之间的协同工作。因此,通过实现数据的充分共享、统一访问以及协同汇聚来满足应用的需求,是当前地震行业信息化建设的重要方面。本文结合数据网格和XML相关技术,展开了对分布异构数据的统一描述、访问以及协同汇聚等机制的研究工作。在网格环境下,建立了一个基于XML的异构数据集成中间件NEQDAIM(National Earthquake Data Access and Integration Middleware),为地震领域的上述问题提供了解决方案。论文的主要工作和取得的成果如下: 1.分析了数据网格中间件OGSA-DAI(Open Grid Service Architecture-Data Access and Integration)的优点及其在数据集成方面的局限性,针对OGSA-DAI的扩展点,提出了一种基于XML的数据访问和集成中间件的架构设计,即NEQDAIM。2.NEQDAIM用XML模式作为统一的数据模式,描述了网格环境下的异构数据资源,建立了虚拟数据源的组织结构,实现了地震领域使用最广泛的关系数据模式到XML模式的自动映射。采用XQuery作为集成映射语言,建立了虚拟视图构建机制,满足了应用对于数据协同汇聚的要求。3.NEQDAIM以XQuery作为统一的查询语言,研究了查询处理的过程。该过程包括将虚拟视图的XQuery查询分解为单个数据源的子查询,以及子查询XQuery到本地查询语句的转换两个步骤,实现了对分布异构数据源的统一查询和汇聚。4.实现了NEQDAIM和OGSA-DAI的集成,利用OGSA-DAI的统一访问接口来访问数据源。目前NEQDAIM已试运行于国家地震前兆数据管理系统中,通过建立各区域中心、国家中心的前兆虚拟视图,为前兆数据的统一访问和汇聚提供了有效的支撑。