● 摘要
随着语义网技术在业界的逐渐发展,作为语义网核心技术的本体在各方面都得到了广泛的研究与应用。本体的核心作用是知识与资源的共享和重用,本体可以增强网络中异构系统间的互操作,提高信息流动性,实现互联网间异质资源的语义共享。但是由于本体创建还没有一个统一的标准与规范,本体开发也具有分布式、主观性和自治性的特点,导致同一领域内的本体存在异构性和不一致性等问题。这些本体所描述的信息都不能共享,一定程度上阻碍了本体应用的发展。本体映射是当前解决异构的主要方法之一,它可以在付出极小成本的情况下消除异构影响,达到知识共享与重用。
本文在现今本体映射问题上进行深入细致的研究,在目前已有的本体映射系统和模型的前提基础上进行改进,研究出一种更加完善有效的基于FAHP的多策略本体映射方法,该方法借助模糊层次分析法实现了本体不同策略间的权重自适应分配,本文的主要研究成果如下:
(1)多策略结合方法的改进:为了解决当前多策略结合方法自动化程度不高的问题,本文通过运用工程(土木建筑中常用)中定性分析和定量分析常用的评价方法模糊层次分析法分析待映射对的详细特征,对语言、属性、实例、结构四大策略进行贡献度预测,根据预测得出的结果来自适应的分配各个策略的相应权值,最后综合结合各个策略,该方法不需人工参与,提高了多策略结合方法的自动化程度,也克服了Sigmoid函数、加权平均法等传统结合方法直接进行数值合并造成的结果不准确问题。
(2)语言策略映射方法的改进:针对当前语言策略不能完全挖掘语义信息的问题,借助WordNet语义库计算相似性时,利用WordNet树层次结构中语义距离与概念深度和子节点的相关性对语言策略进行相似度计算,使语言策略可以充分利用语义信息与层次结构树节点的信息量,有效提高映射精度。
(3)实例策略映射方法的改进:对传统的Jaccard算法进行改进,引入差异度与丰富度两个因子,有效抵消实例差异带来的映射误差,解决了传统方法没有考虑实例差异个数,容易造成映射结果失真的问题,提升了实例策略的映射精度。进行属性映射时将实体包含的属性划分成数据和对象两类属性,并利用属性优先算法减少属性映射工作量,增加映射效率。
最后为了检验提出方法的有效性,本文使用JAVA与JENA语言编码实现原型系统,选用国际权威的OAEI本体数据集进行实验验证,并与FALCON、COMA、CTXMATCH、RIMOM四大典型映射系统进行结果对比,最终实验结果充分证实了本文提出的方法能够有效的提升本体映射的查全率与查准率,得到更加精准的映射结果。