● 摘要
近年来,Science 2.0网站的持续发展促进了科研领域在线信息的膨胀。然而,Science 2.0网站对科研信息与知识的组织方式各异,信息之间也存在着语义不一致性、学者的表达习惯与认知不一致性的问题,这使得学者难以从海量异构信息中迅速准确地收集所需信息。因此,科研领域对信息资源与领域知识的统一共享的需求十分迫切。基于此需求,本体作为一种描述领域概念语义的建模工具,为描述概念语义关系、确定领域公认的术语体系提供了领域知识共享的形式化表示,成为建立海量异构信息之间语义关联的有效方法。为了实现领域知识语义层面的统一共享,本文提出了Science 2.0环境下的科研领域开放本体的社会化构建方法,对来自网络数据库中的异构信息进行了形式化和规范化表示,并探讨了本体在科研个性化信息推荐及评审指派问题中的应用。
本文从以用户为中心的Science 2.0平台角度出发,针对科研领域信息在知识层面上的语义不一致,在领域本体构建理论的基础上,探讨了科研领域开放本体的构建方法及应用方面。
首先,本文评述了领域本体的相关研究进展,并分析了传统领域本体的构建方法及存在的问题。目前,领域本体的构建主要有三类方法:本体工程、本体复用以及本体学习。本体工程方法由领域专家组手工构建,耗费的人力和时间繁多,且缺少对过程的规范和评价标准。本体复用方法对已有的本体进行修改,但存在可复用的本体资源少、及不同本体匹配难的问题。基于自然语言规则和统计分析的本体学习方法,由于在语义逻辑方面的欠缺,产生的数据可信度差,概念关系不紧密,难与认知达成一致。
其次,本文研究了科研领域本体在Science 2.0中的语义分析过程与方法,进而提出了社会化协作构建科研领域开放本体的方法。在分析Science 2.0环境下的科研信息特征及语义问题的基础上,本文从三个维度分析了科研领域本体概念的语义特征:领域特征、主观特征及异构特征,并提出了科研领域语义分析过程。依据此过程以及Science 2.0对科研合作方式的改变,本文提出了自动构建与社会化协作修剪相结合的构建领域本体的方法步骤。实例验证表明,该方法在获取并表达学者群体的一致观点方面的有效性。
第三,本文研究提出了科研领域开放本体的语义信息交互机制的三个要素:基于语义本体的信息共享架构、语义信息交互机制、共享信息映射算法。信息共享架构以领域开放本体、学者用户、语义标注与知识链接、语义信息服务为主体,通过信息交互机制、信息映射算法实现信息共享。其中,语义交互机制主要有用户贡献度衡量机制、科研信息资源形式化标注、领域知识链接的方式。而信息之间的共享映射算法则有概念相似度计算、相关度计算、本体映射算法等。
最后,本文将科研领域开放本体应用于科研Web信息的个性化推荐服务中,提出基于语义关系的概念过滤算法,并从语义匹配角度为学者用户推荐更精准的学术信息。实验表明基于语义关系的方法能有效过滤无关信息。在科研评审指派问题中,本文利用区间值模糊本体理论实现了基于语义相似度的匹配算法,并通过本体计算评审人与待评审文献之间的相似度并进行匹配,验证了该方法在有效匹配方面的改进。