● 摘要
Web2.0环境下,用户越来越多地参与到网站内容的建设上来,用户之间的交互也日益增多,虚拟实践社区在其中扮演着重要的角色,而协同标注系统作为网络社区中的一个重要组成部分,在资源分类,用户兴趣建模方面有着举足重轻的作用。另一方面,在虚拟实践社区中,专家可以为普通用户答疑解惑、推荐知识、进行引导,以使用户更快熟悉社区资源,适应社区氛围。目前一些虚拟实践社区内已经存在专家发现和专家推荐机制,但一般来说存在两个问题:一个是基于标签的专家发现研究较少;另一个是专家推荐的算法一般都是基于标签频率来对用户和专家兴趣进行建模,从而通过计算兴趣相似性来推荐专家,这种算法的准确性并不高。
本文在分析目前研究现状的基础上,对基于协同标注的虚拟社区中专家发现和专家推荐的问题进行了研究,提出了影响专家发现的可能因素并对其进行了验证,在此基础上改进了标签权重,并据此改进了专家发现和专家推荐的算法。本文所做的工作主要体现在以下几个方面:
首先研究标签语义与专家身份之间的关系,假设专家可能有很多权重较低的标签,原因是专家可能喜欢标新立异的标注。为验证该假设,将标签的语义问题考虑到标签对资源的权重中,再选取一定数量的专家,研究他们标签的权重,通过具体数据进行分析,证明了假设不成立,专家的标签权重普遍较大,他们对资源的描述符合资源本身的特性。
其次,探究影响专家发现的因素,通过实证研究的方式分析各潜在因素是否会对专家身份产生正向的影响,采用结构方程模型对模型中个因素的路径系数进行计算和验证。实验最后得出结论,领域关注度、用户活跃程度、原创标注和被引用次数与专家身份有着正向的关系
最后,通过奇异值分解之后的资源-标签矩阵来改进用户相似度的计算方法,形成专家推荐列表,并通过实验与之前方法进行了比较,证明了该专家推荐算法具有更高的准确率。