当前位置:问答库>论文摘要

题目:基于Web信息抽取的评审专家推荐方法研究

关键词:Web信息抽取;文本相似度;模糊层次分析法;神经网络;专家推荐

  摘要

随着科研领域创新活动的增加,学术期刊和学术会议的稿件数量以及各种科研项目的申报数量也逐年增多,导致论文及项目评审工作中选择适合的评审专家的工作量也越来越大。目前,评审专家的选择主要是通过根据专家所在学科人工指定或者专家自行定位等方法进行。这样的方法带来了一系列问题,如选取评审专家的工作量大、专家经常接收到不是自己擅长领域的评审工作等。Web信息抽取是针对互联网中存在的大量丰富的数据,运用相应的技术方法,从Web网页中抽取得到用户需要的目标信息的过程。利用Web信息抽取技术,可以从网页中包含的无结构或半结构化形式的信息中识别出用户感兴趣的信息,并将这些信息进行结构化的存储,为不同研究领域的知识获取提供了理想的方法,该方法同样适用于本文研究的评审专家信息获取。本文将Web信息抽取技术引入到评审专家推荐中,同时对文本相似度方法和综合评价理论及应用进行了广泛研究,提出了基于Web信息抽取的评审专家推荐方法,建立了评审专家推荐模型。在研究过程中,首先,针对专家信息的Web来源,通过网络爬虫对专家信息进行抓取,接下来用神经网络进行抽取规则的训练,并将抽取到的信息结构化,存储到数据库中。其次,利用这些结构化信息,结合文本相似度方法,建立专家领域指派模型,通过此模型将专家推荐到适合的领域。然后,对特定领域内已经选定的专家,建立专家领域内水平评价打分模型,得到专家领域内的得分顺序,以根据论文或项目评审需要选择适当数量的评审专家进行推荐。最后,基于上述方法和模型,对一次会议论文评审的专家推荐工作进行了实验数据的仿真分析,并结合不同类型的评审工作,对专家评价模型进行权值调整,提出了促进评审专家推荐系统的建立、提高推荐工作效率的建议。