当前位置:问答库>论文摘要

题目:基于指代消解的社会关系搜索引擎

关键词:搜索引擎、社会网络、指代消解、社会关系抽取

  摘要



SNS的发展使得越来越多的人将互联网作为信息的主要来源,互联网正在逐步地渗透到社会生活中,其中蕴含着大量的人物社会关系信息。但是,互联网上的信息是杂乱无序的,如何从海量的互联网信息中自动抽取人物的社会关系,是目前基于互联网的社会网络分析研究的一个重要问题。本文以指代消解和关系抽取为重点,基于人物实体关系识别和基于特征的机器学习,设计并实现了一个基于指代消解的社会关系搜索引擎。该引擎通过现有的搜索引擎获取相关人物实体关系的描述语料,对语料中的人物代词与人物实体之间的指代关系进行消解。然后再通过机器学习方法,判定人物之间的社会关系。

在指代消解部分,本文主要对搜索引擎返回的数据进行分析,将关系描述性语料中的代词与人物实体之间指代关系进行消解。通过对代词和人物实体之间的语义信息和代词到人物实体之间的句法路径构造特征向量,使用SVM对该特征进行分类训练,从确定代词与人物实体之间是否具有指代关系。

       在社会关系抽取部分,本文通过对比当前关系抽取的多种方法,选择了基于特征的有监督的学习方法进行关系抽取。然后针对社会关系的特点,定义了8种社会关系类别。接着实现了一个自动爬取和标注语料的工具来获取训练语料。最后基于支持向量机理论,通过引入指代消解,确定了关系特征词和人物实体或人物代词到关系特征词的语法路径作为句子的关系特征,有效的减少了句法路径的长度,提高了特征向量的准确率和效率,实现了快速准确社会关系抽取,并进行了训练参数调优和实验。

系统主要的功能实现包括网页搜索和预处理模块、指代消解模块、社会关系抽取模块和用户界面。本文详细阐述了该系统的设计原理和实现机制,通过实验测试验证了系统的有效性、召回率和准确率,具有良好的可用性和可扩展性。