当前位置:问答库>论文摘要

题目:面向广告企业的招聘信息抽取系统的设计与实现

关键词:信息抽取,招聘广告,Adobe;Illustrator

  摘要

近年来,在线招聘广告的规模和利润飞速增长,来自市场的压力,使得广告商迫切需要将传统的用于印刷的信息,转换成为高度结构化的用于Web发布的电子数据。本论文重点探讨信息抽取技术在这个信息格式转换过程中的应用。 论文首先介绍了信息抽取技术的概念、应用目标和方法,信息抽取系统的发展史及现状。然后,详细阐述了信息抽取的对象Adobe Illustrator格式的招聘信息的特点。针对这些特点,采用基于规则的命名实体识别方法,经过纯文本格式转换、符号化及标注、文字段抽取、指代合并、模板填充五个自动处理流程,完成了整个信息抽取逻辑。 在此基础上,设计并实现了基于B/S三层结构的招聘信息抽取系统。考虑到商业应用对信息精确度的需求,在自动抽取逻辑之后增加了一个半人工的信息校验过程;出于灵活性的考虑,系统允许用户在一定范围内更新抽取逻辑;该系统还融合了一部分企业内部业务,提供了招聘信息检索及报表导出的功能。本系统将抽取出的结构化数据存入SQL Server数据库,为Web发布提供数据基础。测试结果表明,本系统具备很高的信息抽取精度,在功能及性能两方面都完全达到了实际应用的需要。