当前位置:问答库>论文摘要

题目:基于WEB新闻的产品质量安全事件识别与跟踪研究

关键词:Web新闻;产品质量安全事件;多维向量空间模型;多层文本分类器

  摘要

近年来,我国产品质量安全事件不断发生,形式严峻,给消费者的人身和财产安全造成了损失。随着互联网的发展,互联网已成为产品质量安全事件信息传播的主要途径之一,这些问题如不能及时发现和处理,有可能造成严重的群体性伤害问题,因此,密切监测产品质量安全事件信息传播,可以有效规避系统性、区域性和行业性产品质量安全事件发生。然而我国目前还没有建立产品质量安全监控平台。本文以国家“十二五”科技支撑计划项目“产品质量安全风险监控关键技术研究”和国家社会科学基金重点项目“我国质量安全评价与网络预警方法研究”为依托,基于对产品质量安全事件要素的归纳分析,提出面向事件的新闻文本表示模型,并通过规则分类和改进K最近邻方法对WEB新闻中产品质量安全事件进行事件识别和跟踪,通过实验验证达到了较好的效果。本文主要完成了以下几方面工作:(1)通过网络爬虫抓取大量互联网中产品质量安全事件新闻,通过对新闻结构及内容的分析,归纳并找出产品质量安全事件特征,构建产品质量安全事件要素模型。(2)基于对事件要素特征和WEB新闻特征的分析,构建面向事件的新闻文本表示模型和相似度计算方法。通过实验验证该模型在尽量不丢失报道信息的同时,对事件框架和内容上都做了考虑,对产品质量安全事件WEB新闻更有效,更有针对性。(3)建立基于规则和统计的多层文本分类器,用于实现产品质量安全事件识别和分类,其中第一层基于规则分类器实现对产品质量安全事件新闻粗分,第二层分类器通过计算文本相似度从上往下逐层进行匹配,直到找到对应的子类。通过实验证明该分类器能有效识别WEB新闻中产品质量安全事件。(4)根据话题跟踪过程中初始样本量比较少的特点,论文选择K最近邻算法作为事件和话题跟踪方法,并考虑产品质量安全WEB新闻之间的相关性对KNN算法进行改进,以“三聚氰胺”事件为例对算法进行验证,结果证明该模型取得较好的跟踪效果,满足课题应用需要。