当前位置:问答库>论文摘要

题目:微博垃圾信息过滤系统的设计与实现

关键词:文本过滤,分类器,朴素贝叶斯

  摘要



    随着科技的迅速发展,尤其是大数据时代的到来,出现在我们身边的信息越来越丰富密集,来带的直接现象是我们会对于接收到的信息眼花缭乱。目前互联网的用户们所面临的问题已经不是以前科技不发达的时候的信息匮乏问题而是如今大量各种数据出现而导致的信息过载问题。所以如何对我们感兴趣的信息进行过滤,避免在我们获取信息的过程由于受到过多的干扰而浪费宝贵的时间这样的研究工作具备重要的意义。

    本文对一种微博垃圾信息过滤系统的设计与实现进行了详细论述,同时对系统设计与实现中所采用的一种贝叶斯分类器的算法进行了研究优化。本文所介绍的整个过滤系统本质上是一套分类系统,重点在于如何过滤掉我们不想要的信息,而不在于推荐和挑选我们可能专注需要的信息。同时为了更好的扩展与适应未来的发展,文中所介绍的分类器的架构实验工具可以灵活的扩展并进行效果测试验证,使得这一套内容分类过滤解决方可以应用到短信、邮件甚至更多的文本分类应用。

    有关过滤器的实验非常成功,目前使用这样系统验证下所产生的正式的产品已投入上线运行,可以在广告以及色情等信息爆发出现的时候自动开启并过滤删除这些信息,对于提高网站内容质量,杜绝漫天垃圾信息带来的危害,优化网站用户的阅读浏览体验具有十分重要的意义与价值。