● 摘要
据不完全统计,6.25%的客户每周要收到40条以上的无关骚扰信息,影响了工作和休息,垃圾短信存在的背后已经形成了一个庞大的灰色价值链,手机垃圾短信俨然已成为社会公害,也成为新的违法手段。既要治理垃圾短信,又要避免侵犯用户的通信自由和隐私权,目前各个电信运营商还没有给出有效的解决办法。本论文基于对目前垃圾短信的严峻现状,针对内容、形式和发送者特点的分析,结合手机客户端系统研究,提出基于手机客户端进行垃圾短信过滤的一种解决方案。论文的主要思路是采用多种过滤技术综合过滤,以实现垃圾短信过滤的有效性和针对性。具体技术路线是结合手机黑,白名单过滤,采用贝叶斯理论统计算法对用户给定的正常/垃圾短信集合进行训练,得到短信过滤模型。这个模型包括了短信处理、中文分词、特征选取以及短信分类与过滤几个主要功能模块。论文对短信过滤系统需求进行了分析,着重讨论了各模块的设计与实现,包括主要处理流程和实现方法等。通过对垃圾短信特征的持续跟踪和分析,验证了过滤模型的合理性和有效性,并提取了垃圾短信的规则特征,建立了垃圾短信的特征规则库。基于中文分词技术,对分词字典库和规则进行持续维护和更新,可以实现过滤准确率和误报率的持续提高和改进。基于上述目标的设计与实现,实际验证,初步形成了垃圾短信过滤的客户端软件系统,并应用于部分手机用户。
相关内容
相关标签