● 摘要
随着电子政务的发展,电子邮件作为一种有效的信息交流手段,在电子政务中的应用亦日渐广泛。在电子邮件系统应用于电子政务的过程中,它也会带来一系列负面的影响,比如垃圾邮件的问题。 首先论文回顾了电子邮件系统的发展历程,分析了垃圾邮件的危害性,并介绍了目前国内外反垃圾邮件的研究热点和主流的检测方法;接着对和本论文研究相关的技术进行了简要的介绍,包括入侵检测技术和数据挖掘技术。 其次论文对贝叶斯理论和贝叶斯分类器进行了分析与研究,介绍了基于最小风险贝叶斯算法的垃圾邮件检测的理论依据和系统设计;并分析了垃圾邮件检测系统设计的主要模块结构,并对其中重要的几个模块进行深入的研究。 然后本文重点分析了系统设计中训练数据预处理的关键技术,即对训练数据的特征项定义和提取,以及特征项库向量空间的降维方法。 论文还介绍了基于最小风险贝叶斯算法的垃圾邮件检测系统的实现细节,包括系统的总体流程设计、数据库表结构、所用到的主要类,以及实际运行的效果截图。 最后通过两个实验对系统的性能进行了应用评估,对比分析了分别利用朴素贝叶斯算法和基于最小风险贝叶斯算法进行垃圾邮件检测的查准率和查全率,初步证明了基于最小风险贝叶斯算法的有效性。
相关内容
相关标签