当前位置:问答库>论文摘要

题目:数量型多维关联规则挖掘算法的研究

关键词:数据挖掘;数量型关联规则;特征选择;互信息;模糊集

  摘要

关联规则挖掘是数据挖掘领域的一项重要的研究课题,是数据挖掘的主要任务之一。根据关联规则挖掘的变量类型分类,可以分为布尔型关联规则挖掘和数量型关联规则挖掘。本文主要研究的是数量型关联规则挖掘算法,在介绍了数量型多维关联规则的基本概念和需要解决的问题之后,着重分析了现有的一些挖掘算法,在此基础之上提出了一种新型的数量型多维关联规则挖掘算法——基于特征选择与模糊集的关联规则挖掘算法。由于已有的大多数算法仍然基于Apriori算法的基本框架,设置同一支持度和置信度,在实际应用中,由于挖掘属性的不同特性,这样就不利于发掘更多有价值的规则,本文提出的挖掘算法是一种有目标的挖掘过程,即直接型挖掘,也就是在目标属性约束下,对数据集进行关联规则挖掘,可以针对不同的挖掘目标,设置不同的挖掘参数,更好地适用不同的挖掘任务;在本文算法里对于数值型属性的离散化采用模糊集理论来处理。对于多维关联规则情况下,在目标属性约束下,把基于互信息的特征选择方法引入到关联规则挖掘,以此来有效地达到了降维处理,防止“组合爆炸”问题,从而可以很好地提高了算法的挖掘效率。最后,本文通过开发了一个基于本文算法的成绩分析系统,对本文算法与传统的算法进行比较,从实验结果看来,本文算法具备较好的挖掘效率和有效性,为数量型多维关联规则挖掘研究提供了新的思考方向。