当前位置:问答库>论文摘要

题目:最小冗余的无损关联规则集表述及其应用

关键词:数据挖掘;关联规则;冗余规则;无损规则集表述;用度分析

  摘要

随着信息技术尤其是网络技术的飞速发展,人们产生、获取、存储、处理、传输数据的能力不断提高,也为研究者积累了海量的数据。数据挖掘起源于多个学科,包括数据库技术、人工智能、信息系统、统计分析、决策支持以及计算机技术等,它从大量的数据中搜寻未知的、有价值的且非同寻常的信息,是知识发现的重要方法,是管理人员用于管理、决策和预测的有效工具。其中,关联规则挖掘更是以其知识表述的简单性、易理解性和实用性成为数据挖掘领域最重要的研究热点之一。论文从关联规则基础挖掘方法出发,研究了关联规则挖掘的几个关键问题。研究成果可以丰富和完善关联规则挖掘、知识发现、决策支持等管理理论和技术,推动关联规则挖掘向更广、更深领域应用,对管理创新和应用实践发展具有重要的理论意义和广阔的应用前景。本文的主要研究内容和研究成果如下:1.研究能有效缓解规则爆炸问题的挖掘算法。针对规则爆炸问题,去除冗余规则的方法有更柔性和高可理解性的优势。冗余规则的表述应该语义严谨且可以以数学表达的方式进行形式化定义,并具备领域知识无关性。从大量的文献中可以看到,冗余规则的定义通常涉及到两个方面,一是规则的构成形式,即规则的前后件构成。二是规则所体现出来的信息,即规则的支持度和置信度值。从这两个方面出发定义冗余规则是本文的核心研究内容之一。此外,相应的去除冗余规则的算法也被设计出来。2.研究去除冗余的关联规则挖掘方法中的信息损失和如何保证信息完整性问题。去除冗余的方法删除了冗余规则,这些规则能否从无冗余规则中推导出来是挖掘结果是否存在信息损失的关键问题。如何利用规则之间的推导关系,保持信息的完整性是本文的另一个主要研究内容。根据冗余规则和信息完整性的思想,提出一个基于冗余规则去除的无损关联规则集表述模型,该模型能够大幅度减少规则数量,同时又能保证结果集中的信息不存在规则损失、支持度损失和置信度损失。3.研究冗余规则的推导和规则空间的探索方式。冗余规则的推导和整个规则空间的探索能够保持信息完整性并帮助用户选择感兴趣的规则。针对无损关联规则集表述模型,提出一个推导系统,实现在无损表述上的规则推导和探索。推导系统有助于用户浏览和查询他们感兴趣的规则,因此能够增加关联规则挖掘结果的可用性。4.研究关联规则在电子商务背景下的应用。关联规则在电子商务中有多种应用方向,主要包括个性化推荐和导航模式分析。本文研究了针对日志数据的Web使用挖掘方法,针对关联规则可用于分析站点页面之间关联关系的特点,提出一个基于关联规则的电子商务站点用度分析模型,以分析电子商务站点提供的服务对完成站点目标的影响,分析结果可用于站点设计改进。