当前位置:问答库>论文摘要

题目:交易数据的时间序列关联挖掘

关键词:数据挖掘;关联规则;时间序列;交易数据

  摘要

数据挖掘是一门研究如何从大量的数据中获取知识的学科。今天,随着信息技术的不断发展,在交易的过程中会产生大量的交易数据,如何充分利用这些数据发现对我们决策有帮助的规律,成为人们关心的问题。关联规则挖掘是数据挖掘领域中一个非常重要的研究课题,其本质是从大量的数据中或对象间抽取关联性,进而揭示数据或对象间的依赖关系。时间序列数据是按时间先后顺序排列各个观测记录的有序数据集,广泛存在于社会、经济、技术等各个领域之中。它不仅仅是历史事件的记录,更重要的是蕴藏其中的不显现的、有趣的模式。交易数据就是时间序列的一种,相比传统的统计分析方法,运用关联规则挖掘更适合发现海量数据中隐藏的知识,挖掘潜在有价值的模式。因此,对时间序列关联挖掘这一交叉课题进行方法和应用上的研究,具有重要的理论和实践指导意义。本文对数据挖掘、关联规则、时间序列以及前两者的交叉领域的理论知识、小型算例进行了系统的梳理,明确提出了时间序列关联挖掘算法和流程。提出了基于时间窗口的同类产品和不同类产品的时间序列关联挖掘算法。然后采用真实的超市数据,从销售量的分析角度,给出了数据降维、数据预处理的基本方法,分别构筑了具有时间窗的事物内部和事务间时间序列关联规则挖掘模型,通过数据挖掘软件SPSS Clementine获得有益的规则,最后从销售预测的角度给出分析结论。实验结果证明,这种针对销售量的关联挖掘对决策具有较好的参照价值。