● 摘要
时态数据挖掘是数据挖掘的一个重要方面,时间序列数据是时态数据的一个重要类型,是对一连串事件产生的数据按时间顺序产生的一个排列。区别于传统的时间序列统计分析,时间序列数据挖掘综合多个学科的理论和方法,通过归纳演绎的方法获取时间序列数据中隐含的知识,是本文研究的重点。本文首先综述了数据挖掘的相关技术和时间序列数据挖掘领域的相关研究。接着定义了基于时间尺度概念的趋势和趋势准确度,以满足对趋势有不同要求的信息使用者的需求,使用定量的方法衡量趋势准确程度。将信号分析领域中的经验模式分解方法(Empirical Mode Decomposition, EMD)引入时间序列趋势提取,针对金融时间序列非稳定、非线性的特点,提出了基于EMD分解的金融时间序列趋势提取方法,并与传统的趋势提取方法进行对比,验证了EMD方法对于非稳定、非线性金融时间序列趋势提取的有效性。在此基础上提出了金融时间序列的子序列分层匹配算法,首先对提取的时间序列趋势进行数据预处理,得到字符趋势序列,进行时间序列趋势的粗匹配,得到趋势相似的中间结果集;接着在中间结果集中进行进一步的细节匹配,最终得到与查询序列相似的子序列结果集。通过数据实验,验证了基于趋势提取的子序列分层匹配算法与传统算法相比,减少了结果集的冗余,改善了子序列匹配算法的效果。
相关内容
相关标签