当前位置:问答库>论文摘要

题目:相关系数AR(p)平稳序列的聚类分析方法及其应用

关键词:相关系数平稳序列;偏相关系数;Ward距离

  摘要

现实生活中,越来越多的现象和事物需要用时间序列来进行描述,在许多行业数据库中都存储着大量时间序列数据。由于自然界的复杂性,表征这些现象的时间序列也是千变万化,有着不同的类型。如何从大量的时间序列曲线中进行数据挖掘,对不同的时间序列进行分类,找到可以用于区分不同序列的“特征量”和“距离”是需要解决的问题。鉴于以上问题,本文首先讨论了平稳序列的一般性质和特点,接下来引入了一种针对平稳序列提出的模型——AR(p)模型,对AR(p)序列的自相关系数和偏相关系数、参数估计、白噪声检验等进行了分析,并引入了相关系数平稳序列的概念,给出了把相关系数平稳序列转化成平稳序列进行研究的方法,从而扩大了研究的时间序列的类型,使得分类可以在一个更广阔的范围内进行。其次,本文研究和总结了数据挖掘技术的主要思想和功能,并重点讨论了数据挖掘功能中的一种——聚类分析。在此基础上,本文给出了基于AR(p)平稳序列的自、偏相关系数和数据变换的聚类方法,同时定义了聚类距离。具体为:首先把具有相同阶数的AR(p)序列归为一类,此为第一步分类;其次对第一步中的每一子类中的时间序列进行数据变换,根据Ward距离进行再一次分类,此为第二步分类。这样的处理,综合考虑了自、偏相关系数和序列数据,确保分类结果更精确。最后,本文用上面的方法对2005年1-6月上海证券交易所80支股票进行了分析,结果显示了上面方法的有效性。该分析具有很强的应用价值,它把证券市场上的股票分为不同的几种类型,为个人、公司等选择合适股票规避风险提供了很好的依据。