当前位置:问答库>论文摘要

题目:正态的分布型数据分析方法及其应用

关键词:正态的分布型数据;主成分分析;线性回归分析;股票市场

  摘要

正态的分布型数据是一种重要的符号数据,其数据表中的数据单元不再是传统的单值型数据,而是一个服从正态分布的数据集合。在许多情形下,采用正态的分布型数据对大规模数据进行打包处理,既能有效降低整个数据系统的规模量,又能够同时反映数据集合的分布情况,从而有助于从整体上把握数据集合的表现特征和内在规律。现有的符号数据主成分分析和线性回归分析方法往往通过特征提取的方式分解符号数据样本的信息,进而套用经典的多元统计分析技术来求解模型。这种处理方式的主要缺陷在于会造成信息的损失,进而有可能影响分析人员对数据系统的认识和解释。并且目前尚无关于连续的分布型数据的主成分分析和线性回归分析方法的研究。本文针对正态的分布型数据,从其均值、方差、协方差等描述性统计量的定义与计算入手,提出了一种考虑正态的分布型数据表的全部信息的主成分分析和线性回归分析方法。仿真实验充分证明了本文提出的方法的有效性、准确性以及相对于现有方法的优越性。在理论研究的基础上,本文将中国股票市场中的所有上市公司分为六大风格板块并利用正态的分布型数据进行概括,进而通过主成分分析和线性回归分析探讨了股票市场的运行特征。首先对2011年1月1日到2011年4月17日的股票运行数据进行主成分分析,以揭示中国股票市场的短期运行情况。接下来对2009年到2011年的股票运行数据进行主成分分析,探讨不同年份的市场环境的变化情况以及各个风格板块市场表现的差异性。最后运用线性回归分析方法,探讨2001年-2011年中国股市收益率与振幅、换手率、市盈率的相关关系,以及风险收益关系的动态变化过程。上述实证研究得到了一些有益的结论,同时验证了所提出方法的实用性和有效性。