当前位置:问答库>论文摘要

题目:带约束条件的数据表分析预测方法及应用研究

关键词:约束条件;成分数据;投入产出表;大规模曲线;预测建模

  摘要

数据是自然和社会量化信息的记录,也是进行科学分析的基础。与大量的、无约束条件的普通数据表相对应的,还存在一些特殊的、带定和约束条件的数据表。这些数据表由于内在的约束条件,而常常不适用于经典的统计分析方法。因此,探索出一套与这些特殊数据表相应的方法体系,无论是在理论研究上、还是在实践应用上都具有积极的意义。本论文将以这类带定和约束条件的数据表作为研究对象,分别从具有一维约束条件的数据表——成分数据表和具有二维约束的数据表——投入产出表两个角度展开研究。成分数据在社会科学和自然科学中非常常见。早在一百多年前人们就已经意识到成分数据的特殊性,以及用常规方法分析而可能导致的严重后果。但是,直到上世纪八十年代Aitchison提出logratio变换开始,成分数据的研究才真正意义地开展起来,并发展了很多适用于成分数据的统计分析方法。然而必须承认,成分数据的统计分析体系还远非完善,很多研究领域仍是空白。因此,本论文将在分析成分数据特性的基础上,提出一些基于成分数据的统计方法,进一步拓展成分数据的方法体系和应用领域。论文关于投入产出表的研究主要围绕预测问题展开。目前对投入出表的预测主要基于RAS等方法,但由于该方法有较强的经济假设,与现实情况存在差异,而且其必须已知目标年的一些总量数据,这些数据的获得对于普通研究者通常是有困难的。据此,本论文在深入讨论投入产出表约束条件的基础上,提出了一套新的预测建模方法,并将其用于中国投入产出表U表序列的预测实践,取得了良好的效果。具体来说,本论文的研究成果和创新之处主要体现在以下几方面内容:1、论文提出了一些关于成分数据的分析方法,进一步完善了成分数据的研究体系。论文中关于成分数据的创新工作主要体现在三个方面:(1)成分数据相关系数计算方法研究由于成分数据含有多个分量,因此,如何衡量两个成分数据之间的相关程度,已不能用普通数据的相关系数方法来计算,而分量之间的多重共线性使得经典的典型相关分析也不适用。本论文在logratio变换基础上,结合普通典型相关分析,提出了成分数据相关系数的计算方法。(2)成分数据logistic回归方法研究在成分数据的方法研究方面,logistic回归目前还是空白。由于成分数据各分量之间的多重共线性,使得经典logistic回归已不适用。本论文在对称logratio变换和偏最小二乘logistic回归思想的基础上,提出了成分数据的logistic回归建模方法,成功地解决了这一问题。(3)基于成分数据思想的经济指数预测方法研究论文将成分数据预测建模的思想与基尼系数和赫芬达尔-赫斯曼指数及绝对集中度这几个常见的经济指数的含义结合起来,提出了一套新的基于成分数据的基尼系数预测方法和市场集中度指标预测方法。2、论文分别针对A表和U表,提出了一套全新的投入产出表预测建模方法。由于A表与U表的性质存在差异,论文在深入分析投入产出表内部约束条件的基础上,分别提出了一套矩阵整体外推的方法来预测未来的投入产出表。该方法既能够保持表中二维约束的有效性,又不需预先已知部分目标年份的数据,因此,对于普通研究者来说,本文所提的方法更具有实用性。利用该方法,论文还对中国投入产出表U表序列进行了预测,并取得了令人满意的效果。3、论文提出了一套基于聚类思想的分类建模方法解决大规模曲线的预测问题。在投入产出表预测建模过程中,涉及上千条曲线的预测问题。由于待测曲线数据数量巨大,常规方法无法解决,因此,论文又专门研究了大规模曲线的预测建模问题,并提出了一套基于聚类思想的分类建模方法,实践证明该方法对于大规模时序曲线的预测问题具有较强的可操作性和普适性。