当前位置:问答库>论文摘要

题目:大规模变量递阶判别分析方法的研究与应用

关键词:递阶方法;判别分析;偏最小二乘logistic回归;fisher判别分析

  摘要

随着科学技术的进步和社会的发展,人们可用的信息量爆炸式递增。在判别分析中,我们经常会遇到变量个数非常多情况,如有几十个甚至成百上千个变量,在这种情况下,传统的统计方法得到的模型结果就会十分庞杂,难以分析和解释。通常,人们会采用主成分分析等方法尽量减少变量个数,但这种降维方法往往伴随着信息的丢失、增加成分的解释难度、建立错误的模型结果以及对系统虚假的分析解释。一种更好的解决办法是,将变量集合按照本身的含义分成若干个具有相同或相似内涵的子块,这种对变量分块引出了对建模过程的递阶处理,即将原来一层的建模过程转变为两层或者多层。在每一层上,可以应用偏最小二乘回归、主成分分析、判别分析等标准的建模方法。因此,本文将递阶的思想扩展到判别分析领域,提出了递阶偏最小二乘Logistic回归方法与递阶Fisher判别分析方法,通过对原始变量集合的分块处理和递阶建模,来解决上述提到的大规模变量的判别分析建模时遇到的一些问题。这种递阶建模方式一方面可以得到形式简约、易于分析的整体模型;另一方面,还可以进一步解释所概括信息的内涵意义。最后,本文为了验证上述所提方法的有效性,将递阶偏最小二乘Logistic回归方法应用到鄱阳湖地区洪水灾害预测中去,将递阶Fisher判别分析方法应用到银行信用卡客户信用评分的实证研究中。结果表明,使用递阶判别分析方法可以有效地提高模型的解释能力和概括能力、减少信息损失量和加快信息的提取效率。