● 摘要
在系统科学领域,决策科学是核心的研究内容。传统的决策论以贝叶斯分析为主要方法,主要讨论事前的单决策。对策论主要讨论竞争条件下的决策。本文在决策理论和对策论的基础上,提出了随机应变解决问题的策略理论。策略是一种输入输出体系,能够在目标系统的不同状态下分别进行运算,并输出当时条件下的最佳决策,保持系统的优良状态。用策略来解决本领域中的诸多问题,是一种新的思路。 在策略的基本理论部分,对策略的定义、形式、指标、评价方法做了基本的界定,从而建立了策略的理论体系。本文将策略定义为完成从系统状态集向决策集的映射的输入输出系统。策略的形式既可以是文字、公式,也可以是严格的程序代码。策略的典型结构是具有条件分支的过程,可以对不同的系统状态进行分别处理。对于目标问题,评价解策略的主要指标是计算复杂性和解的优劣性,此外其描述长度以及所包含的知识也对策略的制定和实施有一定影响。因此对策略的评价应该按目标系统的关心内容综合地考察。策略元是策略的组成部分,它更为单纯,策略的求解往往由简单的策略元制定开始。在策略的结构可以预先列举的情况下,策略可用参数化的方式表示,从而将策略求解转化为对值的求解。本文所提出的策略框架不但可以完成确定性的决策输出,更允许随机的以及带有人的偏好的决策的输出,因此适用范围比较广泛。策略同决策相比,增加了结构的内容,它可根据系统的不同状态持续地输出决策,从而不断地干预系统,保持系统的优良运行。因此,对策略的求解,需要在多变的系统状态下全面考察,显然比求解单决策更为复杂。虽然策略化地解决问题提高了要求和难度,但本文通过分析给出结论,求解策略所消耗的时间是求解单决策的有限整数倍,并且是可控的;求解策略的O计算复杂度与求解单决策相同。在这个结论的支持下,随机应变地策略化解决问题,将成为系统控制和处理同类多变情况(如序贯决策)的最有前景的途径。 策略的求解,是本文的核心内容。遗传算法等非构造式算法是通用的面向值的求解方法,可以直接用于策略变量的求解。特别地,对于低维、连续的策略变量求解方法,本文提出了一种通用的半构造式方法:探脊法,将传统的决策-目标值空间中的求解扩展到系统状态-决策-目标值空间中,考察系统状态同最佳决策之间的响应关系,形成解策略的简单公式表述形式。进一步地,利用遗传编程,不但能解决策略值的问题,还可以解决策略的结构的问题。这样,本文完整地给出了一套通用的策略求解方法。 作为通用的启发式求解工具,遗传算法的应用广泛,并且改良形式众多。本文参考生物遗传学规律,将二倍体遗传算法dGA以及多染色体遗传算法mcGA结合起来,构造了一种仍然通用,并且效果更好的扩展遗传算法——超遗传算法hGA。hGA进化质量的改良主要来源于dGA。dGA使用冗余的双倍遗传代码表示一个个体。本文通过对dGA收敛性和基因多样性的分析证明了dGA在合理使用时会具有更好的进化质量和求解结果。hGA遗传操作效率的提高主要来源于mcGA。mcGA将具有不同数据可行域的解向量分隔开,不但能减少非法解、不可行解的产生,还能提高交叉等遗传操作的效率。从解策略的制定上来说,mcGA允许以更接近自然描述的形式,容纳多种不同类型的解向量,从而简化策略的制定和求解。hGA的对简单GA的这种改良除了能满足策略的求解外,还能满足其他一般的面向值的求解过程,因此具有通用意义。 本文提出的求解策略的方法都是非构造式的或半构造式的,也就是无需关于目标系统的任何知识就可以完成求解。但策略框架不排斥策略制定者应用自身的知识和经验进行策略制定。特别地,在面对具有几何空间复杂性的问题(如设施布局问题)中,还可以借助虚拟现实(VR)这样的工具来发挥人的高速的、模糊的判断能力,发现问题中可能蕴含的规律和知识。此时,VR是辅助解决这类问题的良好工具。本文对VR在这样的交互式求解过程中可能发挥的作用进行了探讨,指出VR能帮助策略制定者高效地了解系统状态和下达决策,更重要的是,它能在未经预定义的情况下揭示系统中的某些几何规律和知识,从而形成策略的组成部分——策略元。 作为理论的验证,本文在每一部分都有算例的计算。并且在案例部分,提出并解决了一个超市布局的大型问题。超市布局是设施布局问题的代表,是营销学中的重要内容。按照本文的策略理论,使用本文讨论的策略求解工具——进化计算和VR,不但解决了布局工具在超市空间上的分配,也按策略的思路,参考季节、销售额等因素,给出了超市动态地评价来自供应商的促销的从而做出接受或拒绝的决策的方法,从而使超市能够在运行中随时趋利避害地调整商品布局。 总的来说,本文以策略理论为核心,以进化计算、探脊法、虚拟现实为策略求解工具,着重探讨了包含复杂几何数据的问题的策略制定。本文关于策略理论、超遗传算法以及VR的研究,都在其各自的领域具有通用的参考意义。
相关内容
相关标签