● 摘要
近年来,随着多Agent技术的迅速发展,Agent自主决策能力在不断增强,为了弥补多Agent的集中式体系结构缺点,多Agent分布式的体系结构是一个重要发展方向,而且将分布式体系结构下的多Agent技术运用到解决复杂问题的决策是分布式人工智能的一个研究热点。
一般而言,问题的决策环境往往具有突发性、不确定性和动态性等特点,这就需要根据环境的变化进行动态决策。本文针对动态变化环境下,对分布式体系结构下的多Agent任务分配和协同控制技术展开研究,阐述了在动态环境下任务分配和协同控制的特点。
本文将动态环境的复杂任务决策问题划分为任务分配层和任务执行层两个层次。其中,任务分配层利用随机博弈论建立了动态任务分配模型,并给出了相应算法,通过计算分配方案,实现任务的优化分配;任务执行层利用马尔科夫决策理论建立协同控制模型,并给出相应算法。通过计算协同规则,对任务执行过程中的动作协作进行指导。
在任务分配层中,使用强化学习算法对随机博弈论任务模型进行求解,算法中,各个 Agent 根据 值选择最优任务。当在环境动态变化时,能够反复动态调整任务分配,能提高多 Agent任务分配的有效性。
在任务执行层中,使用SHV-IP算法对MAS分布式马尔科夫决策模型进行求解。SHV-IP算法首先在模型状态空间中的初始状态和目标状态之间,寻找一条能遍历其他所有具有较高立即报酬状态的最短哈密顿路径,通过最短哈密顿路径指导寻找最优的协同策略,由于避免了所有状态的搜索,减少了协同模型的状态空间,从而降低协同控制的难度。
本文对提出的随机博弈任务分配模型和分布式马尔科夫决策模型分别进行仿真,仿真结果表明本文提出的随机博弈任务分配模型和分布式马尔科夫决策模型对动态环境具有良好的的适应性。最后,本文将动态环境下任务的动态分配与任务执行过程中协同控制结合起来,用来解决动态环境的问题决策。仿真结果表明,本文提出的方法能有效适应动态环境问题决策,对于动态决策理论和方法研究有一定借鉴意义。