当前位置:问答库>论文摘要

题目:非线性有限终值时间系统最优化控制的研究

关键词:最优化控制;链式系统;状态反馈控制

  摘要

在此研究中,运用动态法则推导出了Hamilton-Jacobi-Bellman (HJB) 和Hamilton-Jacobi-Isaacs (HJI) 等式,运用神经网络方法来解Hamilton-Jacobi等式,所得到的算法被用来在线性系统,非完整链式系统和非线性旋转激励的平移振荡器上进行仿真试验。同时在北京邮电大学BYQ-5球形机器人上进行了姿态控制的试验。首先,讨论了非限制性输入系统最优化控制,介绍了值函数神经网络逼近方法,而且在 上,在一定大小的网格上,通过运用最小二乘法来解等式。此方法能够逼近求解时变HJB等式,并且不需要运用GHJB等式所要求的控制法则来进行迭代计算。其次,运用神经网络来逼近解有限时域最优化 状态反馈控制问题。此方法通过解对应有限时域零和博弈问题来解相关的Hamilton-Jacobi-Isaacs等式。神经网络在状态空间上逼近相应的值函数,并且可以求出此神经网络的输出控制。此方法表明神经网络可以一致逼近博弈值函数,其计算出来的控制可以保证系统的闭环稳定性和有限 增益,得到的结果是一个近 时变系数状态反馈控制器,此方法可以事先离线计算。再次,通过调查一致完全可控性和计算相关的结果来解非完整链式系统。实例说明链式系统并不能满足线性可控性稳定,但可以通过时间折叠变换方法得到可控解。时间折叠方法可以在不需要任何状态变换的情况下,得到一个连续的渐近稳定控制。最后,运用球形机器人系统验证了前面章节所推导的算法的有效性,试验结果表明神经网络HJB/HJI方法基本满足机器人姿态控制的要求。