● 摘要
论文介绍了云计算、云服务与管理平台特点及原理和它的应用。讲述了云服务与管理平台对可靠性、可用性、安全性的要求,说明云系统的故障感知及修复对保证服务质量水平的重要性。
对各种故障的解决应用在云系统进行研究,在此基础上对故障的特点及故障感知、故障定位、故障修复的特点及解决的特点和方法进行了总结、解释,对其架构进行了归纳、诠释,并诠释说明了作者的某些观点。阐述了自主维护的议题,并进而阐述了相应自维护系统,自修复系统。
分析了云服务与管理平台故障定位与修复的现状,以Openstack为例说明了目前大多云平台(IaaS平台)的故障特点与修复方法,包括控制节点故障、计算节点故障、存储节点故障、实例故障、系统级故障、网络故障等的特点与修复方法,说明了其为高可用而做的备份方法(其在某种程度上也是修复的基础),并综合说明了利用日志、监控、警告等感知与解决故障的方法与手段,对之进行阐释说明作者观点。
在研究冗余方法屏蔽故障的基础上进行分析,创新性地提出了云系统控制节点服务环的服务备份方法。
最后作者在基于对云服务与管理平台故障感知与修复的综合研究的基础上阐述了云系统平台未来发展的银行化、机器人化、360化的思想。
相关内容
相关标签