当前位置:问答库>论文摘要

题目:高可用性集群在CMS系统中的分析与应用

关键词:高可用性;单点故障;集群;超时管理;软件故障管理

  摘要

本文基于“IBM中国技术支持中心电话管理系统的高可用性需求”,首先分析了CMS系统运行中的风险,接着介绍了解决风险的高可用性集群技术,以及基于Solaris平台的Sun cluster server集群控制管理。通过应用廉价冗余磁盘阵列(RAID5)来实现数据存储层的冗余备份,Sun Cluster Server的IP多路径来实现网络层的冗余备份,Sun cluster server 的数据服务来实现应用层的冗余备份。冗余备份的实现消除了系统运行中的单点故障,保障当CMS系统发生故障或系统升级时,CMS系统的可持续运行。 论文以CMS系统应用层冗余备份的实现为研究重点;以高可用性集群应用设计框架为基础;归纳了CMS系统高可用性集群应用过程中的关键问题;介绍了Sun Cluster Server的资源组超时管理策略,分析了该超时管理策略的不足,并提出了一种新的针对具体应用资源的超时管理策略;论文还讨论了Sun Cluster Server的软件故障管理策略,针对其无法解决资源多次重启问题,分析并给出了相关解决方案。 最后,论文详细阐述了CMS系统高可用性集群应用在Sun Cluster Server上的的具体实现,通过应用普通数据服务作为系统的资源类型来实现对CMS系统的启动、停止和监控。同时论文中给出了具体测试案例来保证系统满足高可用性需求。