当前位置:问答库>论文摘要

题目:异构分布式系统中容错关键技术的研究与实现

关键词:异构分布式系统;暖备份;容错调度;失效检测

  摘要

随着计算机和网络技术的发展,分布式系统广泛应用于各种领域,其中一些关键领域对系统可靠性要求很高。如何满足应用的可靠性需求成为了分布式技术发展中的一个重要问题。软件容错为提高系统的可靠性提供了一条有效途径。现阶段,异构分布式领域中的容错技术研究在容错消耗和容错能力两方面的平衡尚不够好。本文基于现有技术,从更好地平衡容错消耗和系统性能出发,对异构分布式系统容错技术的主要理论及工程实现问题进行了研究。 首先,从系统的故障类型出发,探讨了可行的容错方式;结合具体应用场景,说明了异构分布式系统容错的关键技术;并给出了本文分布式容错系统(Distributed Fault-tolerant System,DS-FTS)的整体框架。 接着,本文着重对这些关键技术进行了研究,提出了一种更高效的失效检测算法;给出了一种基于状态备份的暖备份方式,并分析了其中的一致性维护问题;基于Markov链对系统的故障情况进行建模,从获取系统最大可用度的角度,对最佳的状态备份间隔进行了分析和求解。然后,在前述研究成果基础上,给出了基于状态备份的容错调度算法(State-based Primary Backup Real-Time First-fit Schedule,SPB-RTFS),该算法以最小最坏反应时间(Worst Case Response Time,WCRT)作为启发规则进行主/从任务的调度。仿真实验表明,与常用的CPB-RTFS与CSP-RTFT算法相比,SPB-RTFS具有更好的稳定性、更快的恢复速度和更高的任务接收率。 最后,结合本文理论研究成果,在某作战系统中实现了该DS-FTS容错系统。并依据实际应用,对其进行了功能和性能测试,测试结果表明DS-FTS满足了应用的容错需求,也说明本文的研究成果是一种解决异构分布式系统容错问题的有效方法。