当前位置:问答库>论文摘要

题目:可重构计算系统中的容错技术研究

关键词:容错;可重构计算;域划分;故障恢复

  摘要

德国著名学者Reiner Hartenstein在2000年预测Makimoto曲线未来发展趋势时指出,可重构计算结合了生产标准化和应用可定制化的特点,将是未来体系结构的发展方向[1]。然而,可重构计算的核心是现场可重复编程的集成电路,芯片复杂性日益增加以及特征尺寸的不断减小导致了它必然面临日益严峻的可靠性问题[2]。为了使可重构计算能够适应安全攸关的应用领域,必须在可重构计算系统中实施容错技术。在可重构计算系统中实施容错技术从而实现高成本效益高可靠性的高性能计算系统,国内外的研究者对此提出了很多设计方法与实施案例。这些研究有一个共同的目的,即如何充分利用可重构器件内有限的冗余资源尽量提高系统的可靠性。本文从用于故障恢复的候选配置的资源分配问题入手,为容错可重构系统的可靠性最优化提出一种新的思路,主要贡献包括:1. 揭示了容错可重构系统的可靠性及可用性随候选配置数量及电路分片数量变化的规律。指出候选配置数量的增加将使系统从故障中恢复所需的重构尝试次数增加,从而降低系统的可用性。同时发现与增加候选配置数量相比,增加电路分片数量能够更有效地提高系统的可靠性。2. 提出了非线性规划域划分方法,用于对容错可重构系统进行可靠性最优化设计。该方法使用本文提出的基于子区域定义矩阵的可靠性模型作为最优化问题的目标,从而把容错可重构系统中多个候选配置所占用的可重构资源的分配问题建模为非线性规划问题来求解。本文也给出了使用非线性规划域划分方法进行容错可重构系统设计的实施流程。实验表明该方法能够给出比现有方案可靠性更高的可重构资源分配方案,同时候选配置所占用的存储开销不超过现有研究。3. 提出了二阶近似域划分方法,用于加快容错可重构系统可靠性最优化问题的求解速度。该方法将本文提出的二阶近似可靠性模型作为最优化的目标,避免了在最优化过程中精确计算可靠性引起的不必要的时间消耗,从而显著加快了可靠性最优化问题的求解速度。4. 提出了域划分模型下基于向量筛选的启发式可靠性优化方法。该方法将电路划分成更大的子区域(subarea)。使得在多个故障发生的情况下,新故障有更大的概率落在已故障子区域,因此减小了对当前未故障配置的影响,从而提高了电路可靠性。该启发式方法的求解速度显著高于基于最优化理论的方法。本文的研究内容主要适用于(但不局限于)使用预先产生的配置进行故障恢复的可重构计算系统。必须强调,本文的研究主要是基于域划分模型的理论研究,由于域划分模型是对于具有多个最小路径的均一单调的容错系统的抽象,因此本文的研究并不仅仅适用于以可重构芯片为基础的容错系统,对于有可靠性要求的可重构片上网络、芯片集群(FPGA Farm)、分布式容错系统及容错传感器网络等容错系统的可靠性最优化问题也具有参考价值。