● 摘要
并行计算已经成为研究科学和工程问题必不可少的实验工具,各领域需要更多的计算资源来量化和减少仿真中的不确定性,以及分析实验设备产生的大量数据。目前已有的超级计算机的体积庞大、耗电量高,未来超级计算机系统需要在性能、能耗、体积、资金共同约束下进行设计和实现。因此,如何将为数众多的计算节点进行高速互连并使数据传输更高效,成为内连网络需要解决的挑战性问题。 首先,Exascale超级计算机系统需要构建一套能够扩展连接数十万至百万个计算节点的并行网络,并能够延续已有设计思想以降低工程复杂度和研发费用;第二,需设计一种可行的网络扩展方法,能够以单个计算节点、单个多处理单元、单个机柜、多个机柜、整个系统的方式进行扩展,并考虑扩展时网络连接的最优化方案;第三,所设计的内连网络与同节点度网络相比要具有更优的网络拓扑性质,更高的吞吐量,更低的网络延迟;第四,需要根据并行应用的通信特点和内连网络局部不对称的特点,对网络路由方法进行优化。 针对以上问题,本文深入研究了一种并行计算应用,根据其对并行系统资源的需求,研究了并行计算内连网络的扩展方法、新型内连网络以及优化方法,并进行了仿真测试,主要研究内容如下:(1)使用离散粒子动力学(Discrete Particle Dynamics,DPD)方法的3维粘性流仿真。使用DPD方法建立百万粒子组成的不同收缩度的管道和流体,建立粒子间力场并调整力场参数,使粒子在施以外界动量的条件下,获得与计算流体力学和真实实验类似的无滑移边界条件、速度剖面的抛物面分布、回流区域和逆流通量,为下一步在更复杂边界条件下含更多高分子的流体仿真提供支持,为设计并行内连网络从应用角度上提供指导和通信模型。(2)设计交织旁路环绕网(Interlaced Bypass Torus, iBT)的系统扩展。研究将最近出现的iBT网络从单个计算节点扩展到全系统的方法,研究在扩展过程中出现的多种旁路连接模式及其适用范围,给出判断最优配置模式的方法。(3)提出了一种低延迟Mesh/iBT网络。研究将iBT网络与目前运算性能最高的日本“京”计算机的Tofu网络相结合的方法,改善后者节点组内与节点组间通信延迟差别较大的问题,并提出一种新的并行计算内连网络Mesh/iBT;通过对该网络进行仿真,测试该网络在典型的通信模型下的性能,并与同节点数网络进行对比。(4)提出了面向iBT网络的平衡路由。针对iBT网络局部不对称的特点,研究适合该网络的平衡路由,以平衡链路利用率。
相关内容
相关标签