当前位置:问答库>论文摘要

题目:大规模并行系统模拟器事件捕获与模拟控制的研究与实现

关键词:系统结构;高性能计算;大规模并行系统;模拟器;模拟控制

  摘要

最近20年来,国民经济的多个领域对高性能计算机的需求越来越强烈。为了满足日益强烈的高性能计算需求,我国已经成功的研制出了百万亿次、千万亿次的大规模并行计算机系统。由于大规模并行计算机系统的处理能力,与应用程序、操作系统、编程模型、硬件平台等多个因素相关,因此在系统设计阶段就需要综合考虑这些因素得到最适合的方案。为了设计更符合需求、合理的大规模并行计算系统,系统结构模拟技术是一种重要的研究手段。本文属于国家信息领域重大项目“高效能计算机系统研制及关键技术研究”中的子课题“模拟与性能评价子课题”。论文通过对当前体系结构软件模拟技术的深入调研和分析,提出并实现了一种基于执行驱动的,支持分布式并行模拟,并且可以根据需要灵活扩展宿主系统规模的大规模并行系统模拟器设计方案。针对大规模并行系统更加关注系统级别性能表现的特点,该方案采用与目标系统同构的节点作为宿主节点,避免了不必要的如Cache访问、指令等部件级的模拟,更加关注进程之间通信、同步、调度等系统级事件,从而在保证模拟准确度的前提下提升了模拟器的执行效率。论文详细介绍了方案中的事件捕获和模拟控制机制,该套机制可以正确且高效的捕获模拟器关心的模拟事件,并根据这些模拟事件获得应用程序在目标系统中的运行状态。本文设计并实现的模拟器支持Linpack等基于MPI的并行应用程序的运行,因此通过模拟器可以获得大规模并行系统的在特定应用程序下的性能表现,进而修改和完善大规模并行系统的设计方案。论文的最后对本文所属课题拟采用的大规模并行系统设计方案进行了模拟验证和评价,结果表明本文实现的并行系统模拟器对大规模并行系统的研究和开发具有很好的指导意义。