● 摘要
我国的高性能计算机硬件技术近期几年得到了高速发展,但相关的软件设计技术的研究严重滞后,限制了高性能计算技术的应用。目前面临的问题是随着高性能计算机规模的扩充,其执行过程具有复杂性和不可预测性,并行程序的设计和优化越来越困难,因此需要高效的并行程序性能分析工具,帮助用户理解并行程序的运行情况,定位性能问题,继而优化并行程序性能。本文主要通过对并行程序低效行为模式及其发现方法的研究来发现并行程序的性能瓶颈。论文首先对当前性能分析技术及工具的发展现状与趋势进行了分析,重点调研了工具中采用的主流性能分析方法,比较了不同方法的优缺点。其次,研究了并行程序的性能评价标准,结合具体的实例分析了并行开销对并行程序性能的影响程度,在此基础上重点研究了基于消息传递的并行程序的通信特征,研究并总结并行程序通信(包括同步)中可能存在的低效行为模式,给出了一种通过低效行为树形结构视图和低效行为时间轴视图进行性能瓶颈可视化显示的方法。然后,论文提出了一种针对轨迹日志文件的并行程序低效行为发现方法,通过向日志文件中的原始事件添加指针属性,将其封装成高级事件,然后采用注册回调的方式,实现在扫描日志的过程中,快速发现并行程序性能瓶颈。最后,设计并实现了并行程序低效行为分析原型系统。进行了该系统的分层体系结构的设计,包括数据层,自动分析层和视图层。并实现了数据预处理、低效行为自动分析、低效行为分析结果可视化等主要的功能模块。
相关内容
相关标签