当前位置:问答库>论文摘要

题目:大规模并行程序性能分析技术的研究与实现

关键词:并行程序;性能分析;数据挖掘

  摘要

随着并行技术的不断发展,并行程序性能分析成为开发高性能并行程序的一个重要方面。在实际中应用中,高性能计算领域面临实用性能与峰值性能差距日益增大的问题,因此需要对大规模并行程序性能分析技术进行研究和实现,使得用户能够快速定位性能瓶颈,从而开发出高质量的并行程序,提高实际运行性能。超级计算机的发展,其使用到的核心数逐渐增加,而且运行于其上的应用的复杂性也不断加大。因此,开发人员需要对并行应用的性能进行测量,并做出分析,以便对程序源码进行优化,提高程序的执行效率。但是由于核心数的大量增加,对并行程序性能进行测量将得到大量的性能数据,如何处理大信息量的性能数据,以便分析并行程序性能成为一个难点。本文主要研究了利用数据挖掘技术进行并行程序性能分析,建立性能数据模型,提出了基于迭代聚类的性能分析算法和基于半监督学习的性能分析算法,并实现了一个并行程序性能分析原型系统,论文的主要工作如下:研究了并行程序的性能数据特点,建立了性能数据模型,并以此为基础,介绍了一种基于迭代聚类的并行程序性能分析方法,该方法使用数据挖掘的聚类算法处理包含大信息量的性能数据,并可以根据条件迭代执行,然后利用贝叶斯信息准则评价聚类结果,最后用实验证明了算法的有效性。研究了用半监督学习知识来指导聚类性能分析结果,解决了聚类结果可解释性较弱的问题。首先描述了并行程序中的函数特征和开销特征,建立了并行程序函数分组模型和性能问题分类模型,提出了一种基于半监督学习的性能分析算法,最后通过实验证明了算法的有效性。设计并实现了一个大规模并行程序性能分析原型系统,主要将系统分为三个层次,即模型层,操作层,控制层和视图层。模型层完成对原始性能数据的封装,视图层完成显示功能,并触发相应的事件,控制层实现对模型层封装数据的操作,以及对视图层事件的响应和处理。