● 摘要
地球系统模式是地球科学领域用于气候预测与模拟的数值分析程序,利用模式程序进行建模模拟,已经成为研究地球环境演变机理,预测未来全球变化情景的主要手段与关键技术。随着气候研究与计算机技术的发展,模式模拟的范围日益庞大,模式结构更趋复杂,传统气候模式被封装耦合成为新模式的组成部分。在这种趋势下,地球系统模式的发展对相关分析工具提出了更高的要求。然而现有的并行调试与性能分析工具对耦合结构的支持性不好,不能够有效支撑地球系统模式的开发工作,无法满足气候研究的高速发展对开发工具的需要。论文对气候模式的组成结构与执行特征进行了深入研究,分析并总结了国内外并行调试与性能分析领域的研究成果,针对传统工具在模式开发领域中的问题,设计了适应气候模式结构与执行特征的性能分析方法。该分析方法以模式程序执行时的调用堆栈信息为基础,计算函数性能占用以及传递关系,根据气候模式专家的视角将程序资源消耗与传递行为转换为调用关系图,帮助模式开发人员在调试与性能优化前掌握分量模式的运行以及性能占用情况,缩小分析范围与工作量。论文基于该性能分析方法设计并实现了ESMD(Earth System Model Deconstructor),一种面向地球系统模式的性能监控工具,围绕气候模式开发的特殊需求以及模式耦合结构与迭代执行特征,实现了基于调试器的模式程序行为采样与调用路径合并,并在模式代码划分的基础上,实现了分量模式识别与调用关系分组聚合,最后得出各分量模式的性能占用与传递关系图。同时,ESMD还进一步对程序性能消耗中的等待情况进行重点统计与分析,分离各组成部分的损耗量,还原各分量模式的实际资源消耗,为性能优化与瓶颈分析提供参考。最后,论文将ESMD工具应用于气候研究实际应用中的通用地球系统模式(Community Earth System Model,CESM)与并行海洋模式(Parallel Ocean Program,POP),成功分析了模式程序的正常与异常执行状态,以及不同分量在并行规模扩大时的性能表现,通过在这些实际应用模式上的性能分析与监控测试,验证了本文的工作。