● 摘要
随着面向服务器领域的国产龙芯3号处理器成功研制,国产自主知识产权的服务器系统研究也加快了步伐,国内服务器厂商如联想、曙光等纷纷推出基于龙芯处理器的国产龙芯服务器。当前全国产的龙芯服务器与国外服务器在性能上依然存在较大的性能差距,国产龙芯服务器也无法满足国家信息安全领域日益增长的性能需求。要弥补国产龙芯服务器与国外服务器在性能上的巨大差距,一方面需要更新升级硬件平台本身的性能,另一方面也需要从操作系统与硬件平台适配的角度,进一步挖掘机器硬件的潜能,从操作系统角度出发着手性能优化研究相比于单纯提升硬件平台性能而言,成本更低,具有更高的可行性。 作为国产服务器操作系统的代表,中标麒麟操作系统在国产龙芯cc-NUMA( cache-coherence non-uniform memory access )平台上的性能亟待提高,本文的研究工作基于核高基重大专项课题“服务器操作系统研发及产业化”之“服务器操作系统性能优化技术研究”子课题,针对中标麒麟操作系统面向cc-NUMA体系结构支持的性能优化需求,以联想龙芯cc-NUMA服务器为依托,从优化系统吞吐量,进程响应延迟方面入手,研究中标麒麟操作系统内核的性能优化技术。 本文的主要工作和成果如下: 1)针对中标麒麟操作系统在开启和关闭cc-NUMA支持的不同场景下进行了详细的测试和分析,在此基础上分析了中标麒麟操作系统内核调度模块的代码,明确指出了中标麒麟操作系统内核在面向cc-NUMA支持方面的性能瓶颈; 2)针对中标麒麟操作系统在开启cc-NUMA支持后的吞吐量严重下降的问题,设计实现了基于CPU亲近性探测的进程自动分类绑定方法,从体系结构探测的自适应角度以及系统进程的自动识别分类角度出发,尽量减少cc-NUMA结构下的远地访存行为,从而提升了cc-NUMA支持情况下的吞吐量,降低了进程通信延迟; 3)针对中标麒麟操作系统在CPU密集型应用运行的情况下系统响应很缓慢的问题,设计实现了基于TTY-TASK关系模型的进程自动分组调度模块,从tty_struct和task_struct的关系模型出发,研究进程的自动分组方法,通过组调度来削弱单个CPU密集型应用对系统整体响应延迟的影响,从而降低系统的平均响应延迟,改善系统交互性。 通过对两个模块分别进行的性能测试结果表明,本文提出的方法对中标麒麟操作系统内核在龙芯cc-NUMA服务器平台上的吞吐量和系统交互性都取得了较好的优化效果,从而验证了本文提出的基于CPU亲近性探测的进程自动分类绑定方法和基于TTY-TASK关系模型的进程自动分组调度模块对系统性能优化的正确性和有效性。
相关内容
相关标签