● 摘要
网格计算(Grid Computing)是一类典型的客户/网络计算模式,其目的是将分布在不同地理位置的计算资源,包括计算力、内存空间、网络带宽和专业处理能力等,通过高速的互联网实现资源的集成和充分共享,以提供高效的计算、管理及服务资源的聚合与协同能力。然而,这种理想的协作机制在实际应用中却遇到很多问题,由于动态作业信息的不确定性、节点潜在的故障性及加入退出的扰动性等因素,导致了网络中节点的负载失衡,阻碍了系统整体性能的提高。因此,如何在分布式网络环境中快速地搜索可用资源,平衡不同节点的负载,实现高效的资源使用率,是网格系统中一个关键的研究问题。网格负载平衡系统的核心依赖于合适的负载平衡机制及其算法。因此,本文从网格的基本概念、应用环境特点出发,分析了现有的分布式负载平衡技术的特点和局限;其次,针对当前研究中所存在的问题,建立了网格环境中节点拓扑结构及其分层管理体系模型,提出了该模型下一种完全分布式的动态负载平衡机制,并自主设计其算法;然后基于“以网络为基础的科学活动环境综合试验平台—CROWN”,设计并实现网格负载平衡原型系统;最后采用特定的应用实例和定量的数据采集手段对此负载平衡原型系统的功能实现情况和实际运作能力进行了检验和分析。论文工作的主要特点体现在如下四个方面:①针对网格系统的环境特征和系统需求,建立节点拓扑结构及其分层管理体系模型;②提出该模型下一种完全分布式的动态负载平衡机制,以提高资源搜索的效率和负载迁移的成功率,降低通信开销,提高整体系统的运行效率,并自主设计其算法;③利用可配置的链式处理结构以适应网格服务处理需求的易变性和多样性;④实现了方便的负载迁移功能,保证了网格服务对用户的透明性,并及时回送服务结果。