● 摘要
网格计算通过共享和聚合分布在网络上异构资源的能力来求解复杂应用问题,成为面向广域网络的分布式计算技术发展的重要方向,得到学术界和产业界的普遍重视。网格工作流将工作流管理和网格计算相结合,实现多任务业务流程的分布式协作。然而,在复杂的网格计算环境中,服务资源的规模大、动态性特征明显,不同服务资源在执行效率、运行开销以及服务质量(Qos)等方面存在着显著差异。因此,如何针对网格工作流特征选择合适的服务资源,并将目标作业与服务资源进行绑定以满足业务执行的需求,已成为网格工作流研究中的一个关键问题。在现有关于网格作业调度等的研究和系统中,典型的调度方法是通过建立网格作业和服务资源之间的映射,形成相应的网格调度方案。但针对网格工作流调度的特征,现有网格作业调度方法仍存在一些不足。一方面,现在网格调度方法主要侧重解决单一网格作业在网格资源上的调度问题,很少考虑到针对具有流程特征的关联任务调度;另一方面,现在的作业调度算法主要是静态算法,缺乏对资源状态动态变化的考虑。针对上述问题,本文提出了一种基于启发算法的网格工作流调度算法GridDS,并设计和实现了网格工作流调度系统(Grid Workflow Scheduler,简称GWS)。首先,本文对作业调度的基本概念和原理进行综述,并分析了当前主流的启发式调度算法,以及国内外的工作流调度系统,在此基础上形成了网格工作流调度系统GWS的设计目标;然后,本文针对网格工作流特点,建立了网格工作流的调度模型,并提出了一种基于启发算法的网格工作流调度算法GridDS,并通过仿真系统对算法的有效性进行了验证;文章还分析了网格系统的容错问题,提出了重调度策略,按照这个策略在系统中出现故障的时候,系统根据故障信息重新调度未完成的任务,并通过仿真实验证明在系统中存在故障的情况下,重调度可以得到很好的结果;最后,设计并实现了一个支持网格工作流的调度系统GWS,GWS采用资源管理器和执行引擎的通知机制实现作业调度动态调整,利用多级阻塞队列实现作业负载均衡,并通过调度策略配置保证了系统的灵活性。论文最后通过实验对GWS的功能和性能进行了评测。
相关内容
相关标签