● 摘要
网格是大规模的网络计算系统,它联合分布于世界各地的各种计算、存储等资源,通过共享与协同,形成一个虚拟的超级计算机。随着分布规模的扩大,资源数量的增长,网格资源的高度动态性和网格应用的可管理性要求网格中间件对系统内所有资源的状态进行实时监控,并在此基础上进行及时、准确的性能分析,从而及时发现故障,找出系统性能瓶颈,为网格资源调度及性能优化提供依据。由于网格是一个建立在广域网络上的复杂分布系统,现有的监控系统不能满足网格系统监控的需要,于是国内外许多著名的网格研究机构和学者都纷纷提出了相应的网格监控工具,全球网格论坛(GGF)也提出了一个网格监控体系架构GMA,但总体来说获得广泛认同的研究成果并不多。 本文首先分析了当前主流网格监控系统的功能特征及其存在的问题,然后借鉴现有的网格监控、性能分析相关技术,设计并实现了一种基于GMA、带监控代理结构的服务网格监控系统。在这个系统中,传感器以服务的形式部署在网格服务容器里,支持查询和订阅两种方式;资源定位与描述服务负责组织网格资源的拓扑结构,并为GMA监控结构提供目录服务;监控代理中间件作为消费者有组织性的,以一种合理的监控策略收集、存储、分析、展现监控数据,并作为生产者将结果发布给其他消费者模块。监控代理包括引擎、收集器、调度器、事件时间戳校正器、消费者等核心模块。 论文工作的主要特点体现在如下四个方面:1,分层的体系结构,可配置的收集/消费框架增强了系统的灵活性、可扩展性。2,针对不同的监控对象采用不同的监控策略,采用调度的思想实现高效的动态监控策略。3,收集监控数据的同时自动校正事件的时间戳,增强系统的容错性,减少网络时间同步开销。4,通过统计、预测、聚类、性能可视化等手段进行性能分析。
相关内容
相关标签