● 摘要
云计算是当前国内外研究的热点之一,旨在基于共享资源池而按需提供服务。其中,负载均衡是云计算中的重要问题之一,主要研究如何对请求工作量进行合理的调度,以保障用户的服务质量、降低服务提供者的资源使用开销。
与传统的分布式计算环境相比,云计算环境广泛采用多租户技术以提高资源的利用率,其中一个服务器节点内往往部署有多个应用,且每个应用的服务质量需求各不相同。应用之间由于共享相同的硬件资源而存在相互竞争的关系,因而可能会对性能造成影响,从而导致服务质量需求无法得到满足。鉴于此,本文旨在研究云平台中的负载均衡问题,即如何合理地对请求工作量进行调度,从而保障所有应用的服务质量(平均响应时间),同时尽可能地提高资源的利用率。
本文首先对云平台负载均衡的相关技术以及研究现状进行了分析与总结,接着针对本文所研究的问题,采用了M/G/s/s+r 排队模型进行建模与分析,推导出应用的平均响应时间与请求到达率之间的关系。然后根据应用的平均响应时间需求,分别推导出单应用与多租户服务器的吞吐量限制的计算方法,提出了一种新的基于服务器吞吐量限制的负载均衡策略(STR),能够有效地保障所有应用的平均响应时间,同时使得服务器有着较高的吞吐量。
基于上述研究成果,本文设计并实现了一个面向服务云平台的负载均衡系统,能够动态收集并统计部署在云平台中的应用的监控信息,并实时更新服务器内的吞吐量限制。本文实现了一个反向代理服务器,能够根据不断更新的路由表信息提供动态的、准确的负载均衡,提高了负载均衡系统的适应性。
最后,本文设计了一系列请求测试实验,对比分析了STR、RR(Round-Robin)、LWR(Least-Work-Remaining)三种负载均衡策略的性能表现,通过实验结果对STR 算法的有效性进行了验证。
相关内容
相关标签