● 摘要
随着信息时代的来临,数据出现爆炸式增长。面对海量数据,企业对数据库系统的处理能力和计算强度要求越来越高;在此境况下,数据库集群开始逐步替代单一服务器模式的数据库,成为企业应对海量数据的首选。提高系统的可靠性和可用性是数据库集群的主要目标。随着信息时代数据量迅猛增长,存储系统规模越来越大。当存储容量到达PB级别时,系统的存储节点可能成百上千。数据规模的增加、数据访问负载的增大将导致存储节点频繁失效,系统的可靠性面临严峻的挑战。数据副本技术通过产生一定数量的副本,并且按照一定的规则散列在系统中,可以很大程度上提高系统可靠性。
本文基于分布式无共享架构的神通xCluster集群件,设计对散列到各个节点数据库上的数据分片进行冗余存储,实现集群的数据多副本,提高系统的可靠性和可用性。本文首先对神通xCluster集群件的整体架构与特性做了一个清晰的介绍。基于该架构以及神通xCluster集群件在实际上线环境中的维护经验,进行方案的需求分析并给出了用例模型。在此基础上,提出了该数据多副本方案的总体设计,并对该方案中需要解决的技术难点和解决方法进行了概述。在关键技术部分着重讲解了副本存储位置的选择算法,副本存储空间的划分,副本数据的一致性策略,副本的管理维护以及基于副本实现的负载均衡等。在介绍了总体设计与关键技术之后,详细说明各个功能模块的作用以及工作流程,并就模块中的重要算法进行了代码实现。
本文后面章节概要说明了集群数据多副本方案的测试结果,通过图的表现形式进行了直观的测试结果展示。在文章结尾总结了在实现集群数据多副本方案中的收获以及一些后续仍旧需要继续改进、完善的功能点,并对未来进行了思考和展望。
相关内容
相关标签