● 摘要
网络流量分析是网络管理中的一个重要方面,对于监控网络运行状况,了解网络应用分布情况,从而改善网络服务质量,实施网络规划有着重要意义。随着网络规模和复杂程度的日益增长,庞大的网络流量也给网络测量与分析工作带来了巨大挑战。 NetFlow技术是当前广泛采用的流量测量技术之一。本文采用NetFlow技术,对高速网络环境下的流量采集、数据处理及存储组织方法进行研究,设计并实现了一个基于NetFlow的流量分析系统的后台数据采集与存储系统,为流量分析提供有力的基础数据支持。 本文的主要工作和取得的成果有: 1、采用多线程的数据采集和处理技术,设计并实现了一个双链表流量数据缓存接收机制,确保数据接收不中断,有效解决了高速网络采集易丢包的问题,提高了采集可靠性。 2、将流生存时间等因素引入聚合策略的设计中,结合数据仓库多重粒度理论,提出了一种多粒度的流量聚合处理机制,并设计实现了基于hash原理的聚合流快速匹配算法,对大量原始数据进行有效整理和压缩。 3、在流量聚合的同时建立原始数据备用层,为高速网络环境的流量分析提供高效全面的数据支持。对于庞大的原始数据,结合网络流量普遍存在的“80/20”分布特性,提出了一种基于优先队列的大流标识法,实现了在流量损失很小的前提下对数据量的大幅缩减,有效提高系统处理性能,优化数据存储。 4、借鉴“滑动窗口”工作原理,设计实现了与聚合流匹配方法相适应的数据转存与内存清理机制,确保内存中的聚合流及时准确地转存到数据库中。还结合网络流特点,设计了可支持高效数据查询的数据存储组织方式,并给出了具体的查询策略。 系统实际运行测试证明,本文实现的流量采集与存储系统具有良好的性能表现和可扩展性,可适应高速网络大流量数据的采集。
相关内容
相关标签