当前位置:问答库>论文摘要

题目:基于Web使用挖掘的服务器端预取技术的研究与实现

关键词:Web使用挖掘/预取技术/关联规则/预取控制

  摘要

随着计算机网络规模的快速增长,以及网络资源的日益增多,导致网络流量不断增大,网络负载日趋严重以及 Web访问延迟的急剧增加。这样一来,对于访问量很大的门户网站来说如何让用户得到更好的服务,缩减Web访问延迟,以及减轻服务器的负载压力日益成为重要的课题。缓存技术被认为是减轻服务器负载、减少网络拥塞、降低客户访问延迟的有效途径之一,但作用有限。为进一步提高缓存系统的性能,引入了预取技术。预取技术利用客户访问的时间和空间局部性原理,在处理客户当前请求时,依据客户的访问模式对客户接下来可能访问的内容进行预测,并提前将预测内容放入到相应的缓存以备客户接下来访问。如果客户接下来请求的是己经预取的内容,则可以从缓存中快速地获得相应的内容,从而达到降低客户访问延迟,提高服务质量的目的。本文主要围绕Web预取技术中的服务器端预取技术进行研究,采用页面关联预取模型对Web访问进行预取。在利用已有的关联规则挖掘算法的基础上,设计并实现了关联预取模块,并对有序、无序两种页面关联规则挖掘的特点以及参数选择进行了测试分析。本文对缓存替换算法进行了研究,实现了按“需求驱动”的LRU替换算法。本文还对预取的控制问题进行了讨论,给出了一个比较实用的动态计算预取门限的公式,该公式基于预测模型提供的预测信息,解决了实际预取哪些Web对象、具体预取多少Web对象的问题。