当前位置:问答库>论文摘要

题目:分布式视频搜索引擎系统设计与实施

关键词:搜索引擎,缓存,分布式,网络蜘蛛,倒排索引

  摘要



近年网络技术飞速发展,网络中的信息数量呈现几何级数爆炸增长,根据CNNIC最新报告,截至2013年底互联网普及率达到了45.8%,搜索引擎使用率达到79.3%,已经发展成为绝大多数网民访问网络的首要入口,网络视频用户规模达4.28亿,使用率为69.3%。用户通过网络收看视频时,目的性更强,43.5%的用户会选择搜索功能来寻找所需视频,庞大的网络视频用户规模和搜索使用习惯为视频搜索引擎的发展奠定了用户基础。 本论文以提高时光网视频搜索引擎系统性能和扩展性为研究背景,首先介绍了传统搜索引擎运行方式、分类和发展趋势,对搜索引擎和网络视频现状进行了分析和研究,阐述了实现分布式视频搜索引擎系统的必要性。接着分析了视频搜索引擎系统的数据流程,介绍了倒排索引、网络蜘蛛等相关技术,依据数据流程对系统功能性需求做了分析,对非功能性需求做了简单描述,并对系统进行了分层的架构设计、功能结构设计、网络拓扑设计和系统安全设计。同时为了优化系统性能,提高系统的并发能力和查询响应,降低网络延时和磁盘I/O带来的系统开销,重点详细分析设计了分布式缓存子系统,具有很强的针对性和实用性,最终成功地设计、实现了一套完整的分布式视频搜索引擎系统。系统的缓存子系统也在实践中得到了检验,在几千人并发访问情况下,系统能够非常稳定的运行,并且具有很好的响应速度和扩展性。时光网视频搜索引擎系统既满足了用户查找视频的需要,也为网站带来了超预期的点击次数和播放量。