当前位置:问答库>论文摘要

题目:电子商务搜索引擎的设计与实现

关键词:c2c;索引;倒排表;索引器;查询器

  摘要

从上个世纪90年代开始,互联网的迅猛发展给人们的生活带来了翻天覆地的变化;搜索引擎同电子邮件一并成为网上冲浪必不可少的工具。电子商务随着互联网的兴起渐渐成为了一种时尚,怎样尽快的帮用户找到想要的商品,将搜索技术应用在电子商务领域是本文研究的目标。 本文从一个实际项目出发,搭建了一套服务于C2C购物平台的搜索引擎。为实现该系统,本文引入了综合的全文索引引擎Apache Lucene的架构模型,即基础结构封装,索引核心,对外接口三个主要组成。为了系统的可扩展行,我们加入了分布式设计,由一个发布模块向多台索引服务器发送请求。系统的索引结构基于Luncen设计,为了保证系统的实时性和稳定性,设计了三种存储结构,分别为硬盘索引,内存静态索引,内存增量索引。为了能对商品的分类、属性进行查询,我们设计了共享内存中的属性存储结构,满足了用户的缩小搜索范围、排序需求。系统采用的中文分词方法是二元分词,目的是保证关键词的查全率。在部署方面,我们采用了先进的软硬件技术,如负载均衡,缓存技术,为解决国内南北互通问题,制定了同步机制。目前,我们的系统已上线使用,运行稳定,取得了较好的用户体验,在千万级的产品库中,产品被搜到的时间小于100毫秒。为了满足更多的搜索需求,我们的索引和分词还需要进一步优化。