● 摘要
随着互联网信息的爆炸性增长,人们越来越多的使用搜索引擎来获取想要的信息。同时,无线移动通信的发展和手机功能的增强,也揭开了无线搜索的时代。在任何一个搜索系统中,排序函数决定了返回结果与查询词的匹配程度,是搜索系统性能的关键因素,然而现存的搜索引擎以及无线搜索系统在查询精度及个性化搜索上与用户的需求还存有差距,这就是本论文的研究背景。向量空间模型和概率模型是基于内容的排序函数的两个基本模型,本论文选择使用向量空间模型,并利用遗传程序设计方法生成权重函数,与传统的经典的基于向量空间模型的TF-IDF排序函数和基于概率模型的Okapi和INQUERY排序函数进行比较,发现利用遗传程序设计生成的排序函数在查准率上高于其他所有的排序函数,并且由于遗传程序设计方法可以通过对训练集的学习产生,因此能够针对不同用户生成排序函数,从而实现个性化搜索。论文继而将实验结果应用到无线搜索系统上。无线搜索刚刚处于起步阶段,由于手机屏幕小,没有鼠标键盘等特点,所以对搜索的查准率要求更为苛刻。另一方面,手机用户与手机号码一一对应,使得能够非常便捷的跟踪用户的搜索记录,为不同用户生成不同的排序函数。本论文设计了一个基于短信平台的无线搜索系统,用遗传程序设计方法生成排序函数,完成查询与文档之间的匹配工作。