● 摘要
本项研究的主要目标是在解决路网环境的空间关键字查询问题,这也是当前国际数据研究领域的热点挑战之一。即在给定的路网环境下,依据用户输入的查询位置、查询关键字,检索出Top-k最优查询选择对象。其结果中的k个对象是以一个排序函数进行排名。特别的是,针对不同类型的查询应用,虽然该排序函数的表达形式各不相同,但其主要集成了每个对象在路网中距离查询位置的距离和每个对象所拥有的文本信息与查询关键字之间的相似程度。不同于现存的研究工作,本项研究主要目标可更细分为如下三个方面:第一,研究目标对象为路网环境。即所考虑的空间距离关系均为路网距离,这将更具有实用性;第二,另一目标是更好地理解文本自带的语义信息,而不是简单的字符匹配。第三,确保查询处理的有效性。即针对路网结构与文本数据的特点,本研究预期将设计通用的索引机制、快速的定界与剪枝策略与优化的查询算法。
本论文的主要研究内容如下:
1. 研究“基于最近邻居的Top-k空间关键字查询”。为了尽可能地避免查询过程中的冗余计算,我们需设计几种有效的剪枝策略和搜索定界机制来控制搜索空间的范围。此外,基于上述针对路网的索引机制,需设计一种高效的查询搜索算法以保证查询过程的有效性。
2. 提出并研究“竞争性空间关键字查询”。不同于“基于最近邻居的Top-k空间关键字查询”,竞争性空间关键字查询旨在用户给定查询范围内,根据用户给定的查询关键字,而推荐出Top-k最具有竞争力备选位置。所谓最具竞争力是指所推荐位置附近尽可能少的具有包含查询关键字语义的位置对象。此类查询在商铺选址、连锁经营投放中存在广泛应用。因此,我们需要设计适用于此类查询高效剪枝策略、搜索定界机制和有效的查询搜索算法。
相关内容
相关标签