当前位置:问答库>论文摘要

题目:不确定数据环境下的效用模式挖掘研究

关键词:数据挖掘,不确定数据,分布式数据,效用项集挖掘

  摘要



        近年来,随着物联网与普适计算技术的广泛应用,对于如RFID数据,传感器数据,实时视频数据等不确定数据的收集在日趋增长。因此,针对收集到的单机型或分布式型不确定数据的频繁项或项集挖掘问题引起了数据库与数据挖掘领域的关注。而本文正是聚焦在不确定数据库中概率的效用项或项集挖掘问题。由于不确定数据固有的随机性,使得在不确定数据中挖掘频繁项集通常具有较高的计算复杂性,而且这些问题在分布式环境下也付出较高的通信成本。

        为了克服上述挑战,本文深入研究了两个有代表性的问题,即单机型不确定数据库中概率效用项集挖掘和分布式不确定环境下效用项挖掘。对于单机型不确定数据库中概率效用项集挖掘问题,本文提出了一个有效的基于深度优先搜索的求解框架,其包括一个有效的数据挖掘结构以协助挖掘处理过程和几项为了大幅减少搜索空间的剪枝与定界技术。另外,对于分布式不确定环境下效用项挖掘的问题,本文设计一个基于局部阈值的求解方案,该方案不仅提供一系列理论定界的确保机制,而且还尽可能地降低分布式通信成本。最终,本文通过在真实和合成的不确定数据集上的广泛实验验证了所提出算法的有效性。