当前位置:问答库>论文摘要

题目:基于代数系统可靠性和完备性的有趣关联规则完备集研究

关键词:关联规则,广义冗余关联规则,强有趣关联规则集,可靠性,完备性

  摘要



在关联分析领域,传统的关联规则挖掘,可轻易产生数以千计甚至数以百万计的关联规则。如此庞大的规则集,用人工的方法很难从中提取出有价值的知识。传统关联规则集内绝大部分关联规则是无趣(Uninteresting)的冗余关联规则。

本文分析了关联规则间的集合特性和逻辑特性,提出有趣关联规则集、强有趣关联规则集、狭义冗余关联规则以及广义冗余关联规则的概念。有趣关联规则集为不包含狭义冗余关联规则的规则集,强有趣关联规则集为不包含广义冗余关联规则的规则集。强有趣关联规则集是在有趣关联规则集内进一步剔除冗余而得到的规则集,是有趣关联规则集的子集。证明了有趣关联规则集和强有趣关联规则集的可靠性和完备性:任一属于有趣关联规则集(强有趣关联规则集)的关联规则都不能被该集的任一子集覆盖或间接覆盖;任一不属于有趣关联规则集(强有趣关联规则集)的关联规则都必被该有趣关联规则集(强有趣关联规则集)的一个子集覆盖或间接覆盖。证明了强有趣关联规则集是此前提出的几种非冗余关联规则集的子集。基于定理,提出了强有趣关联规则集提取算法。实验表明,强有趣关联规则集远小于其他文献所提出的非冗余关联规则集,强有趣关联规则集内的关联规则更具代表性。