● 摘要
随着现代科技水平的不断提高、网络的迅猛发展、计算机技术的不断改革和创新,大批量的数据不断涌现。怎样从这些数据中提取有意义有价值的信息成为人们一直关注的问题。随着各种新问题的不断出现,对聚类分析技术处理数据的能力的要求越来越高,该技术面临的挑战可谓是一个接一个。要想将这些新出现的问题统统解决掉,只有一个方法,那就是将聚类算法再改进,以便于处理这些问题。于是,各种各样的新聚类算法应运而生,当然也包括基于划分的聚类算法,这些算法在实际的应用中都取得了期望的效果。
由于现实世界中的信息很不精确,也不确定,更不完整,甚至很模糊,这就使得不确定性推理的应用显得重要无比。因为粒计算比较符合人类对问题求解的客观的规律,又能够涵盖模糊集、粗糙集理论等较多的领域,所以,在处理模糊、不确定知识的时候,在用知识来进行推理的时候,粒计算具有强大的优势、潜力。
本文在聚类分析、粒计算理论国内外研究现状的基础上,介绍了聚类的定义及聚类算法的种类,详细阐述了K-均值聚类算法和K-中心点聚类算法的基本原理并对它们的性能进行分析,对近年来各学者对基于划分的聚类算法的研究现状进行了梳理,对其具体应用实例做了简要介绍。将粒子、层次的概念给出,又介绍了等级、结构的定义,对有关粒计算的一些基本的问题做了简要说明,对涉及粒计算的3 个主要的计算模型进行了简单的描述,对粒度原理在聚类中的运用进行了重点阐述,根据粒度分析的原理,给出了聚类算法的新框架。本文的特色:提出了2 种新的算法,即:2 种新的确定最佳的初始中心的K-medoids 聚类算法,对2 种算法的思路及算法的步骤做了详细阐述,先是在人工模拟的数据集上对算法进行仿真的实验,后又通过UCI 机器学习数据库的标准数据集上对2 种算法进行实验,证明了2 种算法的有效性。
相关内容
相关标签