● 摘要
飞参数据由记录仪连续记录,数据规模大、参数多,没有明显的飞行标志位,并且含有噪声,对飞参数据的研究在指导飞机设计、试飞、故障预测及排除和事故分析等方面起着重要的作用。聚类分析技术处理大规模数据具有高效性,可以发现数据中隐含的模式,并且可以检测数据中的异常点,是飞参数据分析领域新的发展方向。本论文以实验室与三三二七厂的合作项目——“飞行数据仿真系统”为背景,对飞参数据进行阶段划分以及在此基础上研究其噪声处理方法,可以为故障诊断和趋势预测提供准确的数据源,进而为地面专家系统提供设计依据。重点研究了经典聚类算法和核聚类算法,并建立了飞参聚类分析的软件平台,具体研究内容和成果包括:研究分析了聚类算法,以采用经典聚类算法和核聚类算法对飞参数据进行分析为目标,突出了所选择、设计的算法的优势,并针对算法现存的缺点进行了改进:1)经典k-means算法的优势在于处理大规模数据速度快、易于实现和改进,但是初始中心的选择影响算法的收敛速度和聚类质量,提出了采用依概率二分产生随机初始中心的措施进行优化,实验证明优化措施有效;2)核聚类算法的优势在于处理高维、非线性的数据,并且可以识别孤立点,但是计算复杂,处理大规模数据具有局限性。针对这一点,文中重点研究了降低核聚类算法计算复杂度的方法:采用基于核顺序、硬盘存储核矩阵的措施实现kernel k-means算法,保留了k-means算法速度快的优势;采用基于平稳点的方法提高Support Vector Clustering算法的收敛速度,将算法的运行时间随数据规模指数增长改进为线性增长;3)三种算法及改进都用公认的标准数据进行了验证。在以上理论研究的基础上,设计了飞参聚类分析系统,建立了统一的软件平台,并针对聚类结果在时间上的交叠现象增加了滤波处理,用飞参数据验证了该系统的有效性。该平台以模块化、层次化的方式搭建,具有良好的开放性和可扩展性:一方面,平台可以继续容纳新的数据分析方法;另一方面,该平台也适用于其他领域进行聚类分析和异常点检测。