● 摘要
企业综合建设需要跨越多个业务运营系统,多系统环境下的海量数据分析与处理一直是统一制造资源管理的难点。本文用数据挖掘技术解决这一问题。利用数据仓库技术建立综合的信息资源平台,在该平台上对数据进行深层次地挖掘、分析生产业务数据,获取其中有用的信息,为管理决策和故障定位等提供支持。 统一制造资源查询系统由PDM系统、物资系统、质量系统等许多独立的专业系统组成。每个专业系统相对独立运行,各自对应着不同的业务和资源。 首先为解决在异构的数据源中获取数据的问题,作者设计了数据预处理模型对各类制造资源数据进行集成整理,使数据以一致的模式存储,建立了统一的数据仓库平台;其次,利用OLAP多维分析技术对数据进行切片、钻取和旋转,从不同角度、不同层次得到聚合数据,以型号的元器件组成为例,进行了成本分析、元器件需求分析和趋势分析,用于决策支持;再次,为解决海量数据分析问题,作者改进了关联规则算法,得出各专业系统中的业务数据的相关性规则,使得相对独立的业务系统集成统一。并以告警数据为例,建立了数据相关性模型以及告警相关规则。最后对制造资源数据进行分析统计,为用户提供统一的数据查询界面。 本文在分析原始告警信息特点的过程中,提出一个基于关联规则算法Apriori的告警相关性分析模型,对原始告警数据进行预处理,使处理后的告警数据可用改进的关联规则挖掘算法发现告警相关规则,压缩了告警数据量进而提高了挖掘速度和规则的准确率,并通过资源相关性和规则实用性对挖掘出的规则进行验证。实现了各制造资源管理系统与各个专业系统的信息双向传递与关联。 本方案已实际应用于统一制造资源查询系统,实现了对航天某厂制造资源数据的数据挖掘、分析、统计功能,支持大数据量的访问,能高效地响应用户请求。