当前位置:问答库>论文摘要

题目:面向分布式海量数据的决策支持技术研究

关键词:决策支持系统;时间序列;数据挖掘;数据仓库;面向服务;知识库

  摘要

本文以国家发改委设立的科学技术课题及南水北调施工管理信息系统项目为背景,针对决策支持系统研发过程中出现的关键技术问题,采用理论研究和实践相结合的方式,对分布式海量数据环境下决策支持系统的主要支撑技术进行了研究。重点研究了复杂报表驱动的数据仓库设计方法、基于粗糙集的时间序列数据挖掘相关算法。由于知识库已经成为智能决策支持系统的重要组成部分,本文也对基于面向服务体系架构(SOA)的分布式知识库管理系统进行了研究。研究工作主要取得了以下创新性成果:1、 为了提高数据仓库系统开发效率,对数据仓库设计方法进行了研究。提出了一种复杂报表驱动的设计方法,分析了这种方法与应用驱动和数据驱动两种方法之间的不同,指出了复杂报表驱动方法的四个特点,然后定义了用这种方法进行数据仓库开发应该遵循的五个步骤。通过对该方法在实际项目中的应用进行论述,证明了这种方法的优越性。2、 针对实际数据仓库构建中数据析取环节存在的特殊问题,对数据仓库构建的关键技术—数据析取技术进行了深入研究,根据项目特点设计了一种数据析取方案,并得到成功应用。3、 对时间序列数据挖掘技术进行了深入研究,提出了基于粗糙集的时间序列关联规则挖掘方法。引入了新的时间序列特征变量,提出了新的序列分割方法;利用归一化的时间序列曲线符合高斯分布这一特性对序列特征进行离散化。通过构造包含历史信息的决策表,使决策表可以挖掘时间序列上不同时间段内特征之间关联规则。为了避免回溯时间段数选择的随意性,提出了一种合理的回溯时间段计算方法。该挖掘方法的能力在实验中得到了验证。4、 针对当前知识库管理系统不能很好的满足决策者在异地使用知识库的问题,以及异地知识库之间互通受各知识库具体开发语言及平台限制的问题,对面向服务的分布式知识库管理机制进行了深入研究。结合国际标准化组织OASIS在面向服务体系结构(Service Oriented Architecture,SOA)方面的最新研究成果,提出了基于SOA的分布式知识库管理系统解决方案。