当前位置:问答库>论文摘要

题目:基于软件结构模型的文档与代码间可追踪性研究

关键词:软件结构,信息检索,可追踪关系,自然语言处理

  摘要



 

        在软件开发过程中,软件产品主要以文档和代码的形式存在,软件文档(包括需求文档、设计文档、用户手册等)包含着丰富的专业领域知识,并与源程序代码之间存在着不同程度的关联。如今,计算机软件的规模越来越大、复杂程度越来越高,提取和维护软件文档与代码间的可追踪关系,会给软件需求跟踪、程序理解、软件维护等软件工程活动带来很大的帮助。

        本文调研了国内外在软件文档与代码间可追踪性分析方面的研究现状,分析了信息检索模型在可追踪关系提取研究中的应用及其优缺点。针对存在的问题,本课题旨在研究中文软件文档与源代码间可追踪关系的提取方法,并实现一个原型工具来支持可追踪关系的自动提取。

        经过调研分析,本文总结了中文软件文档和程序源代码各自的结构特征和内在关联特性,提出了一种将软件结构模型与信息检索技术相结合的中文软件文档与代码间可追踪关系提取方法。该方法基于构建的软件结构模型分别对文档和代码结构信息进行分析,改善预处理效果,优化相似度计算过程,进而提高整体方法的有效性。论文研究工作主要包括以下三个方面:文档与代码的预处理、相似度计算、结果处理与展示。(1)在文档与代码的预处理方面,结合文档和代码的结构特点,针对文档切分、英文翻译、分词、英文缩写词扩展、表格与模型处理、代码成分及其结构关系的提取提出了一些改进方法和策略。(2)在相似度计算方面,在利用信息检索模型计算向量相似度的基础上,加入了基于代码结构信息的再计算,以提高可追踪关系的计算精度。(3)在结果处理与展示方面,利用Cut-Point方法对相似度计算结果进行处理,并可对处理后的结果进行显示和相关操作。基于上述方法,本文设计实现了一个自动提取中文软件文档与源代码间可追踪关系的原型工具。

        最后,本文设计了三个实验,针对两个真实的软件项目进行分析。实验结果表明,本文提出的方法在提取中文软件文档和代码间可追踪关系方面是可行的、有效的,与一般方法相比,不仅可以提高查全率和查准率,而且能够找到较多正确的可追踪关系。另外,通过对几个典型实例的分析,展现了本文研究的实用价值。