当前位置:问答库>论文摘要

题目:美国国会记录管理系统的设计与实现

关键词:下载;解析;输出

  摘要

美国国会记录管理系统是为管理美国国会相关记录而设计的Web应用系统。本系统提供了相关数据的下载,解析,编辑,输出文件等功能,可以很方便的管理美国国会的相关记录。本文重点分析了美国国会记录管理系统各个记录管理子系统的需求特点。针对不同数据来源,选择不同的数据下载途径。针对不同的数据文件类型,选择相应的数据解析技术。针对不同的文件输出,定义不同的节点内容。客户可以很方便的随时使用系统的下载功能下载最新的原始数据,下载后,分别对下载的数据进行解析,提取其中的相关信息,分别存入到数据库中对应的表中,供编辑和统计使用,最后生成XML文件,生成的XML文件经过客户的XCE转换引擎,转换成上线系统可以展示的数据文件格式供上线系统使用。针对不同记录管理子系统的不同数据解析的业务特点,通过采用各种开源项目,实现对不同格式数据文件的解析。对于xml文件,用SAX的方式进行解析,保证了解析的效率;对于html文件,用htmlparser进行解析,抽取了其中的所有文本信息;对于word文档,采用poi进行解析,提取整个表格的所有内容;对于其他的纯文本文件的各种数据,直接用JAVA的基本操作和正则表达式的匹配进行解析。解析结束后,将解析的数据存储到数据库中,针对Bill Text的特定需求,在解析文件的同时生成XML文件。最后描述了基于以上方案实现四个记录管理子系统相关的功能模块。与用户的旧的管理系统相比,新系统功能修改容易,具有更高的可维护性与易扩展性。本文最后描述了系统评测结果,证明本方案的可行性,对于同类的数据管理系统开发具有较强借鉴意义。