当前位置:问答库>论文摘要

题目:全文检索系统的发展与建设

关键词:文献信息检索,全文检索系统,全文数据库,数据库技术

  摘要

随着信息时代文献量的急剧增加和计算机应用技术的推广,信息检索的方式发生了很大的变化。传统的文献管理、查询和提供方式的弊病是显而易见的。计算机技术的发展,为解决这一困难带来了曙光。随着联机技术和光盘技术的发展,二次文献检索、索引的检索服务已经不能满足信息用户的需要,因为用户在检索时只能得到指示性数据。信息检索技术随着计算机的发展而迅速发展。计算机信息检索经过了几十年的研究和实践,在理论和应用上都取得了重大进展,出现了众多新型的检索系统。那么,究竟哪一种检索系统才能更好的解决书刊检索与利用之间的关系呢? 数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源管理工具,也是计算机信息检索的基础。对于计算机信息检索系统来说,它是必不可少的信息资源。数据库的出现,加上使这种数据库得到广泛应用的计算机技术与通讯技术的发展,是信息传递手段的一个革命。它大大改变了人们获得信息的方式与速度。总之,在信息检索系统中,数据库占有核心的地位,是推动信息检索系统发展的主导方面。通过分析研究,本文认为全文检索系统的全文库具有其它数据库和信息媒体无可比拟的优点和特点。全文数据库允许用户查找的是整个的文献,而不是像在书目数据库中那样只是文献的替身(题录或文摘),系统允许线索系统出现于文献中任何地方的文字,而并非只能检索主题标目中所用的字。 全文检索系统是一个新型的检索工具,它对于帮助人们迅速准确地从浩如烟海的文献资料中猎取有关文字具有重大意义。作为信息检索的最新技术,全文检索系统与传统的文献检索系统相比有许多优点:能直接检索到原始文献,不需通过二次文献,检索直接可靠;文献中的任何篇章、段落、句子、词甚至字均可作为检索的入口,方便 灵活;检索详尽而彻底,不会产生漏检,可以检索到其他检索方法容易遗漏的边缘性信息;采用自然语言进行表音,避开了耗费人力与工时的标引工作,因而成本大大降低。全文检索技术是近年来数据库技术的发展趋势,代表着信息检索技术的发展方向,且总数量迅速增长,所占比重明显上升,目前已成为文字型信息检索的主流。本文对各大国际联机检索系统进行了考察,国外数据库发展最引人注目的变化就是全文数据库的迅速崛起。这种发展趋势对我国的数据库建设产生了积极的影响。 在信息检索领域,全文检索一直是比较复杂的问题。全文检索是基于全文标引的检索技术。置身现代社会,面对浩瀚的信息海洋,全文检索是迅速、准确获取所需信息的有力工具。全文检索与传统的主题词检索方法的根本区别在于,用户事先无需做任何标引,即可对全篇中文信息进行任何内容的检索。从人工赋词标引走向全文文本检索的主要标志。本文考察了全文检索系统对信息服务的影响,认为全文检索技术愈来愈成为信息系统中不可缺少的关键功能和必要手段,由于中文具有自身的特点,中文文献的计算机处理需要解决不同于西文的特殊难题,即中文文本的切分问题。八十年代以来,我国图书情报界及语言文字界在汉语词的切分问题上进行了不少研究,提出了一些自动分词的方案,但都不能令人满意。本文对中文检索技术进行研究,讨论了全文文本格式化处理问题,并且对切字标记法和单汉字标引法进行了比较分析,认为单汉字的处理模式有着很好的发展前景。最后,对我国全文库建设及存在的问题进行调研,并提出针对性的建议。我国的数据库建设迄今已初步形成了一定的规模,但目前仍属于建设和发展的初级阶段,还存在着许多问题和不利因素:对信息资源的建设没有引起足够的重视和合理的投入;全文库建库力量分散,规模小,更新慢;全文库的市场化程度低,影响资源共享和已有网络建设效能的充分发挥。这些问题的存在,极大地制约了我国已有网络设施效能的充分发挥。这些问题的存在,极大地制约了我国信息资源的有效利用,阻碍了我国信息资源产业的形成和发展。认为还应加强对全文库的理论研究和技术攻关,以促进全文检索系统向更快、更准、更有效的方向发展,使之在越来越多的领域中发挥作用。