2018年北京大学地球与空间科学学院907计算机学科专业基础综合之数据库系统概论考研强化五套模拟题
● 摘要
一、简答题
1. 数据仓库开发的阶段有哪些?
【答案】数据仓库系统的开发可以划分为规划、分析、设计、实施和运行维护5个阶段: (1)规划活动:建立开发数据仓库系统的目标,确定数据仓库系统涉及的范围、制定开发计划、在进行了相应的可行性研宄后,启动开发项目。
(2)数据仓库分析阶段:其工作是在掌握企业或决策者的需求的基础上定义数据仓库的体系结构,进行需 求定义,了解企业或决策者的需求,弄清企业决策的类型与需要决策的问题,了解这些决策制定的过程,各自涉 及的信息及其来源,从而将关于决策的这种需求转化为对信息的需求、对业务过程的需求、以及对数据访问的需 求。
(3)数据仓库设计:包括主题域设计、物理数据库设计、源系统分析、数据变换设计等内容。
(4)数据仓库实施:包括建立数据仓库及数据仓库填充。
(5)运行管理:数据仓库系统开发是一个反复渐进的过程。当数据仓库建成运行后,仍然需要继续开发工作,还需要继续发展。
2. DBS 中有哪些类型的故障?哪些故障破坏了数据库?哪些故障未破坏数据库,但使其中某些数据变得不正确?
【答案】(1)数据库系统中的故障主要有:事务故障、系统故障、介质故障。
(2)破坏了数据库的故障是介质故障;未破坏数据库,但使其中某些数据变得不正确的故障是事务故障和系统故障。
3. 什么是处理数据操纵语言语句的解释方法和预编译方法?试述二者的区别、联系,比较各自的优缺点。
【答案】(1)解释方法
解释执行方法的具体做法是直到执行前,数据库DML 语句都以原始字符串的形式保存;当执行到该语句时,才利用解释程序去完成全部过程,同时予以执行。这种方法通过尽量推迟束缚过程来赢得数据独立性。
①优点:灵活、应变性强,甚至能适应在解释过程中发生的数据结构、存储结构等的变化,因此能保持较高的数据独立性。
②缺点:每次执行一个DML 语句时都要执行所有步骤,开销很大,因此效率比较低。 (2)预编译方法
预编译方法的基本思想是:在用户提交DML 语句之后,在运行之前对它进行翻译处理,保存产生好的可执行代码。当需要运行时,取出保存的可执行代码加以执行。
①优点:自动重编译技术使得预编译方法既拥有了编译时进行束缚所带来的高效率,又具备了执行时束缚带来的数据独立性。
②缺点:在束缚过程中进行优化所依据的条件可能在运行前已不存在,或者数据库结构已被修改,因而导致已作出的应用规划在执行时不再有效。
4. 什么是数据库的逻辑结构设计?试述其设计步骤。
【答案】(1)数据库的逻辑结构设计就是把概念结构设计阶段设计好的基本E-R 图转换为与选用的DBMS 产品所支持的数据模型相符合的逻辑结构。
(2)数据库的逻辑结构设计步骤为:
①将概念结构转换为一般的关系、网状、层次模型;
②将转换来的关系、网状、层次模型向特定DBMS 支持下的数据模型转换;
③对数据模型进行优化。
5. 什么是大数据,试述大数据的基本特征。
【答案】(1)大数据是指无法在可容忍的时间内用现有IT 技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。
(2)大数据的基本特征如下:
①大数据的首要特征是数据量巨大,而且在持续、急剧地膨胀。
②大数据异构的数据类型、不同的数据表示和语义解释多样。
③大数据具有快变性也称为实时性,一方面指数据到达的速度很快,另一方而指能够进行处理的时间很短,或者要求响应速度很快,即实时响应。
④大数据的价值是潜在的、巨大的,大数据不仅具有经济价值和产业价值,还具有科学价值。这是大数据最重要的特点,也是大数据的魅力所在。
6. 什么是数据库的概念结构?试述其特点和设计策略。
【答案】(1)在需求分析阶段所得到的应用需求应该首先抽象为信息世界的结构,才能更好地、更准确地用某一DBMS 实现这些需求。所以概念结构是信息世界的结构,即概念模型。
(2)其主要特点是:
①能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求,是对现实世界的一个真实模型;
②易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库设计成功与否的关键;
③易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充;
④易于向关系、网状、层次等各种数据模型转换。
(3)概念结构的设计策略通常有四种:
①自顶向下,即首先定义全局概念结构的框架,然后逐步细化;
②自底向上,即首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构;
③逐步扩张,首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构;
④混合策略,即将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。
7. 试述数据、数据库、数据库管理系统、数据库系统的概念。
【答案】(1)数据是数据库中存储的基本对象,是描述事物的符号记录。数据有多种表现形式,它们都可以经过数字化后存入计算机。数据的种类有数字、文字、图形、图像、声音、正文等。
(2)数据库是长期储存在计算机内、有组织的、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。数据库数据具有永久存储、有组织和可共享三个基本特点。
(3)数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。
(4)数据库系统是指在计算机系统中引入数据库后的系统,一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成。
8. 数据库中要存储和管理的数据内容包括哪些方面?
【答案】数据库系统中数据的物理组织必须体现实体之间的联系,支持数据库的逻辑结构——各种数据模型。因此数据库中要存储4个方面的数据:
(1)数据描述,即数据的外模式、模式、内模式;
(2)数据本身;
(3)数据之间的联系;
(4)存取路径。
9. 设有4个关系模式如下:
其中,S 表示供应商,它的各属性依次为供应商号、供应商名、供应商所在省份和供应商所在城市;P 表示零件,它的各属性依次为零件号、零件名、零件颜色、零件重量和单价;J 表示工程,它的各属性依次为工程 号、工程名和工程所在城市;SPJ 表示供货关系,它的各属性依次为供应商号、零件号、工程号和供货数量。用 SQL 语句实现下面的查询要求:
相关内容
相关标签