当前位置:问答库>考研试题

2018年北京大学前沿交叉学科研究院907计算机专业基础之数据库系统概论考研核心题库

  摘要

一、简答题

1. 试述关系数据库的特点。

【答案】关系数据模型具有下列优点:

(1)关系模型与非关系模型不同,它是建立在严格的数学概念基础上的。

(2)关系模型的概念单一,无论实体还是实体之间的联系都用关系来表示。对数据的检索和更新结果也是关系(即表)。所以其数据结构简单、清晰,用户易懂易用。

(3)关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性,同时也简化了程序员的工作和数据库开发建立的工作。所以关系数据模型诞生以后发展迅速,深受用户的喜爱。

当然,关系数据模型也有缺点,其中最主要的缺点是,由于存取路径对用户透明,查询效率往往不如格式化数据模型。因此为了提高性能,DBMS 必须对用户的查询请求进行优化因此増加了开发DBMS 的难度。不过,用户不必考虑这些系统内部的优化技术细节。

2. 试述数据库物理设计的内容和步骤。

【答案】数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于选定的数据库管理系统。数据库物理设计的主要内容是为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构。

数据库的物理设计步骤通常分为两步:

(1)确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构;

(2)对物理结构进行评价,评价的重点是时间效率和空间效率。

3. 设计一个程序采用游标方式输出求每个学生的班号、学号、姓名、课程名和分数,并以班号和学号排序, 给出程序的执行结果。

【答案】对应的程序如下:

--声明共享变量

本程序的执行结果如下:

4. 什么是处理数据操纵语言语句的解释方法和预编译方法?试述二者的区别、联系,比较各自的优缺点。

【答案】(1)解释方法

解释执行方法的具体做法是直到执行前,数据库DML 语句都以原始字符串的形式保存;当执行到该语句时,才利用解释程序去完成全部过程,同时予以执行。这种方法通过尽量推迟束缚过程来赢得数据独立性。

①优点:灵活、应变性强,甚至能适应在解释过程中发生的数据结构、存储结构等的变化,

因此能保持较高的数据独立性。

②缺点:每次执行一个DML 语句时都要执行所有步骤,开销很大,因此效率比较低。

(2)预编译方法

预编译方法的基本思想是:在用户提交DML 语句之后,在运行之前对它进行翻译处理,保存产生好的可执行代码。当需要运行时,取出保存的可执行代码加以执行。

①优点:自动重编译技术使得预编译方法既拥有了编译时进行束缚所带来的高效率,又具备了执行时束缚带来的数据独立性。

②缺点:在束缚过程中进行优化所依据的条件可能在运行前已不存在,或者数据库结构已被修改,因而导致已作出的应用规划在执行时不再有效。

5. 登记日志文件时为什么必须先写日志文件,后写数据库?

【答案】把对数据的修改写到数据库中和把表示这个修改的日志记录写到日志文件中是两个不同的操作。有可能在这两个操作之间发生故障,即这两个写操作只完成了一个。

如果先写了数据库修改,而在运行记录中没有登记这个修改,则以后就无法恢复这个修改了。如果先写日志,但没有修改数据库,在恢复时只不过是多执行一次UNDO 操作,并不会影响数据库的正确性。所以一定要先写日志文件,即首先把日志记录写到日志文件中,然后进行数据库的修改。

6. 什么是大数据,简述大数据的分类与基本特征。

【答案】(1)定义

大数据是指无法在可容忍的时间内用现有IT 技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。

专家给出的定义:

大数据通常被认为是

包括结构化

的、半结构化的和非结构化的数据。其规模或复杂程度超出了传统数据库和软件技术所能管理和处理的数据集范围。

(2)分类

①海量交易数据(企业OLTP 应用)

海量交易数据的应用特点是数据海量、读写操作比较简单、访问和更新频繁、一次交易的数

据量大大,但要 求支持事务ACID 特性。对数据的完整性及安全性要求高,必须保证强一致性。

②海量交互数据(社交网、传感器、全球定位系统、Web 信息)

海量交互数据的应用特点是实时交互性强,但不要求支持事务特性。其数据的典型特点是类型多样异构、不完备、噪音大、数据增长快,不要求具有强一致性。

③海量处理数据(企业OLAP 应用)

海量处理数据的应用特点是面向海量数据分析,计算复杂,往往涉及多次迭代完成,追求数据分析的高效率,但不要求支持事务特性。

或或更高数量级的数据,