2018年石河子大学机械电气工程学院341农业知识综合三[专业硕士]之数据库系统概论考研仿真模拟五套题
● 摘要
一、简答题
1. DBS 中有哪些类型的故障?哪些故障破坏了数据库?哪些故障未破坏数据库,但使其中某些数据变得不正确?
【答案】(1)数据库系统中的故障主要有:事务故障、系统故障、介质故障。
(2)破坏了数据库的故障是介质故障;未破坏数据库,但使其中某些数据变得不正确的故障是事务故障和系统故障。
2. 数据仓库的4个基本特征是什么?
【答案】数据仓库的4个基本特征如下:
(1)数据仓库的数据是面向主题的。
主题是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。面向主题的数据组织方式是根据分析要求将数据组织成一个完备的分析领域,即主题域。
(2)数据仓库的数据是集成的。
操作型数据与分析型数据之间差别甚大,数据仓库的数据是从原有分散的数据库数据中抽取来的,因此数据在进入数据仓库之前,必然要经过加工与集成,统一与综合。
(3)数据仓库的数据是不可更新的。
OLTP 数据库中的数据经过抽取、清洗、转换和装载存放到数据仓库中(简称ECTL )。一旦数据存放到数据仓库中,数据就不再更新了。
(4)数据仓库的数据是随时间变化的。
数据仓库的数据是随时间的变化不断变化的,这一特征表现在以下三方面:
①数据仓库随时间变化不断增加新的数据内容;
②数据仓库随时间变化不断删去旧的数据内容;
③数据仓库数据的码键都包含时间项,以标明数据的历史时期。
3. 试述数据库物理设计的内容和步骤。
【答案】数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依赖于选定的数据库管理系统。数据库物理设计的主要内容是为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构。
数据库的物理设计步骤通常分为两步:
(1)确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构;
(2)对物理结构进行评价,评价的重点是时间效率和空间效率。
4. 数据输入在实施阶段的重要性是什么?如何保证输入数据的正确性?
【答案】(1)数据库是用来对数据进行存储、管理与应用的,因此在实施阶段必须将原有系统中的历史数据输入到数据库。数据量一般都很大,而且数据来源于部门中的各个不同的单位。数据的组织方式、结构和格式都与新设计的数据库系统有相当的差距,组织数据录入就要将各类源数据从各个局部应用中抽取出来,分类转换,最后
综合成符合新设计的数据库结构的形式,输入数据库。因此这样的数据转换、组织入库的工作是相当费力费时的工作。特别是原系统是手工数据处理系统时,各类数据分散在各种不同的原始表格、凭证、单据之中,数据输入工作量更大。
(2)保证输入数据正确性的方法:为提高数据输入工作的效率和质量,应该针对具体的应用环境设计一个数据录入子系统,由计算机来完成数据入库的任务。在源数据入库之前要采用多种方法对其进行检验,以防止不正确的数据入库。
5. 数据库系统与数据库管理系统的主要区别是什么?
【答案】(1)数据库系统是指在计算机系统中引入数据库后的系统构成,一般由数据库、数据库管理系统、应用系统、数据库管理员和用户构成。
(2)数据库管理系统是位于用户与操作系统之间的一层数据管理软件,是数据库系统的一个重要组成部分。
6. 简述E-R 模型、层次模型、网状模型、关系模型和面向对象模型各有哪些优缺点?
【答案】(1)E-R 模型的优缺点
①优点:接近于人的思维,容易理解;与计算机无关,用户容易接受。其缺点是:只能说明实体间语义的联系,不能进一步说明详细的数据结构。层次模型的优点是:结构清晰,表示各结
点之间联系的方式简单;容易表示如“家族关系”等现实世界的层次结构的事物及其之间的联系。
②缺点:不能表示两个以上实体型之间的复杂联系和实体型之间的多对多联系;严格的层次顺序使数据插入和删除操作变得复杂,如父结点的删除导致子结点的删除。
(2)网状模型的优缺点
①优点:能够表示实体之间的多种复杂联系;具有良好的性能,存取效率高。
②缺点:网状模型比较复杂,需要程序员熟悉数据库的逻辑结构;在重新组织数据库时容易失去数据独立性。
(3)关系模型的优缺点
①优点:使用表的概念,简单直观;直接表示实体之间的多对多联系:具有更好的数据独立性;具有坚实的理论基础。
②缺点:关系模型的连接等操作开销较大,需要较高性能计算机的支持。
(4)面向对象模型的优缺点
①优点:能够完整描述现实世界的数据结构,具有丰富的表达能力,能表达嵌套、递归的数据结构。
②缺点:涉及的知识面较广,用户较难理解。
7. 解释强制存取控制机制中主体、客体、敏感度标记的含义。
【答案】(1)主体是系统中的活动实体,既包括DBMS 所管理的实际用户,也包括代表用户的各进程。
(2)客体是系统中的被动实体,受主体操纵,包括文件、基表、索引、视图等。
对于主体和客体,DBMS 为它们每个实例(值)指派一个敏感度标记(Label )。
(3)敏感度标记被分成若干级别,例如绝密、机密、可信、公开等。主体的敏感度标记称为许可证级别,客体的敏感度标记称为密级。
8. 理解并给出F 列术语的定义:
函数依赖、部分函数依赖、完全函数依赖、传递依赖、候选码、超码、主码、外码、伞码(all-key )、1NF 、2NF 、3NF 、BCNF 、多值依赖、4NF 。
【答案】(1)函数依赖:设R (U )是属性集U 上的关系模式。X ,Y 是属性集U 的子集。若对于R (U )的任意一个可能的关系r , r 中不可能存在两个元组在X 上的属性值相等,而在Y 上的属性值不等,则称X 函数确定Y 或Y 函数依赖于X , 记作
Y 上的值一定相等)。
(2)部分函数依赖:若但Y 不完全函数依赖于X ,则称Y 对X 部分函数依赖,记作
:
(3)完全函数依赖:在R (U )中,如果并且对于X 的任何一个真子集都有
则称Y 对X 完全函数依赖,记作
(4)传递依赖:在R (U )中,如果
依赖,记为:
中的属性或属性组合,若则K 为R 的候选码。 (5)候选码:设K
为 则称Z 对X 传递函数(即只要X 上的属性值相等,
(6)主码:若候选码多于一个,则选定其中的一个为主码。
(7)外码:关系模式R 中属性或属性组X 并非R 的码,但X 是另一个关系模式的码,则称X 是R 的外部码,也称外码。
(8)全码:整个属性组是码,称为全码。
(9)1NF :关系模式R 的每一个分量是不可再分的数据项。
(10)2NF :关系模式
集)使得
(12)BCNF :关系模式且每一个非主属性完全函数依赖于码。 成立。 且Y 不是X 的子集时,X 必含有码。
(11)3NF :关系模式R中不存在这样的码X 、属性组Y 及非主属性Z (Z 不是Y 的子