当前位置:问答库>考研试题

2017年安庆师范学院统计学原理(同等学力加试)考研复试核心题库

  摘要

一、简答题

1. 分层抽样与整群抽样有何异同?它们分别适合于什么场合?

【答案】(1)相同点:分层抽样和整群抽样都是需要事先按某一标志对总体进行划分的随机抽样。

不同点主要在于:分层抽样的划分标志与调查标志有密切关系,而整群抽样的划分标志不一定与调查标志有 关;分层抽样在总体的每个层内随机抽样,而整群抽样在总体全部群体中随机抽取一部分群体;比较计算公式可知,分层抽样的抽样误差取决于各层总体方差的平均数,而整群抽样的抽样误差取决于总体的群间方差;分层抽 样的目的(优点)主要是缩小抽样误差,满足推断各子总体数量特征的需要,而整群抽样的目的(优点)主要是 扩大抽样单位,简化抽样组织工作。

(2)适用场合:分层抽样用于层间差异大而层内差异小时,以及为了满足分层次管理决策需要时;整群抽样用于群间差异小而群内差异大时,或只有以群体为抽样单位的抽样框时等。

2. 简述非抽样误差类型。

【答案】非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体 真值之间的差异。无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。非抽样误差有以下几种类型:

(1)抽样框误差,是指抽样框中的单位与研宄总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。

(2)回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理答误差、记忆误差和有意识误差。

(3)无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。

(4)调查员误差,是指由于调查员的原因而产生的调查误差。

(5)测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。

3. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为y 如何依赖于自变量式中(2)多元回归方程:

根据回归模型的假定有

方程,它描述了因变量y 的期望值与自变量

(3)估计的多元回归方程:

回归方程中的参数

第 2 页,共 45 页 个自变量分别为是模型的参数描述因变量为误差项。 称为多元回归和误差项的方程称为多元回归模型。其一般形式可表示为

:之间的关系。 是未知的,需要利用样本

数据去估计它们。当用样本统计

时,就得到了估计的

多元回归方程,其一般形式为:

去估计回归方程中的未知参

式中

是参数称为偏回归系数。

4. 构建综合评价指数时需要考虑哪些方面的问题?

【答案】构建综合评价指数需要考虑如下几个方面的问题:

(1)进行理论研宄,其中包括统计指标理论以及统计指标体系的理论研宄,以便为确定所需的评价指标提供一定的理论依据。

(2)建立科学的评价指标体系。所建立的指标体系是否科学与合理,直接关系到评价结果的科学性和准确性。建立指标体系,首先应进行必要的定性研宄,对所研宄的问题进行深入的分析,尽量选择那些具有一定综合意义的代表性指标;其次,应尽可能运用多元统计的方法进行指标的筛选,以提高指标的客观性。

(3)评价方法研宄,主要包括综合评价指数的构造方法、指标的赋权方法以及各种评价方法的比较等。

5. 请给出你所知道的概率抽样的组织方式。

【答案】概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。调查的实践中经常采用的概率抽样方式有以下几种:

(1)简单随机抽样。简单随机抽样指从包括总体N 个单位的抽样框中随机地、一个一个地抽取n 个单位作为样本,每个单位入样的概率是相等的;

(2)分层抽样。分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、 随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;

(3)整群抽样。整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查;

(4)系统抽样。系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位;

(5)多阶段抽样。采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样;这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。

6. 简述标准化值的意义及计算公式。

【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。

第 3 页,共 45 页 的估计值是因变量y 的估计值。其中

其计算公式为:

标准差。 式中为变量的标准化值,是该组数据均值,s 为该组数据的

标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。

二、计算题

7. 某企业2007年11月1日对12名员工的抽样调查表明,他们从居住地到达工作地点花费的时间如下(分钟):

10,55,70,25,30,45,30,50,25,40,55, 90

(1)计算数据的均值、中位数和众数。你认为哪一个结果最能反映这组数据的一般水平?为什么?

(2)已知总体服从正态分布,

样本标准差等于计算总体均值95%

的置信区间。

(3)根据以上数据,在5%的显著性水平下能否认为总体中职工的平均上班时间等于35分钟?

【答案】(1)数据的均值为:

将表中数据排序可得:

中位数的位置是

由分组数据可以看到众数有三个,分别是25、30和55。

由于众数有多个,且众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数来反映数据的一般水平。而平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此中位数 最能反映这组数据的一般水平,它是一组数据中间位置上的代表值,不受数据极端值的影响。

(2)已知:因此,总体均值95%的置信区间是:

即为

(3)提出假设:

第 4 页,共 45 页 即在第6个数值40和第7个数值45之间,所以,数据的中位数