当前位置:问答库>考研试题

2017年北京师范大学统计学院3402统计学基础(二)复试实战预测五套卷

  摘要

一、简答题

1. 下列调查问卷中的提问都有问题,请修改。

(1)您和您爱人是否对现有住房满意? (2)您最近一次是几点上班的?

(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗? 【答案】(1)您对现有住房满意吗?您爱人呢? (2)您最近一次的工作是几点上班? (3)您认为明光牛奶的口味纯正吗?

2. 要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?

【答案】方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。

检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的检验。随着增加个体显

著性检验的次数,偶然因素导致差别的可能性也会増加(并非均值真的存在差别)。而方差分 析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

3. 简述统计分组的原则。

【答案】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组 中重复出现;不漏是指组别能够穷尽。即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某 一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根 据“上组限不在内”的规定解决不重的问题,也可以对一个组的上限值采用小数点的形式,小数点的位数根据所 要求的精度具体确定。

4. 中心极限定理。

【答案】设随机变量

相互独立(S 卩,对任意给定的

相互独立)且服从同一分布,该分布存在有限的期望和方

也就是说,当n 趋于无穷大时,

的分布趋向于标准正态分布

5. 简述估计量的无偏性,有效性和一致性。

【答案】(1)无偏性 若估计量

的数学期望等于未知参数

则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若

是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性

(3)—致性(相合性) 如果依概率收敛于

则称

是的一致估计量。

6. 回归分析结果的评价。

【答案】对回归分析结果的评价可以从以下四个方面入手: (1)所估计的回归系数的符号是否与理论或事先预期相一致; (2)如果理论上认为归方程也应该如此;

(3)用判定系数

来回答回归模型在多大程度上解释了因变量取值的差异;

(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的简单方法是画出残差的直方图或正态概率图。

之间的关系不仅是正的,而且是统计上显著的,那么所建立的回与

且至少对于某一个

都是的无偏估计量,若对于任意

上式中的不等号成立,则称

有效。

即:

二、计算题

7. 研宄人员试图通过随机调查取得60名从业人员的性别、月收入和月消费支出数据,来建立居民消费支出的预测模型。分析中性别变量的取值为男性等于1,女性等于0。

(1)在调查的实施过程中发现,有6名随机选中的被调查者拒绝提供数据;4名随机选中的被调查者由于出差等原因没有访问到,因此最后只得到了50组数据。试分析由此造成的调查误差类型。对此类误差有哪些补救措施?

,(2)根据得到的50组数据,用Excel 进行回归分析(支出为因变量,性别和收入为自变量)部分结果如表所示。已知居民的平均支出为2188元,计算模型预测误差的离散系数。

1

(3)Excel 输出的方差分析表如表2所示,计算缺少的ABCD 四个项目(计算结果取整数)。

2

(4)写出上表中F 检验的零假设和备择假设。根据Excel 的计算结果,如果的结论如何?

(5)根据表3中的结果数据写出回归方程的表达式,说明回归系数的含义,并计算月收入为3000元的女性的平均支出。

3

检验

(6)在回归分析中,我们通常需要回归方程同时做检验和检验。这两种检验的目的有何区别?可以相互替代吗?

【答案】(1)这种误差属于无回答误差。无回答误差包括调查者拒绝接受调查,调查人员得到的是一份空白的答卷,也包括那些调查进行时被访者不在家的情况。无回答误差有时是随机的,有时是系统性的。

如果无回答误差是随机的,可以通过增大样本量的方式解决;如果无回答误差是系统性的,解决的途径主要有两个方面,一个是预防,即在调查进行前做好各方面的准备工作,尽量把无回答降到最低程度;另一方面是,当无回答出现后,分析无回答产生的原因,采取一些补救措施。例如,在无回答单位中再抽取一个样本,实施更有力的调查,并以此作为无回答层的代表,和回答层的数据结合起来对总体进行估计。

(2)模型预测误差的离散系数为:

(3)方差分析表中,缺少的ABCD 四个项目分别为: