当前位置:问答库>考研试题

2017年成都理工大学统计学原理之统计学复试实战预测五套卷

  摘要

一、简答题

1. 简述标准化值的意义及计算公式。

【答案】变量值与其平均数的离差除以标准差后的值称为标准分数,也称标准化值或分数。其计算公式为:

标准差。

标准分数可以测量每个数据在该组数据中的相对位置,并可以用它来判断一组数据是否有离群数据。比如, 如果某个数值的标准分数为就知道该数值低于平均数1.5倍的标准差。在对多个具有不同量纲的变量进行处理时,常常需要对各变量进行标准化处理。实际上,z 分数只是将原始数据进行了线性变换,它并没有改变一个数据在该组数据中的位置,也没有改变该组数据分布的形状,而只是将该组数据变为平均数为0, 标准差为1。

2. 构造下列维数的列联表,并给出检验的自由度。

a.2行5列 b.4行6列 c.3行4列

【答案】i 行j 列联表,如表所示。

式中为变量的标准化值,是该组数据均值,s 为该组数据的

a. 当

b.

c.

当检验的自由度=(行数_1)(列数一 1),所以 时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其检验的自由度=检验的自由度=检验的自由度=

3. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?

【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加

来越高(即的值越是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新

不是一个合适的指标,需加以的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,

调整。而修正判定系数

第 2 页,共 38 页 其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回

归模型方面要优于多重判定系数修正判定系数的计算公式为

4. 简述方差分析的基本原理。

【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。

5. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?

【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。

6. 解释多重判定系数和调整的多重判定系数的含义和作用。

【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为

(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得

的值永远小于

而且的值不会由于模型中自变量个数的增加而越来越接近1,

其计算公式为

二、计算题

7. 有两条茶叶包装生产线,从每条生产线上各抽60桶,其中一条生产线上每桶茶叶的平均重量为克,方差为36; 另一条生产线的平均重量为克,方差为

(1)试构造两条生产线茶叶平均重量之差的置信度为95%的置信区间。 (2)能否判断两条生产线上茶叶的平均重量存在显著差异?

第 3 页,共 38 页

【答案】(1)已知

分布,即

因此,两条茶叶包装生产线上茶叶重量均值之差 由于样本容量比较大,故两条茶叶包装生产线上茶叶重量均值之差经标准化后服从标准正态在95%置信水平下的置信区间为:

克。 两条茶叶包装生产线上茶叶重量均值之差在95%

置信水平下的置信区间为

(2)有两种方法可以判断两条生产线上茶叶的平均重量是否存在显著差异:

a. 由于(1)中构造的置信度为95%的置信区间不包括零点,因此可以认为两条生产线上茶叶的平均重量存在显著差异。

b. 建立假设:

两条生产线上茶叶的平均重量没有显著差异

两条生产线上茶叶的平均重量存在显著差异

由于样本容量较大,故可用正态分布来近似,所以检验统计量的值为:

由于所以拒绝原假设,即两条生产线上茶叶的平均重量存在显著差异。

8. 设人均收入X 为自变量,人均消费Y 为因变量。现根据某地12个住户的有关资料计算出以下数据:(单位:元)

要求:(1)拟合简单线性回归方程,并解释方程中回归系数的经济意义;

(2)计算可决系数和回归估计的标准误差;

(3)对X

的回归系数进行显著性检验(显著性水平为

为的预测区间。

【答案】(1)由最小二乘法

第 4 页,共 38 页 (4)假定人均收入为800元. 利用拟合的回归方程预测相应的人均消费水平。并给出置信度