当前位置:问答库>考研试题

2018年中国人民大学统计学院805统计学之统计学考研强化五套模拟题

  摘要

一、简答题

1. 下列调查问卷中的提问都有问题,请修改。

(1)您和您爱人是否对现有住房满意?

(2)您最近一次是几点上班的?

(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗?

【答案】(1)您对现有住房满意吗?您爱人呢?

(2)您最近一次的工作是几点上班?

(3)您认为明光牛奶的口味纯正吗?

2. 给出在一元线性回归中:

(1)相关系数的定义和直观意义;

(2)判定系数的定义和直观意义;

(3)相关系数和判定系数的关系。

【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

称为样本相关系数,记为r 。样本

相关系数的计算公式为:

按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x 若是根据样本数据计算的,则与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。

(2)回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

判定系数测度了回归直线对观测数据的拟合程度。

的取值范围是越接近于1, 表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变

差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。

(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。

3. 回归分析结果的评价。

【答案】对回归分析结果的评价可以从以下四个方面入手:

(1)所估计的回归系数的符号是否与理论或事先预期相一致;

(2)如果理论上认为

归方程也应该如此;

(3)用判定系数来回答回归模型在多大程度上解释了因变量取值的差异;

(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,

都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的

简单方法是画出残差的直方图或正态概率图。

4. 在假设检验中,犯两类错误之间存在什么样的数理关系?是否有什么办法使得两类错误同时减少?

【答案】第一类错误是指原假设为真,拒绝原假设,又称弃真错误,犯这类错误的概率记为第二类错误是指原假设为假,接受原假设,又称取伪错误,犯这类错误的概率记为

由于两类错误是矛盾的,在其他条件不变的情况下,减少犯弃真错误的可能性

犯取伪错误的可能性 势必增大之间的关系不仅是正的,而且是统计上显著的,那么所建立的回也就是说

的大小和显著性水平的大小成相反方向变化。解决的唯一办法只有增大样本容量,这样既能保证满足取得较小的又能取得较小的值。

5. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?

【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当

然相当好,此时随机变量X 的分布是相对于其平均值时,二项分布的正态近似仍

和都对称的。当p 趋于0或1时,二项分布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说, 只要当n 大到使大于或等于5时,近似的效果就相当好。

6. 要检验多个总体均值是否相等时,为什么不作两两比较,而用方差分析方法?

【答案】方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也增加了分析的可靠性。

检验多个总体均值是否相等时,如果作两两比较,则需要进行多次的检验。随着增加个体显

著性检验的次数,偶然因素导致差别的可能性也会増加(并非均值真的存在差别)。而方差分

析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。

7. 简述指数平滑法的基本含义。

【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第期的预测值等于

期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。

使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生

不同的影响。当

大的权数;同样时,预测值仅仅是重复上一期的预测结果;

当时,预测值就是上一期实际

越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的

但实际应用时,还应考虑预测误差,这里仍用误差反应就越慢。一般而言,当时间序列有较大的随机波动时,

宜选较大的以便能很快跟上近期的变化,当时间序列比较平稳时,宜选较小的

均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为最后的值。

8. 方差分析中的基本假定。

【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差立的。

9. 简述估计量的无偏性,有效性和一致性。

【答案】(1)无偏性 若估计量的数学期望等于未知参数

则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若

是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。

(2)有效性

设(3)—致性(相合性) 如果依概率收敛于即有

必须相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独即:

与且至少对于某一个都是的无偏估计量,若对于任意

上式中的不等号成立,则称较有效。 有