当前位置:问答库>考研试题

2017年河海大学720统计学原理(同等学力加试)考研复试核心题库

  摘要

一、简答题

1. 简述判定系数的含义和作用。

【答案】(1)判定系数的含义

回归平方和占总平方和的比例称为判定系数,记为

其计算公式为:

(2)判定系数的作用

判定系数测度了回归直线对观测数据的拟合程度。若所有观测点都落在直线上,残差平方

可见

x 完全无助于解释y 的变差,拟合是完全的;如果y 的变化与x 无关,此时

的取值范围是

越接近于7,表明回归平方和占总平方和的比例越大,回

归直线与各观测点越接近,用x 的变化来解释y 值变差的部分就越多,回归直线的拟合程度就越好;反之越接近于0, 回归直线的拟合程度就越差。

2. 简述方差分析的基本原理。

【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。

3. 给出在一元线性回归中:

(1)相关系数的定义和直观意义; (2)判定系数的定义和直观意义; (3)相关系数和判定系数的关系。

【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为称为样本相关系数,记为r 。样本

相关系数的计算公式为:

若是根据样本数据计算的,则

按上述计算公式计算的相关系数也称为线性相关系数,或称为

相关系数。r 仅仅是x

与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。

(2)回归平方和占总平方和的比例称为判定系数,记为

其计算公式为:

判定系数测度了回归直线对观测数据的拟合程度。

的取值范围是

越接近于1,

表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变 差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。

(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。

4. 简述时间序列的预测程序。

【答案】在对时间序列进行预测时,通常包括以下几个步骤: (1)确定时间序列所包含的成分,也就是确定时间序列的类型; (2)找出适合此类时间序列的预测方法;

(3)对可能的预测方法进行评估,以确定最佳预测方案; (4)利用最佳预测方案进行预测。

5. 构造下列维数的列联表,并给出

检验的自由度。

a.2行5列 b.4行6列 c.3行4列 【答案】i 行j 列联表,如表所示。

而a. 当b.

检验的自由度=(行数_1)(列数一 1),所以

时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其

检验的自由度=检验的自由度=

c.

当时,表9-8即为3行4列的列联表,其检验的自由度=

6. 单因素方差分析的实质是什么?并说明单因素方差分析的步骤。

【答案】单因素方差分析的实质是研宄一个分类型自变量对一个数值型因变量的影响。 单因素方差分析的步骤为:

(1)按要求检验的个水平的均值是否相等,提出原假设和备择假设。 (2)构造检验统计量,计算各样本均值(3)计算样本统计量(4)统计决策。比较统计量拒绝原假设。

的值。若

拒绝原假设;反之,不能

样本总均值

误差平方和

二、计算题

7. 离散型随机变量X 的概率分布率如下。

(1)确定概率分布率中a 的值。 (2)试给出随机变量X 的分布

可知:

(3)计算随机变量X 的均值和方差。

【答案】(1)根据离散型随机变量的概率分布列的正则性,即得

当当当当

(2)当

,时,时,时,时,

所以随机变量X 的分布为: