当前位置:问答库>考研试题

2017年天津职业技术师范大学统计学复试仿真模拟三套题

  摘要

一、简答题

1. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?

【答案】相关系数r 的取值范围在关关系;若

相关关系;若

相关关系。

说明两个变量之间的线性关系越强

时. 可视为中度相关;说明两个变量之间的线性关系越弱。对于一时,

可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:

当时。视为低度相关;

当之间。若

表明变量之间存在正线性相表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性

相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。

2. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?

【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。

3. 简述假设检验的过程。

【答案】假设检验的过程如下:

(1)根据所研宄问题的要求提出原假设(或称为零假设、无效假设)和备择假设确定显著性水平。显著性水平为拒绝假设检验是犯第一类错误的概率。

(2)选择合适的检验方法,确定适当的检验统计量,确定统计量的分布,并由假设计算其数值。

(3)根据统计量确定值,做出统计推断。根据计算的统计量,查阅相应的统计表,确定

值,以值与显著性水平比较,若则拒绝接受

若则不拒绝

4. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?

【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模

型对样本观测值的拟合优度。这是由于多重判定系数

随着样本解释变量个数的增加

第 2 页,共 27 页 的值越

来越高(即是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新

不是一个合适的指标,需加以的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,

调整。而修正判定系数

归模型方面要优于多重判定系数修正判定系数的计算公式为

5. 给出在一元线性回归中:

(1)相关系数的定义和直观意义;

(2)判定系数的定义和直观意义;

(3)相关系数和判定系数的关系。

【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为

称为样本相关系数,记为r 。样本

相关系数的计算公式为:

按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x 若是根据样本数据计算的,则其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。

(2)回归平方和占总平方和的比例称为判定系数,记为其计算公式为:

判定系数测度了回归直线对观测数据的拟合程度。

的取值范围是越接近于1, 表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变

差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。

(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。

6. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为个自变量分别为描述因变量

第 3 页,共 27 页

y 如何依赖于自变量和误差项的方程称为多元回归模型。其一般形式可表示为

:式中是模型的参数为误差项。

称为多元回归

之间的关系。

是未知的,需要利用样本

去估计回归方程中的未知参

数(2)多元回归方程:

根据回归模型的假定有方程,它描述了因变量y 的期望值与自变量(3)估计的多元回归方程:

回归方程中的参数数据去估计它们。当用样本统计

时,就得到了估计的

多元回归方程,其一般形式为:

式中 是参数称为偏回归系数。 的估计值是因变量y 的估计值。其中

二、计算题

7. 工业企业某种产品产量与单位成本资料如表所示:

要求:

(1)根据上表资料,绘制相关图,判别该数列相关与回归的种类;

(2)配合适当的回归方程;

(3)根据回归方程,指出每当产品产量増加1万件时,单位成本的变动情况;

(4)计算相关系数;

(5)计算估计标准误差;

(6)当产量为8万件时,在的概率保证程度下,对单位成本作区间估计。

【答案】(1)由已知数据可得产品产量与单位成本的相关图如图所示。

第 4 页,共 27 页