当前位置：问答库＞考研试题

2017年新疆农业大学统计学复试实战预测五套卷

● 摘要

一、简答题

1．多元线性回归模型中有哪些基本的假定？

【答案】多元回归模型的基本假定有：

（1）自变量

（3）对于自变

量

（4）误差项是一个服从正态分布的随机变量，且相互独立，即

2．在多元线性回归中，为什么我们对整个回归方程进行检验后，还要对每个回归系数来进行检验呢？

【答案】在多元线性回归中，线性关系检验主要是检验因变量同多个自变量的线性关系是否显著，在个自变量中，只要有一个自变量与因变量的线性关系显著，F 检验就能通过，但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验，它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验，就意味着这个自变量对因变量的影响不显著，也许就没有必要将这个自变量放进回归模型中了。

3．简述描述离散程度的统计量和适用类型。

【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差，其中最常用的是方差和标准差。

（1）极差是指一组数据的最大值与最小值之差。用R 表示，其计算公式为：

极差是描述数据离散程度的最简单测度值，计算简单，易于理答，但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息，不能反映出中间数据的分散状况，因而不能准确描述出数据的分散程度。

（2）平均差也称平均绝对离差，它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心，反映了每个数据与平均数的平均差异程度，它能全面准确地反映一组数据的离散状况。平均差越大，说明数据的离散程度越大；反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题，平均差在计算时对离差取了绝对值，以离差的绝对值来表示总离差，这就给计算带来了不便，因而在实际中应用较少。但平均差的实际意义比较清楚，容易理答。

（3）方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去

第 2 页，共 43 页是非随机的、固定的，且相互之间互不相关（无多重共线性）；的方

差都相同，且不序列相关，

即的所有

值（2）误差项是一个期望值为0的随机变量，即

离差的正负号，然后再进行平均，方差开方后即得到标准差，方差或标准差能较好地反映出数据的离散程度，是实际中应用最广泛的离散程度测度值。与方差不同的是，标准差是具有量纲的，它与变量值的计量单位相同，其实际意义要比方差清楚。因此，在对实际问题进行分析时更多地使用标准差。

4．说明回归模型的假设以及当这些假设不成立时的应对方法。

【答案】（1）多元回归模型的基本假定有： ①自变量

③对于自变

量

④误差项是一个服从正态分布的随机变量，且相互独立，即

（2）若模型中存在多重共线性时，解决的方法有：

第一，将一个或多个相关的自变量从模型中剔除，使保留的自变量尽可能不相关。

第二，如果要在模型中保留所有的自变量，那就应该：避免根据统计量对单个参数进行检验；对因变量Y 值的推断（估计或预测）限定在自变量样本值的范围内。

若模型中存在序列相关时，解决的方法有:如果误差项不是相互独立的，则说明回归模型存在序列相关性

，这时首先要查明序列相关产生的原因。如果是回归模型选用不当，则应改用适当的回归模型；如果是缺少重要的自变量，则应増加自变量；如果以上两种方法都不能消除序列相关性，则需采用迭代法、差分法等方法处理。

若模型中存在异方差性时，解决的方法有：当存在异方差性时，普通最小二乘估计不再具有最小方差线性估计的性质，而加权最小二乘估计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一个大的权数，对误差项方差大的项加一个小的权数，因此加强了小方差性的地位，使离差平方和中各项的作用相同。

5．回归分析中的误差序列有何基本假定？模型参数的最小二乘估计

模型用于预测，影响预测精度的因素有哪些？

【答案】（1

）误差项是一个服从正态分布的随机变量，且独立，即

为0的随机变量，即线性函数；②无偏性

具有最小方差的估计量。

（3）影响预测精度的因素有：①预测的信度要求。同样情况下，要求预测的把握度越高，贝

第 3 页，共 43 页是非随机的、固定的，且相互之间互不相关（无多重共线性）；的方

差都相同，且不序列相关，

即

的所有

值②误差项s 是一个期望值为0的随机变量，即具有哪些统计特性？若）。独立性意味着对于一个特定的值，它所对应的与其他值所对应的不相关。误差项是一个期望值对于所有的值分别是的方差都相同。为随机变量的是所有线性无偏估计量中（2

）模型参数的最小二乘估计的统计特性：①线性，即估计量的无偏估计；③有效性

_应的预测区间就越宽，精度越低；②总体y 分布的离散程度越大，相应的预测区间就越宽，预测精度越低；③样本观测点的多少n 。n 越大，相应的预测区间就越窄，预测精度越高；④样本观测点中，解释变量x 分布的离散度。x 分布越离散，预测精度越高；⑤预测点离样本分布中心的距离。预测点越远离样本分布中心预测区间越宽，精度越低，越接近样本分布中心间越窄，精度越高。

6．解释多重判定系数和调整的多重判定系数的含义和作用。

【答案】（1）多重判定系数是多元回归中的回归平方和占总平方和的比例，它是度量多元回归方程拟合程度的一个统计量，反映了在因变量y 的变差中被估计的回归方程所解释的比例，其计算公式为区

（2）调整的多重判定系数考虑了样本量（n ）和模型中自变量的个数（k ）的影响，这就使得

的值永远小于

而且的值不会由于模型中自变量个数的增加而越来越接近1，

其计算公式为

二、计算题

7．已知我国1978〜1992年针织品零售量数据如表1所示。

表

试配合二次曲线趋势方程，并预测1993年的零售量，作图与原数列比较。（可令

【答案】记年份1978年

为

年为得：

表

2 设二次曲线趋势方程为年

为年

为）年

为利用Excel 进行回归分析可

故二次曲线趋势方程为第 4 页，共 43 页当时，可以得到1993年零

当前位置：问答库＞考研试题

相关题目: