当前位置:问答库>考研试题

2017年贵州财经大学统计学复试仿真模拟三套题

  摘要

一、简答题

1. 单因素方差分析的实质是什么?并说明单因素方差分析的步骤。

【答案】单因素方差分析的实质是研宄一个分类型自变量对一个数值型因变量的影响。 单因素方差分析的步骤为:

(1)按要求检验的个水平的均值是否相等,提出原假设和备择假设。 (2)构造检验统计量,计算各样本均值(3)计算样本统计量(4)统计决策。比较统计量拒绝原假设。

2. 构造下列维数的列联表,并给出

的值。若

拒绝原假设;反之,不能

样本总均值

误差平方和

检验的自由度。

a.2行5列 b.4行6列 c.3行4列 【答案】i 行j 列联表,如表所示。

而a. 当b.

当c.

检验的自由度=(行数_1)(列数一 1),所以

时,表9-8即为2行5列的列联表,其时,表9-8即为4行6列的列联表,其时,表9-8即为3行4列的列联表,其

检验的自由度=检验的自由度=检验的自由度=

3. 简述指数平滑法的基本含义。

【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。

使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生

不同的影响。当值

大的权数;同样

时,预测值仅仅是重复上一期的预测结果;

时,预测值就是上一期实际

越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更

越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的

第 2 页,共 22 页

期的

预测值等于

期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊

反应就越慢。一般而言,当时间序列有较大的随机波动时,

宜选较大的以便能很快跟上近期的变化,当时间序列比较平稳时,宜选较小的

但实际应用时,还应考虑预测误差,这里仍用误差

均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为最后的值。

4. 说明回归模型的假设以及当这些假设不成立时的应对方法。

【答案】(1)多元回归模型的基本假定有: ①自变量③对于自变

④误差项是一个服从正态分布的随机变量,且相互独立,即(2)若模型中存在多重共线性时,解决的方法有:

第一,将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。 第二,如果要在模型中保留所有的自变量,那就应该:避免根据统计量对单个参数进行检验;对因变量Y 值的推断(估计或预测)限定在自变量样本值的范围内。

若模型中存在序列相关时,解决的方法有:如果误差项不是相互独立的,则说明回归模型存在序列相关性

,这时首先要查明序列相关产生的原因。如果是回归模型选用不当,则应改用适当的回归模型;如果是缺少重要的自变量,则应増加自变量;如果以上两种方法都不能消除序列相关性,则需采用迭代法、差分法等方法处理。

若模型中存在异方差性时,解决的方法有:当存在异方差性时,普通最小二乘估计不再具有最小方差线性估计的性质,而加权最小二乘估计则可以改进估计的性质。加权最小二乘估计对误差项方差小的项加一个大的权数,对误差项方差大的项加一个小的权数,因此加强了小方差性的地位,使离差平方和中各项的作用相同。

5. 解释多元回归模型、多元回归方程、估计的多元回归方程的含义。

【答案】(1)多元回归模型:设因变量为y 如何依赖于自变量

式中

(2)多元回归方程:

根据回归模型的假定有方程,它描述了因变量y 的期望值与自变量

(3)估计的多元回归方程:

回归方程中的参数数据去估计它们。当用样本统计

第 3 页,共 22 页

是非随机的、固定的,且相互之间互不相关(无多重共线性);

的方

都相同,且不序列相关,

的所有

②误差项s 是一个期望值为0的随机变量,即

个自变量分别为

是模型的参数

描述因变量

为误差项。

称为多元回归

和误差项的方程称为多元回归模型。其一般形式可表示为

之间的关系。

是未知的,需要利用样本

去估计回归方程中的未知参数

时,就得到了估计的

多元回归方程,其一般形式为:

式中

是参数

称为偏回归系数。

6. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:

(1)值能告诉我们什么信息?

(2)当相应的值较小时为什么要拒绝原假设? (3)显著性水平与值有何区别?

【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。

(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。

(2)值是反映实际观测到的数据与原假设明实际观测到的数据与

之间不一致程度的一个概率值。值越小,说

之间不一致的程度就越大,检验的结果也就越显著。

的估计值

是因变量y 的估计值。其中

(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,

如果选择的值相同,

所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。

二、计算题

7. 设某种商品每周的需求量X 是服从区间

上均匀分布的随机变量,而经销商店进货量为

区间[10, 30]中的某一整数,商店每销售一单位商品可获利500元,若供大于求,则削价处理,每处理一单位商品亏损100 元;若供不应求,则可从外部调剂供应,此时1单位商品仅获利300元。为使商品所获利润期望值不少于9280 元,试确定最少进货量。

【答案】该种商品每周的需求量X 服从货量为y ,则有:

则商品所获利润期望值为:

第 4 页,共 22 页

上的均匀分布,设商店所获利润为z ,商店进