当前位置:问答库>考研试题

2017年贵州财经大学统计学考研复试核心题库

  摘要

一、简答题

1. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?

【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。

2. 什么是抽样平均误差?影响抽样平均误差的因素有哪些?

【答案】抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。

影响抽样平均误差的因素有四个:

(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当时,就是全面调查,抽样误差此时为零。

(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。

(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。

(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。

3. 在投掷一枚均匀硬币进行打赌时,出现正面时投掷者赢5元,出现反面时输3元,记投掷者赢钱数为X 。试写出此问题的样本空间

【答案】记赢钱数为

则的函数定义为:

则有

于是X 的概率分布为: 以及随机变量X 的定义和概率分布。 其中 为投掷后出现的两种结果,令

4. 在显著性检验过程中,经常遇到值这一概念,试回答以下问题:

(1)值能告诉我们什么信息?

(2)当相应的值较小时为什么要拒绝原假设?

(3)显著性水平与值有何区别?

【答案】如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为值,也称为观察到的显著性水平。

(1)值是当原假设正确时,得到所观测的数据的概率。如果原假设是正确的话,值告诉我们这样的观测数据会有多么的不可能得到。相当不可能得到的数据,就是原假设不对的合理证据。

(2)值是反映实际观测到的数据与原假设明实际观测到的数据与之间不一致程度的一个概率值。值越小,说之间不一致的程度就越大,检验的结果也就越显著。

(3)是犯第I 类错误的上限控制值,它只能提供检验结论可靠性的一个大致范围,而对于一个特定的假设检验问题,却无法给出观测数据与原假设之间不一致程度的精确度量。也就是说,仅从显著性水平来比较,

如果选择的值相同,

所有检验结论的可靠性都一样。而值可以测量出样本观测数据与原假设中假设的值的偏离程度。

5. 下面两个统计图分别是对某数据集中y 关于x 的线性回归分析后的残差(Residuad )请指出这个回归分析所存在的问题,并提出解诀方案。

【答案】由残差图可知,两个变量之间可能为非线性关系。表明所选择的线性回归分析模型不合理,应该考虑选 用非线性模型。处理非线性回归的基本方法是,通过变量变换,将非线性回归化为线性回归,然后用线性 回归方法处理。假定根据理论或经验,已获得输出变量与输入变量之间的非线性表达式,但表达式的系 数是未知的,要根据输入输出的n 次观察结果来确定系数的值。按最小二乘法原理来求出系数值。

此外,残差连续的出现在横坐标轴的上面或下面,两个变量也可能存在正自相关问题,即线

性回归模型扰动 项的方差-协方差矩阵的非主对角线的元素不全为0, 存在扰动项的自相关。可以采用检验,检验方程是否存在一阶自相关问题,或采用

或仍用检验高阶自相关问题。如果存在自相关,可以采用可行广义最小二乘法值。

6. 简述指数平滑法的基本含义。

【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第

形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。

使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生

不同的影响。当

大的权数;同样时,预测值仅仅是重复上一期的预测结果;

当时,预测值就是上一期实际

越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的

但实际应用时,还应考虑预测误差,这里仍用误差期的预测值等于

期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊法,但使用方差-协方差矩阵的稳健估计反应就越慢。一般而言,当时间序列有较大的随机波动时,

宜选较大的以便能很快跟上近期的变化,当时间序列比较平稳时,宜选较小的

最后的值。

均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为二、计算题

7. 为比较A 、B 两城市居民的生活水平,分别调查150户和100户家庭的人均生活费支出。按所得数据算得样本均值分别是元和元(2004年统计资料),样本方差分别为

假设两城市家庭人均生活费支出都可以认为服从正态分布且方差相等,试以95%的置信概率估计两城市人均生活费支出相差的幅度。

【答案】已知两总体均服从正态分布,且方差相等,则合并估计量为:

已知

下的置信区间为:

所以B 城市与A 城市人均生活费支出相差的幅度在95%