2017年哈尔滨商业大学统计学复试实战预测五套卷
● 摘要
一、简答题
1. 回归分析中的误差序列有何基本假定?模型参数的最小二乘估计模型用于预测,影响预测精度的因素有哪些?
【答案】(1
)误差项是一个服从正态分布的随机变量,且独立,即为0的随机变量,即线性函数;②无偏性
具有最小方差的估计量。
(3)影响预测精度的因素有:①预测的信度要求。同样情况下,要求预测的把握度越高,贝_应的预测区间就越宽,精度越低;②总体y 分布的离散程度
越大,相应的预测区间就越
宽,预测精度越低;③样本观测点的多少n 。n 越大,相应的预测区间就越窄,预测精度越高;④样本观测点中,解释变量x 分布的离散度。x 分布越离散,预测精度越高;⑤预测点离样本分布中心的距离。预测点越远离样本分布中心预测区间越宽,精度越低,越接近样本分布中心间越窄,精度越高。
2. 简述估计量的无偏性,有效性和一致性。
【答案】(1)无偏性 若估计量
的数学期望等于未知参数
则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若
是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性
设
(3)—致性(相合性) 如果依概率收敛于
则称
即
有
是的一致估计量。
3. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在
之间。若
具有哪些统计特性?若
)。独立
性意味着对于一个特定的值,它所对应的与其他值所对应的不相关。误差项是一个期望值
对于所有的
值分别是
的方差
都相同。
为随机变量的
是所有线性无偏估计量中
(2
)模型参数的最小二乘估计
的统计特性:①线性,即估计量的无偏估计;③有效性
区
即:
与
且至少对于某一个
都是的无偏估计量,若对于任意
上式中的不等号成立,则称
较
有效。
有
表明变量之间存在正线性相
关关系;若相关关系;若相关关系。
当
表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当
表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,
二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
说明两个变量之间的线性关系越强时. 可视为中度相关
;
说明两个变量之间的线性关系越弱。对于一
时,
可视为高度相关时,说明两个变量之间的
个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当
时。视为低度相关;当
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
4. 解释多重判定系数和调整的多重判定系数的含义和作用。
【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为
(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得
的值永远小于
而且
的值不会由于模型中自变量个数的增加而越来越接近1,
其计算公式为
5. 什么是集中趋势和离散趋势?它们常用的指标有哪些?
【答案】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。常用的反映集中趋势的指标有平均数、中位数和众数。
数据的离散趋势是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。描述数据离散程度采用 的测度值,根据所依据数据类型的不同主要有异众比率、四分位差、方差和标准差。此外,还有极差、平均差以 及测度相对离散程度的离散系数等。
6. 什么是抽样平均误差?影响抽样平均误差的因素有哪些?
【答案】抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。
影响抽样平均误差的因素有四个:
(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当
时,就是全面调查,抽样误差此时为零。
(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。
(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。
(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。
二、计算题
7. 某地区2000—2004年粮食产量资料如表所示。
表
要求:(1)用最小平方法配合直线趋势方程(简捷法计算); (2)预测2006年该地区粮食产量。
【答案】(1)由题意,设粮食产量与年份的回归方程为令各年的产量为
为-2,-1,0,1, 2, 因此
则有
令2002年对应的
则有:
则2000—2004年对应的分别
即回归方程是(2)当
时
即2006年该地区粮食产量为303.2万吨。
8. 若根据某地相关数据拟合以下回归方程
其中
表示财政收入(亿元)
表示居民最终消费支出
表示实际利用外资。现在
利用该地15年的有关数据计算得:
方程的可决系数为验。
【答案】利用公式计算得到
分别为:
请你据此条件计算回归方程,并对回归方程进行显著性检