2017年广东财经大学统计学原理复试实战预测五套卷
● 摘要
一、简答题
1. 在多元线性回归中,为什么我们对整个回归方程进行检验后,还要对每个回归系数来进行检验呢?
【答案】在多元线性回归中,线性关系检验主要是检验因变量同多个自变量的线性关系是否显著,在个自变量中,只要有一个自变量与因变量的线性关系显著,F 检验就能通过,但这不一定意味着每个自变量与因变量的关系都显著。回归系数检验则是对每个回归系数分别进行单独的检验,它主要用于检验每个自变量对因变量的影响是否都显著。如果某个自变量没有通过检验,就意味着这个自变量对因变量的影响不显著,也许就没有必要将这个自变量放进回归模型中了。
2. 正态分布所描述的随机现象有什么特点?为什么许多随机现象服从或近似服从正态分布?
【答案】(1)正态分布所描述的随机现象具有如下特点: ①正态曲线的图形是关于的对称钟形曲线,且峰值在处;
②正态分布的两个参数均值和标准差一旦确定,正态分布的具体形式也就唯一确定,不同参数取值的 正态分布构成一个完整的“正态分布族”。
③正态分布的均值可以是实数轴上的任意数值,它决定正态曲线的具体位置,
标准差相同而均值不同 的正态曲线在坐标轴上体现为水平位移。 ④正态分布的标准差
⑤当为大于零的实数,它决定正态曲线的“陡_”或“扁平”程度。越大,正态曲线 越扁平;越小,正态曲线越陡峭。 的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相父。
⑥与其他连续型随机变量相同,正态随机变量在特定区间上的取值概率由正态曲线下的面积给出,而且其曲线下的总面积等于1。
(2)如果原有总体是正态分布,那么,无论样本量的大小,样本均值的抽样分布都服从正态分布。若原有 总体的分布是非正态分布,随着样本量的增大(通常要求
方差为总体方差的),不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于正态分布,其分布的数学期望为总体均值这就是统计上著名的中心极限定理。因此许多随机现象服从或近似服从正态分布。
3. 回归分析结果的评价。
【答案】对回归分析结果的评价可以从以下四个方面入手:
(1)所估计的回归系数的符号是否与理论或事先预期相一致;
(2)如果理论上认为之间的关系不仅是正的,而且是统计上显著的,那么所建立的回
归方程也应该如此;
(3)用判定系数来回答回归模型在多大程度上解释了因变量取值的差异;
(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的简单方法是画出残差的直方图或正态概率图。
4. 利用相关系数如何判断变量之间相关的方向和相关关系的密切程度?
【答案】相关系数r 的取值范围在关关系;若
相关关系;若
相关关系。
当
说明两个变量之间的线性关系越强
时. 可视为中度相关
;说明两个变量之间的线性关系越弱。对于一时,
可视为高度相关时,说明两个变量之间的个具体的r 取值,根据经验可将相关程度分为以下几种情况:
当时。视为低度相关;当之间。若表明变量之间存在正线性相表明x 与y 之间存在负线性相关关系;若表明x 与y 之间为完全负线性相关关系。可见当表明x 与y 之间为完全正线性时,y 的取值完全依赖于X ,二者之间即为函数关系;当r=0时,说明两者之间不存在线性相关关系,但可能存在其他非线性
相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数的显著性检验的基础之上。
5. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?
【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行
的检验,如果次不同每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。
方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。
6. 简述指数平滑法的基本含义。
【答案】指数平滑法是对过去的观察值加权平均进行预测的一种方法,该方法使得第
形式,观察值时间越远,其权数也跟着呈现指数的下降,因而称为指数平滑。
使用指数平滑法时,关键的问题是确定一个合适的平滑系数因为不同的会对预测结果产生
不同的影响。当
值
大的权数;同样时,预测值仅仅是重复上一期的预测结果;
当时,预测值就是上一期实际
越接近1,模型对时间序列变化的反应就越及时,因为它对当前的实际值赋予了比预测值更越接近0, 意味着对当前的预测值赋予更大的权数,因此模型对时间序列变化的期的预测值等于
期的实际观察值与第期预测值的加权平均值。指数平滑法是加权平均的一种特殊反应就越慢。一般而言,当时间序列有较大的随机波动时,
宜选较大的以便能很快跟上近期的
变化,当时间序列比较平稳时,宜选较小的
最后的值。
但实际应用时,还应考虑预测误差,这里仍用误差均方来衡量预测误差的大小,确定时,可选择几个进行预测,然后找出预测误差最小的作为二、计算题
7. 抽样调查四所大学的三个不同专业研宄生毕业第一年的收入(单位:万元)情况,结果如表所示。
表
(1)请问大学与专业的不同是否造成学生收入的显著差异
(2)给出各大学与各专业的效应,并确定大学与专业的显著选择。 (已知上表中的收入和为
【答案】(1)提出假设:
行因素(大学):
87.1,收入的平方和
为
列因素(专业):
已知所以总收入平均值为
这4所大学的平均收入分别为
的误差平方和为:
这3个专业的平均收入分别为
为:
总离差平方和为
则行因素所产生则列因素所产生的误差平方和