2017年河北工程大学统计学Ⅰ考研复试核心题库
● 摘要
一、简答题
1. 解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的关系。
【答案】(1)总平方和(S^T)是实际观测值与其均值的离差平方和,即
(2)回归平方和(^狀)是各回归值
来解释的变差部分。
(3)残差平方和(SSE )是各实际观测值与回归值的离差平方和,即
称为误差平方和。
(4)三者之间的关系
2. 回归分析结果的评价。
【答案】对回归分析结果的评价可以从以下四个方面入手:
(1)所估计的回归系数的符号是否与理论或事先预期相一致;
(2)如果理论上认为
归方程也应该如此;
(3)用判定系数来回答回归模型在多大程度上解释了因变量取值的差异;
(4)考察关于误差项的正态性假定是否成立。因为在对线性关系进行检验和对回归系数进行?检验时,都要求误差项服从正态分布,否则,所用的检验程序将是无效的。检验正态性的简单方法是画出残差的直方图或正态概率图。
3. 什么是方差分析?它与总体均值的检验或检验有什么不同?其优势是什么?
【答案】方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。总体均值的检验或Z 检验,一次只能研宄两个样本,如果要检验多个总体的均值是否相等,那么作这样的两两比较十分烦琐。而且,每次检验两个的做法共需进行
的检验,如果次不同每次检验犯第I 类错误的概率都是0.05, 作多次检验会使犯第I 类错误的概之间的关系不仅是正的,而且是统计上显著的,那么所建立的回 它是除了的线性影响之外的其他因素对变差的作用,是不能由回归直线来解释的变差部分。其又与实际观测值的均值y 的离差平方和,即其反映了在y 的总变差中由于x 与y 之间的线性关系引起的y 的变化部分,它是可以由回归直线率相应增加,而方差分析方法则是同时考虑所有的样本,因此排除了错误累积的概率,从而避免拒绝一个真实的原假设。
方差分析不仅可以提高检验的效率,同时由于它是将所有的样本信息结合在一起,也増加了分析的可靠性。
4. 什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?
【答案】在统计学中,一般把相乘以后使得不能直接相加的指标过渡到可以直接相加的指标的那个因素,称为同度量因素或同度量系数。
在编制指数时,对于不能直接相加的指标,可通过同度量因素把指标过渡到具有可加性。
5. 简述时间序列的预测程序。
【答案】在对时间序列进行预测时,通常包括以下几个步骤:
(1)确定时间序列所包含的成分,也就是确定时间序列的类型;
(2)找出适合此类时间序列的预测方法;
(3)对可能的预测方法进行评估,以确定最佳预测方案;
(4)利用最佳预测方案进行预测。
6. 简述复合型时间序列的预测步骤。
【答案】复合型序列是指含有趋势性、季节性、周期性和随机成分的序列。对这类序列预测方法通常是将时间序列的各个因素依次分解出来,然后再进行预测,分解法预测通常按下面的步骤进行:
(1)确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数,以消除季节性;
(2)建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测;
(3)计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。
二、计算题
7. 某企业2007年11月1日对12名员工的抽样调查表明,他们从居住地到达工作地点花费的时间如下(分钟):
10,55,70,25,30,45,30,50,25,40,55, 90
(1)计算数据的均值、中位数和众数。你认为哪一个结果最能反映这组数据的一般水平?为什么?
(2)已知总体服从正态分布,
样本标准差等于计算总体均值95%
的置信区间。
(3)根据以上数据,在5%的显著性水平下能否认为总体中职工的平均上班时间等于35分钟?
【答案】(1)数据的均值为:
将表中数据排序可得:
中位数的位置是
是
即在第6个数值40和第7个数值45之间,所以,数据的中位数
由分组数据可以看到众数有三个,分别是25、30和55。
由于众数有多个,且众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数来反映数据的一般水平。而平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此中位数 最能反映这组数据的一般水平,它是一组数据中间位置上的代表值,不受数据极端值的影响。
(2)已知:因此,总体均值95%的置信区间是:
即为
(3)提出假设:
检验统计量的值为:
由于所以不能拒绝原假设,即在5%的显著性水平下认为总体中职 工的平均上班时间等于35分钟。
8. 为检验A 、B 两种烟草的尼古丁含量是否相同,从这两种烟草中各自随机抽取重量相同的5例进行化验,测得尼古丁含量(单位:毫克)为:
烟草 A : 24,27, 26,21,24
烟草 B : 27,28,23,31,26
据经验知,尼古丁含量服从正态分布,且烟草A 的方差为5, B 的方差为8, 在显著性水平之下,问两种烟草尼古丁含量是否有差异?
【答案】建立假设:
已知
由于两个总体服从正态分布,并且方差已知,应选用z 作为检验统计量。则检验统计量的值为:
当时
,
烟草尼古丁含量没有显著差异。
因为故不能拒绝原假设,即认为两种