2017年武汉科技大学统计学考研复试核心题库
● 摘要
一、简答题
1. 简述方差分析的基本原理。
【答案】方差分析通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。在方差分析中,数据的误差是用平方和来表示的,总平方和可以分解为组间平方和与组内平方和。组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。如果组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1; 反之,如果在组间误差中除了包含随机误差外,还会包含系统误差,这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就可以说因素的不同水平之间存在着显著差异,也就是自变量对因变量有影响。
2. 简述季节指数的计算步骤。
【答案】以移动平均趋势剔除法为例,计算季节指数的基本步骤为:
,(1)计算移动平均值(如果是季度数据采用4项移动平均,月份数据则采用12项移动平均)并将其结果进行“中心化”处理,也就是将移动平均的结果再进行一次2项的移动平均,即得出“中心化移动平均值”
(2)计算移动平均的比值,也称为季节比率,即将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值。
(3)季节指数调整。由于各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整。具体方法是:将第(2)步计算的每个季节比率的平均值除以它们的总平均值。
3. 给出在一元线性回归中:
(1)相关系数的定义和直观意义; (2)判定系数的定义和直观意义; (3)相关系数和判定系数的关系。
【答案】(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为称为样本相关系数,记为r 。样本
相关系数的计算公式为:
第 2 页,共 40 页
若是根据样本数据计算的,则
按上述计算公式计算的相关系数也称为线性相关系数,或称为相关系数。r 仅仅是x
与y 之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的答释。
(2)回归平方和占总平方和的比例称为判定系数,记为
其计算公式为:
判定系数测度了回归直线对观测数据的拟合程度。
的取值范围是
越接近于1,
表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,用x 的变化来答释y 值变 差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0, 回归直线的拟合程度就越差。
(3)相关系数和判定系数都是用来表明X 与Y 的关系,即X 对Y 的拟合程度。在一元线性回归中,相关系数实际上是判定系数的平方根。相关系数取值范围在卜之间。判定系数取值范围在[0, 1]之间。
4. 在什么条件下用正态分布近似计算二项分布的概率效果比较好?
【答案】当样本量n 越来越大时,二项分布越来越近似服从正态分布。这时,二项随机变量的直方图的形状接近正态分布的图形形状。即使对于小样本,当然相当好,此时随机变量X 的分布是相对于其平均值大于或等于5时,近似的效果就相当好。
5. 简述估计量的无偏性,有效性和一致性。
【答案】(1)无偏性 若估计量
的数学期望等于未知参数
则称为的无偏估计量。估计量的值不一定就是的真值,因为它是 一个随机变量,若
是的无偏估计量,则尽管的值随样本的不同而变化,但平均来说它会等于的真值。 (2)有效性
设
(3)—致性(相合性) 如果依概率收敛于则称
第 3 页,共 40 页
时,二项分布的正态近似仍
和
都
对称的。当p 趋于0或1时,二项分
布将呈现出偏态,但当n 变大时,这种偏斜就会消失。一般来说, 只要当n 大到使
即:
与
且至少对于某一个
即
都是的无偏估计量,若对于任意
上式中的不等号成立,则称有
较
有效。
有
是的一致估计量。
6. 方差分析中的基本假定。
【答案】方差分析中有三个基本假定:(1)每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)各个总体的方差立的。
必须
相同。也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;(3)观测值是独
二、计算题
7. 某家商场为了了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。其学历表示为:1: 初中,2:高中或中专,3:大专,4:本科及以上。调查结果如表1所示。
表
1
(1)上表中的数据属于什么类型? (2)制作一张频数分布表。
(3)绘制一张条形图,反映顾客的学历分布。 【答案】(1)表中的数据属于顺序数据。 (2)制作频数分布表,如表2所示。
表2 频数分布表
(3)绘制条形图,如图1所示。
第 4 页,共 40 页
相关内容
相关标签