2017年黑龙江大学数学科学学院432统计学[专业硕士]考研导师圈点必考题汇编
● 摘要
一、简答题
1. 考虑总体参数的估计量,简述无偏估计量与最小方差无偏估计量的定义。
【答案】①无偏性(unbiasedness )是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为所选择的估计量为如果则称为的无偏估计量。对于待估参数,不同的样本值就会得到不同的估计值。这样,要确定一个估计量的好坏,就不能仅仅依据某次抽样的结果来衡量,而必须由大量抽样的结果来 衡量。对此,一个自然而基本的衡量标准是要求估计量无系统偏差。尽管在一次抽样中得到的估计值不一定恰好 等于待估参数的真值,但在大量重复抽样时,所得到的估计值平均起来应与待估参数的真值相同,即希望估计量 的均值应等于未知参数的真值,这就是无偏性的要求。 ②最小方差无偏估计是在无偏估计类中使均方误差达到最小的估计量,即在均方误差
是的一个无偏估计量,都有
则称是的一致最小方差无偏估计。
2. 什么是同度量因素?同度量因素在编制加权综合指数中有什么作用?
【答案】在统计学中,一般把相乘以后使得不能直接相加的指标过渡到可以直接相加的指标的那个因素,称为同度量因素或同度量系数。
在编制指数时,对于不能直接相加的指标,可通过同度量因素把指标过渡到具有可加性。
3. 中心极限定理。
【答案】设随机变量
令
则
也就是说,当n 趋于无穷大时,的分布趋向于标准正态分布 相互独立(S 卩,对任意给定的相互独立)且服从同一分布,该分布存在有限的期望和方
差最小意义下的最优估计,它是在应用中人们希望寻求的一种估计量。设若对于的任一方差存在的无偏估计量
4. 解释多重判定系数和调整的多重判定系数的含义和作用。
【答案】(1)多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回
归方程拟合程度的一个统计量,反映了在因变量y 的变差中被估计的回归方程所解释的比例,其计算公式为
(2)调整的多重判定系数考虑了样本量(n )和模型中自变量的个数(k )的影响,这就使得
的值永远小于
而且的值不会由于模型中自变量个数的增加而越来越接近1,
其计算公式为
5. 什么是抽样平均误差?影响抽样平均误差的因素有哪些?
【答案】抽样平均误差是指抽样平均数(或抽样成数)的标准差。它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。
影响抽样平均误差的因素有四个:
(1)样本单位数目。在其他条件不变的情况下,抽样数目越多,抽样误差越少;抽样数目越少,抽样误差越大。当时,就是全面调查,抽样误差此时为零。
(2)总体标志变动程度。其他条件不变的情况下,总体标志变异程度越大,抽样误差越大;总体变异程度越小,抽样误差越小。
(3)抽样方法。一般讲,不重复抽样的抽样误差要小于重复抽样的抽样误差。当n 相对N 非常小时,两种抽样方法的抽样误差相差很小,可忽略不计。
(4)抽样组织方式。采用不同的抽样组织方式,也会有不同的抽样误差。一般讲分层抽样的抽样误差较小,而整群抽样的抽样误差较大。
6. 简述季节指数的计算步骤。
【答案】以移动平均趋势剔除法为例,计算季节指数的基本步骤为:
,(1)计算移动平均值(如果是季度数据采用4项移动平均,月份数据则采用12项移动平均)
并将其结果进行“中心化”处理,也就是将移动平均的结果再进行一次2项的移动平均,即得出“中心化移动平均值”
(2)计算移动平均的比值,也称为季节比率,即将序列的各观察值除以相应的中心化移动平均值,然后再计算出各比值的季度(或月份)平均值。
(3)季节指数调整。由于各季节指数的平均数应等于1或100%,若根据第2步计算的季节比率的平均值不等于1时,则需要进行调整。具体方法是:将第(2)步计算的每个季节比率的平均值除以它们的总平均值。
7. 多元回归分析中为什么需要使用修正的判定系数(可决系数)来比较方程的拟合效果?是如何计算的?
【答案】在多元线性回归分析中,常用修正的判定系数,而不用多重判定系数来衡量估计模
型对样本观测值的拟合优度。这是由于多重判定系数
随着样本解释变量个数的增加
来越高(即的值越
是解释变量个数的增函数)。也就是说,在样本容量不变的情况,在模型中增加新
的解释变量不会改变总离差平方和,但可能增加回归平方和,减少残差平方和,从而可能改变模型的解释功能。因此在多元线性回归模型之间比较拟和优度时,
调整。而修正判定系数
归模型方面要优于多重判定系数修正判定系数的计算公式为
8. 下列调查问卷中的提问都有问题,请修改。
(1)您和您爱人是否对现有住房满意?
(2)您最近一次是几点上班的?
(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗?
【答案】(1)您对现有住房满意吗?您爱人呢?
(2)您最近一次的工作是几点上班?
(3)您认为明光牛奶的口味纯正吗?
9. 简述描述离散程度的统计量和适用类型。
【答案】衡量数据离散程度的统计量主要有极差、平均差、方差和标准差,其中最常用的是方差和标准差。
(1)极差是指一组数据的最大值与最小值之差。用R 表示,其计算公式为:
极差是描述数据离散程度的最简单测度值,计算简单,易于理答,但它容易受极端值的影响。由于极差只是利用了一组数据两端的信息,不能反映出中间数据的分散状况,因而不能准确描述出数据的分散程度。
(2)平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之说明数据的离散程度小。为了避免离差之和等于零而无法计算平均差这一问题,平均差在计算时对离差取了绝对值,以离差的绝对值来表示总离差,这就给计算带来了不便,因而在实际中应用较少。但平均差的实际意义比较清楚,容易理答。
(3)方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号, 然后再进行平均,方差开方后即得到标准差,方差或标准差能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。与方差不同的是,标准差是具有量纲的,它与变量值的计量单位相同,其实际意义要比方差清楚。因此,在对实际问题进行分析时更多地使用标准差。
不是一个合适的指标,需加以其值不会随着解释变量个数k 的増加而增加,因此在用于估计多元回